Efficient posterior sampling for high-dimensional imbalanced logistic regression

马尔科夫蒙特卡洛 数学 分段 混合(物理) 近似贝叶斯计算 贝叶斯概率 算法 马尔可夫链 吉布斯抽样 计算 蒙特卡罗方法 采样(信号处理) 后验概率 计算机科学 数据挖掘 人工智能 统计 数学分析 物理 滤波器(信号处理) 量子力学 推论 计算机视觉
作者
Deborshee Sen,Matthias Sachs,Jianfeng Lu,David B. Dunson
出处
期刊:Biometrika [Oxford University Press]
卷期号:107 (4): 1005-1012 被引量:9
标识
DOI:10.1093/biomet/asaa035
摘要

Classification with high-dimensional data is of widespread interest and often involves dealing with imbalanced data. Bayesian classification approaches are hampered by the fact that current Markov chain Monte Carlo algorithms for posterior computation become inefficient as the number [Formula: see text] of predictors or the number [Formula: see text] of subjects to classify gets large, because of the increasing computational time per step and worsening mixing rates. One strategy is to employ a gradient-based sampler to improve mixing while using data subsamples to reduce the per-step computational complexity. However, the usual subsampling breaks down when applied to imbalanced data. Instead, we generalize piecewise-deterministic Markov chain Monte Carlo algorithms to include importance-weighted and mini-batch subsampling. These maintain the correct stationary distribution with arbitrarily small subsamples and substantially outperform current competitors. We provide theoretical support for the proposed approach and demonstrate its performance gains in simulated data examples and an application to cancer data.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
1秒前
2秒前
2秒前
SGQT完成签到,获得积分10
2秒前
3秒前
喜笑颜开发布了新的文献求助10
4秒前
FY完成签到,获得积分10
4秒前
才疏学浅完成签到 ,获得积分10
4秒前
赵歌洁发布了新的文献求助10
4秒前
苯酮酸钠完成签到,获得积分10
5秒前
小蘑菇应助坐看云起时采纳,获得10
5秒前
kuyedieky发布了新的文献求助10
5秒前
yuhui完成签到,获得积分10
5秒前
5秒前
Frank完成签到,获得积分10
6秒前
zizi完成签到,获得积分10
6秒前
tomato发布了新的文献求助10
7秒前
7秒前
7秒前
8秒前
MJMarker发布了新的文献求助10
9秒前
鳗鱼香萱完成签到,获得积分20
9秒前
无花果应助王哒哒采纳,获得10
9秒前
KangL完成签到,获得积分10
10秒前
yu发布了新的文献求助10
10秒前
10秒前
gu关闭了gu文献求助
11秒前
小蘑菇应助枫叶采纳,获得10
11秒前
爆米花应助明天见采纳,获得10
12秒前
12秒前
12秒前
冯广发布了新的文献求助10
12秒前
kin发布了新的文献求助10
12秒前
微尘应助风语过采纳,获得10
12秒前
坤123发布了新的文献求助10
13秒前
13秒前
15秒前
15秒前
木子发布了新的文献求助10
15秒前
高分求助中
The Wiley Blackwell Companion to Diachronic and Historical Linguistics 3000
HANDBOOK OF CHEMISTRY AND PHYSICS 106th edition 1000
ASPEN Adult Nutrition Support Core Curriculum, Fourth Edition 1000
Decentring Leadership 800
Signals, Systems, and Signal Processing 610
脑电大模型与情感脑机接口研究--郑伟龙 500
Genera Orchidacearum Volume 4: Epidendroideae, Part 1 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6288580
求助须知:如何正确求助?哪些是违规求助? 8107144
关于积分的说明 16959628
捐赠科研通 5353464
什么是DOI,文献DOI怎么找? 2844772
邀请新用户注册赠送积分活动 1821993
关于科研通互助平台的介绍 1678156