HePPCAT: Probabilistic PCA for Data With Heteroscedastic Noise

异方差 同方差 主成分分析 概率逻辑 维数之咒 噪音(视频) 计算机科学 奇异值分解 数学 计量经济学 人工智能 数据挖掘 数学优化 图像(数学)
作者
David Hong,Kyle Gilman,Laura Balzano,Jeffrey A. Fessler
出处
期刊:IEEE Transactions on Signal Processing [Institute of Electrical and Electronics Engineers]
卷期号:69: 4819-4834 被引量:13
标识
DOI:10.1109/tsp.2021.3104979
摘要

Principal component analysis (PCA) is a classical and ubiquitous method for reducing data dimensionality, but it is suboptimal for heterogeneous data that are increasingly common in modern applications. PCA treats all samples uniformly so degrades when the noise is heteroscedastic across samples, as occurs, e.g., when samples come from sources of heterogeneous quality. This paper develops a probabilistic PCA variant that estimates and accounts for this heterogeneity by incorporating it in the statistical model. Unlike in the homoscedastic setting, the resulting nonconvex optimization problem is not seemingly solved by singular value decomposition. This paper develops a heteroscedastic probabilistic PCA technique (HePPCAT) that uses efficient alternating maximization algorithms to jointly estimate both the underlying factors and the unknown noise variances. Simulation experiments illustrate the comparative speed of the algorithms, the benefit of accounting for heteroscedasticity, and the seemingly favorable optimization landscape of this problem. Real data experiments on environmental air quality data show that HePPCAT can give a better PCA estimate than techniques that do not account for heteroscedasticity.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
刚刚
zixiao完成签到,获得积分20
刚刚
SciGPT应助liujiale采纳,获得10
1秒前
雲霁完成签到,获得积分10
2秒前
田様应助tmw采纳,获得10
2秒前
2秒前
REDKIM发布了新的文献求助10
2秒前
嘟哒哒发布了新的文献求助10
3秒前
wbj完成签到,获得积分10
3秒前
3秒前
yk完成签到,获得积分10
3秒前
华仔应助夏侯初采纳,获得10
3秒前
3秒前
科研通AI6.1应助你好采纳,获得10
4秒前
5秒前
彭于晏应助CJW采纳,获得10
6秒前
Dr.Tang发布了新的文献求助10
6秒前
acaismoon完成签到,获得积分10
7秒前
鱼在一边完成签到,获得积分10
7秒前
7秒前
7秒前
小马甲应助MoO采纳,获得10
7秒前
8秒前
You完成签到,获得积分10
8秒前
无极微光应助勤奋惜寒采纳,获得20
8秒前
小胡完成签到,获得积分20
9秒前
9秒前
洁净的嘉熙完成签到,获得积分10
9秒前
10秒前
威士忌www发布了新的文献求助10
11秒前
ZD完成签到,获得积分10
11秒前
11秒前
JWD完成签到 ,获得积分10
11秒前
科研通AI6.2应助小胡采纳,获得10
12秒前
科研通AI6.2应助止观采纳,获得10
13秒前
13秒前
安静沛春发布了新的文献求助10
13秒前
汉堡包应助枭枭采纳,获得10
14秒前
14秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Comprehensive Methanol Science: Production, Applications, and Emerging Technologies 4000
Kinesiophobia : a new view of chronic pain behavior 2000
Comprehensive Methanol Science: Production, Applications, and Emerging Technologies Volume 2: Methanol Production from Fossil Fuels and Renewable Resources 1000
Comprehensive Methanol Science: Production, Applications, and Emerging Technologies Volume 1: Methanol Characteristics and Environmental Challenges in Direct Methane Conversion 1000
The Social Psychology of Citizenship 1000
Research for Social Workers 1000
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 计算机科学 有机化学 物理 生物化学 纳米技术 复合材料 内科学 化学工程 人工智能 催化作用 遗传学 数学 基因 量子力学 物理化学
热门帖子
关注 科研通微信公众号,转发送积分 5918027
求助须知:如何正确求助?哪些是违规求助? 6881825
关于积分的说明 15805341
捐赠科研通 5044311
什么是DOI,文献DOI怎么找? 2714668
邀请新用户注册赠送积分活动 1667328
关于科研通互助平台的介绍 1605942