Robust principal component analysis: A factorization-based approach with linear complexity

稳健主成分分析 奇异值分解 计算机科学 可扩展性 矩阵分解 秩(图论) 主成分分析 稀疏矩阵 因式分解 稳健性(进化) 算法 计算复杂性理论 矩阵完成 人工智能 数学 组合数学 物理 特征向量 高斯分布 基因 数据库 化学 量子力学 生物化学
作者
Chong Peng,Yongyong Chen,Zhao Kang,Chenglizhao Chen,Qiang Cheng
出处
期刊:Information Sciences [Elsevier]
卷期号:513: 581-599 被引量:63
标识
DOI:10.1016/j.ins.2019.09.074
摘要

Low-rankness has been widely observed in real world data and there is often a need to recover low-rank matrices in many machine learning and data mining problems. Robust principal component analysis (RPCA) has been used for such problems by separating the data into a low-rank and a sparse part. The convex approach to RPCA has been well studied due to its elegant properties in theory and many extensions have been developed. However, the state-of-the-art algorithms for the convex approach and their extensions are usually expensive in complexity due to the need for solving singular value decomposition (SVD) of large matrices. In this paper, we propose a novel RPCA model based on matrix tri-factorization, which only needs the computation of SVDs for very small matrices. Thus, this approach reduces the complexity of RPCA to be linear and makes it fully scalable. It also overcomes the drawback of the state-of-the-art scalable approach such as AltProj, which requires the precise knowledge of the true rank of the low-rank component. As a result, our method is about 4 times faster than AltProj. Our method can be used as a light-weight, scalable tool for RPCA in the absence of the precise value of the true rank.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
七里香完成签到 ,获得积分10
刚刚
handsomecat关注了科研通微信公众号
刚刚
细心映寒完成签到 ,获得积分10
刚刚
刚刚
fff完成签到,获得积分10
刚刚
领导范儿应助MJQ采纳,获得100
刚刚
1秒前
Owen应助世界尽头采纳,获得10
1秒前
echolan发布了新的文献求助10
2秒前
SID完成签到,获得积分10
2秒前
中九完成签到 ,获得积分10
2秒前
Rrr完成签到,获得积分10
2秒前
hehuan0520完成签到,获得积分10
2秒前
2秒前
打打应助chinning采纳,获得10
2秒前
桐桐应助wangyanyan采纳,获得10
3秒前
3秒前
zzznznnn发布了新的文献求助10
3秒前
jogrgr发布了新的文献求助10
4秒前
sun发布了新的文献求助10
4秒前
布鲁鲁发布了新的文献求助10
4秒前
自信晟睿完成签到,获得积分10
4秒前
酷波er应助哒哒采纳,获得10
5秒前
5秒前
沉默乐荷完成签到,获得积分10
5秒前
rstorz应助皮尤尤采纳,获得10
5秒前
sweetbearm应助小离采纳,获得10
5秒前
何青岚关注了科研通微信公众号
6秒前
doudou完成签到,获得积分20
6秒前
李健的小迷弟应助潦草采纳,获得10
6秒前
7秒前
7秒前
7秒前
柒八染完成签到,获得积分10
7秒前
wsljc134完成签到,获得积分20
7秒前
8秒前
善良香岚完成签到,获得积分20
8秒前
8秒前
8秒前
123发布了新的文献求助10
8秒前
高分求助中
Continuum Thermodynamics and Material Modelling 3000
Production Logging: Theoretical and Interpretive Elements 2700
Social media impact on athlete mental health: #RealityCheck 1020
Ensartinib (Ensacove) for Non-Small Cell Lung Cancer 1000
Unseen Mendieta: The Unpublished Works of Ana Mendieta 1000
Bacterial collagenases and their clinical applications 800
El viaje de una vida: Memorias de María Lecea 800
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 量子力学 光电子学 冶金
热门帖子
关注 科研通微信公众号,转发送积分 3527699
求助须知:如何正确求助?哪些是违规求助? 3107752
关于积分的说明 9286499
捐赠科研通 2805513
什么是DOI,文献DOI怎么找? 1539954
邀请新用户注册赠送积分活动 716878
科研通“疑难数据库(出版商)”最低求助积分说明 709759