已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

An Exploration of the Application of Principal Component Analysis in Big Data Processing

主成分分析 降维 计算机科学 数据处理 数据挖掘 大数据 维数之咒 稀疏PCA 数据质量 模式识别(心理学) 信息处理 人工智能 数据库 工程类 公制(单位) 运营管理 神经科学 生物
作者
Guo Li,Yi Qin
出处
期刊:Applied mathematics and nonlinear sciences [De Gruyter]
卷期号:9 (1)
标识
DOI:10.2478/amns-2024-0664
摘要

Abstract With the arrival of the significant data era, efficiently processing large-scale multidimensional data has become challenging. As a powerful data dimensionality reduction tool, Principal Component Analysis (PCA) plays a vital role in big data processing, especially in information extraction and data simplification, showing unique advantages. The research aims to simplify the data processing process and improve the data processing efficiency by PCA method. The research method adopts the basic theory of PCA, the improvement of the weighted principal component analysis algorithm, and standardized and homogenized data processing techniques to process large-scale multidimensional data sets. The results show that the data dimensionality is significantly reduced after using PCA, for example, in the Analysis of the earnings quality of listed companies in the e-commerce industry, the cumulative variance contribution rate of the first four principal components extracted by PCA reaches 81.623%, which effectively removes the primary information of the original data. PCA not only reduces the complexity of the data, but also retains a large amount of crucial information, which is a significant application value for the processing of big data, especially in the fields of data compression and pattern recognition.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
halo1994发布了新的文献求助10
刚刚
1秒前
路路发布了新的文献求助10
1秒前
2秒前
伶俐的背包完成签到,获得积分10
3秒前
Mimi发布了新的文献求助50
3秒前
3秒前
4秒前
小二郎应助jiwoong采纳,获得10
4秒前
啊啦啦完成签到,获得积分10
5秒前
稳重的向松完成签到,获得积分20
5秒前
7秒前
jersey完成签到,获得积分20
8秒前
8秒前
9秒前
谢海亮发布了新的文献求助10
10秒前
周志轩66发布了新的文献求助10
11秒前
多多多多发布了新的文献求助10
12秒前
隐形曼青应助恩佐采纳,获得10
15秒前
16秒前
Xieyusen发布了新的文献求助10
20秒前
舒伯特完成签到 ,获得积分10
21秒前
greentea完成签到,获得积分10
21秒前
ekswai发布了新的文献求助10
21秒前
23秒前
鳗鱼不尤发布了新的文献求助10
25秒前
1123完成签到,获得积分20
26秒前
余凉发布了新的文献求助30
29秒前
30秒前
量子星尘发布了新的文献求助10
31秒前
32秒前
昵称666应助1123采纳,获得10
32秒前
大姿兰卡眼睛完成签到 ,获得积分10
33秒前
33秒前
悟格完成签到,获得积分10
34秒前
君寻完成签到 ,获得积分10
34秒前
可爱的函函应助guang98765采纳,获得10
34秒前
小颖发布了新的文献求助10
35秒前
赘婿应助Mimi采纳,获得10
35秒前
yy发布了新的文献求助10
38秒前
高分求助中
The Mother of All Tableaux Order, Equivalence, and Geometry in the Large-scale Structure of Optimality Theory 2400
Ophthalmic Equipment Market by Devices(surgical: vitreorentinal,IOLs,OVDs,contact lens,RGP lens,backflush,diagnostic&monitoring:OCT,actorefractor,keratometer,tonometer,ophthalmoscpe,OVD), End User,Buying Criteria-Global Forecast to2029 2000
Optimal Transport: A Comprehensive Introduction to Modeling, Analysis, Simulation, Applications 800
Official Methods of Analysis of AOAC INTERNATIONAL 600
ACSM’s Guidelines for Exercise Testing and Prescription, 12th edition 588
A Preliminary Study on Correlation Between Independent Components of Facial Thermal Images and Subjective Assessment of Chronic Stress 500
T/CIET 1202-2025 可吸收再生氧化纤维素止血材料 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 冶金 细胞生物学 免疫学
热门帖子
关注 科研通微信公众号,转发送积分 3956786
求助须知:如何正确求助?哪些是违规求助? 3502880
关于积分的说明 11110500
捐赠科研通 3233866
什么是DOI,文献DOI怎么找? 1787630
邀请新用户注册赠送积分活动 870713
科研通“疑难数据库(出版商)”最低求助积分说明 802172