Detecting group concept drift from multiple data streams

概念漂移 数据流挖掘 数据流 计算机科学 统计的 数据挖掘 流式数据 检验统计量 溪流 钥匙(锁) 构造(python库) 试验数据 统计假设检验 人工智能 统计 数学 计算机网络 电信 计算机安全 程序设计语言
作者
Hang Yu,Weixu Liu,Jie Lu,Yonggang Wen,Xiangfeng Luo,Guangquan Zhang
出处
期刊:Pattern Recognition [Elsevier]
卷期号:134: 109113-109113 被引量:10
标识
DOI:10.1016/j.patcog.2022.109113
摘要

Concept drift may lead to a sharp downturn in the performance of streaming in data-based algorithms, caused by unforeseeable changes in the underlying distribution of data. In this paper, we are mainly concerned with concept drift across multiple data streams, and in situations where the drift of each data stream cannot be detected in time, due to slight underlying distribution drifts. We call this group concept drift. When compared to the detection of concept drift for a single data stream, the challenges of detecting group concept drift arise from three aspects: first, the training data become more complex; second, the underlying distribution becomes more complex; and third, the correlations between data streams become more complex. To address these challenges, the key idea of our method is to construct a distribution free test statistic, free from any underlying distribution in multiple data streams. Then, for streaming data, we design an online learning algorithm to obtain this test statistic, thereby determining the concept drift caused by the hypothesis test. The experiment evaluations with both synthetic and real-world datasets prove that our method can accurately detect concept drift from multiple data streams.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
刚刚
刚刚
哈基米完成签到 ,获得积分10
1秒前
1秒前
ATrueHero完成签到,获得积分20
1秒前
1秒前
ginchuodan发布了新的文献求助10
1秒前
JamesPei应助zpctx采纳,获得10
1秒前
keanu发布了新的文献求助10
1秒前
AD钙钙钙发布了新的文献求助10
1秒前
愉快数据线完成签到 ,获得积分10
1秒前
苏蔚完成签到,获得积分10
1秒前
张弛华完成签到,获得积分10
2秒前
Jiang发布了新的文献求助10
2秒前
psy发布了新的文献求助10
2秒前
2秒前
三十三天完成签到 ,获得积分10
3秒前
笑点低的泥猴桃完成签到,获得积分10
3秒前
寻找完成签到,获得积分10
3秒前
3秒前
MaoTing完成签到,获得积分10
3秒前
小六子完成签到,获得积分10
3秒前
3秒前
小发发完成签到,获得积分10
3秒前
4秒前
大模型应助坦率的大侠采纳,获得10
4秒前
4秒前
强健的梦蕊完成签到,获得积分10
4秒前
weiww关注了科研通微信公众号
4秒前
5秒前
5秒前
5秒前
健康的海完成签到,获得积分10
5秒前
Shawn发布了新的文献求助10
5秒前
杨明智完成签到 ,获得积分10
5秒前
5秒前
冬瓜熊发布了新的文献求助10
5秒前
脑洞疼应助狂野的斑马采纳,获得10
5秒前
6秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Handbook of pharmaceutical excipients, Ninth edition 5000
Aerospace Standards Index - 2026 ASIN2026 2000
Digital Twins of Advanced Materials Processing 2000
Social Cognition: Understanding People and Events 1200
Polymorphism and polytypism in crystals 1000
Signals, Systems, and Signal Processing 610
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 纳米技术 有机化学 物理 生物化学 化学工程 计算机科学 复合材料 内科学 催化作用 光电子学 物理化学 电极 冶金 遗传学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 6038095
求助须知:如何正确求助?哪些是违规求助? 7764679
关于积分的说明 16221689
捐赠科研通 5184251
什么是DOI,文献DOI怎么找? 2774457
邀请新用户注册赠送积分活动 1757359
关于科研通互助平台的介绍 1641651