清晨好,您是今天最早来到科研通的研友!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您科研之路漫漫前行!

Top-k Self-Adaptive Contrast Sequential Pattern Mining

可解释性 判别式 计算机科学 序列(生物学) 树(集合论) 人工智能 数据挖掘 对比度(视觉) 数学 模式识别(心理学) 遗传学 生物 数学分析
作者
Youxi Wu,Wang Yue-hua,Yan Li,Xingquan Zhu,Xindong Wu
出处
期刊:IEEE transactions on cybernetics [Institute of Electrical and Electronics Engineers]
卷期号:52 (11): 11819-11833 被引量:36
标识
DOI:10.1109/tcyb.2021.3082114
摘要

For sequence classification, an important issue is to find discriminative features, where sequential pattern mining (SPM) is often used to find frequent patterns from sequences as features. To improve classification accuracy and pattern interpretability, contrast pattern mining emerges to discover patterns with high-contrast rates between different categories. To date, existing contrast SPM methods face many challenges, including excessive parameter selection and inefficient occurrences counting. To tackle these issues, this article proposes a top- k self-adaptive contrast SPM, which adaptively adjusts the gap constraints to find top- k self-adaptive contrast patterns (SCPs) from positive and negative sequences. One of the key tasks of the mining problem is to calculate the support (the number of occurrences) of a pattern in each sequence. To support efficient counting, we store all occurrences of a pattern in a special array in a Nettree, an extended tree structure with multiple roots and multiple parents. We employ the array to calculate the occurrences of all its superpatterns with one-way scanning to avoid redundant calculation. Meanwhile, because the contrast SPM problem does not satisfy the Apriori property, we propose Zero and Less strategies to prune candidate patterns and a Contrast-first mining strategy to select patterns with the highest contrast rate as the prefix subpattern and calculate the contrast rate of all its superpatterns. Experiments validate the efficiency of the proposed algorithm and show that contrast patterns significantly outperform frequent patterns for sequence classification. The algorithms and datasets can be downloaded from https://github.com/wuc567/Pattern-Mining/tree/master/SCP-Miner.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
送不送书7完成签到 ,获得积分10
19秒前
jlwang完成签到,获得积分10
21秒前
J陆lululu完成签到 ,获得积分10
29秒前
喔喔佳佳L完成签到 ,获得积分10
42秒前
51秒前
凤梨发布了新的文献求助10
55秒前
凤梨完成签到,获得积分10
1分钟前
牛奶拌可乐完成签到 ,获得积分10
1分钟前
秋夜临完成签到,获得积分10
1分钟前
Cole完成签到,获得积分10
1分钟前
zzgpku完成签到,获得积分0
1分钟前
2分钟前
tjyiia发布了新的文献求助10
2分钟前
yoyo完成签到,获得积分10
2分钟前
巫巫巫巫巫完成签到 ,获得积分10
2分钟前
无悔完成签到 ,获得积分10
2分钟前
拓跋雨梅完成签到 ,获得积分0
2分钟前
葫芦芦芦完成签到 ,获得积分10
3分钟前
mf2002mf完成签到 ,获得积分10
3分钟前
3分钟前
zhangxiaoqing完成签到 ,获得积分10
3分钟前
白菜完成签到 ,获得积分10
3分钟前
julia应助白华苍松采纳,获得10
4分钟前
gszy1975完成签到,获得积分10
4分钟前
Z赵完成签到 ,获得积分10
4分钟前
widesky777完成签到 ,获得积分0
4分钟前
科研通AI2S应助白华苍松采纳,获得10
4分钟前
神勇的天问完成签到 ,获得积分10
5分钟前
WILD完成签到 ,获得积分10
5分钟前
5分钟前
阿巴完成签到 ,获得积分10
6分钟前
vbnn完成签到 ,获得积分10
7分钟前
科研通AI2S应助白华苍松采纳,获得10
8分钟前
smile完成签到,获得积分10
8分钟前
负责冰海完成签到 ,获得积分10
8分钟前
theThreeMagi完成签到,获得积分10
8分钟前
马小东应助科研通管家采纳,获得10
9分钟前
谢小盟完成签到 ,获得积分10
9分钟前
poki完成签到 ,获得积分10
10分钟前
11分钟前
高分求助中
Востребованный временем 2500
中央政治學校研究部新政治月刊社出版之《新政治》(第二卷第四期) 1000
Hopemont Capacity Assessment Interview manual and scoring guide 1000
Classics in Total Synthesis IV: New Targets, Strategies, Methods 1000
Mantids of the euro-mediterranean area 600
Principles of Ultraviolet Photoelectron Spectroscopy 500
【港理工学位论文】Telling the tale of health crisis response on social media : an exploration of narrative plot and commenters' co-narration 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 内科学 物理 纳米技术 计算机科学 基因 遗传学 化学工程 复合材料 免疫学 物理化学 细胞生物学 催化作用 病理
热门帖子
关注 科研通微信公众号,转发送积分 3431166
求助须知:如何正确求助?哪些是违规求助? 3029458
关于积分的说明 8933042
捐赠科研通 2717181
什么是DOI,文献DOI怎么找? 1490549
科研通“疑难数据库(出版商)”最低求助积分说明 688884
邀请新用户注册赠送积分活动 684822