i-SISSO: Mutual information-based improved sure independent screening and sparsifying operator algorithm

计算机科学 冗余(工程) 相互信息 算法 独立性(概率论) 相关性(法律) 代表(政治) 组合爆炸 操作员(生物学) 规范(哲学) 数据挖掘 人工智能 数学 基因 统计 操作系统 组合数学 政治 转录因子 生物化学 抑制因子 化学 法学 政治学
作者
Yuqin Xu,Quan Qian
出处
期刊:Engineering Applications of Artificial Intelligence [Elsevier BV]
卷期号:116: 105442-105442 被引量:8
标识
DOI:10.1016/j.engappai.2022.105442
摘要

Symbolic regression is a method to extract quantitative expressions from dataset and has already been applied in different research fields. The sure independence screening and sparsifying operation (SISSO) is a powerful data-driven method widely applied in various fields of material research or other research directions and can handle large candidate descriptor spaces and generate prediction models in the form of equations with high accuracy. However, SISSO is confronted by the combinatorial explosion phenomenon when enumerating each case to decide the sparsing representation with an ensured L0-norm. This study uses the Max-Relevance and Min-Redundancy (mRMR) algorithm to solve the problem arising from the combinatorial explosion in SISSO by reducing the candidate descriptor space before the SO phase and shrinking the possible search space without losing excess information. Experimental results on six different public datasets and 12 predictive targets show that, when compared with SISSO, mutual information based SISSO significantly reduced time consumption and maintained the error of the model close to the model generated by SISSO, demonstrating that the optimal strategy works on it. Hence, the time cost decreases to approximately 11000, and the predictive accuracy remains steady.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
YIWENNN发布了新的文献求助10
1秒前
游一完成签到,获得积分10
1秒前
科研通AI5应助huk采纳,获得10
2秒前
虚拟莫茗完成签到 ,获得积分10
3秒前
刻苦小丸子完成签到,获得积分10
5秒前
5秒前
健壮听露完成签到,获得积分10
5秒前
苗条大叔发布了新的文献求助10
6秒前
6秒前
WK发布了新的文献求助10
8秒前
充电宝应助Muze采纳,获得10
8秒前
8秒前
8秒前
FashionBoy应助婳嬨采纳,获得10
9秒前
心想事成组完成签到,获得积分10
10秒前
JamesPei应助中央戏精学院采纳,获得10
11秒前
11秒前
Lucas应助健壮听露采纳,获得10
11秒前
可爱的函函应助顺心冰岚采纳,获得10
11秒前
背后海亦发布了新的文献求助10
12秒前
14秒前
15秒前
15秒前
15秒前
呱呱大菠萝完成签到,获得积分10
16秒前
小蘑菇应助jjj采纳,获得10
18秒前
努力的混子完成签到,获得积分10
18秒前
蓦然回首发布了新的文献求助10
19秒前
yaya发布了新的文献求助10
19秒前
20秒前
树阴照水完成签到,获得积分10
21秒前
cldg发布了新的文献求助10
23秒前
wuw666完成签到,获得积分10
23秒前
25秒前
Ava应助坏坏的快乐采纳,获得10
25秒前
26秒前
George发布了新的文献求助10
26秒前
沉默凌雪完成签到,获得积分10
26秒前
蓦然回首完成签到,获得积分10
26秒前
Yile发布了新的文献求助10
26秒前
高分求助中
All the Birds of the World 4000
Production Logging: Theoretical and Interpretive Elements 3000
Animal Physiology 2000
Les Mantodea de Guyane Insecta, Polyneoptera 2000
Am Rande der Geschichte : mein Leben in China / Ruth Weiss 1500
CENTRAL BOOKS: A BRIEF HISTORY 1939 TO 1999 by Dave Cope 1000
Machine Learning Methods in Geoscience 1000
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3741065
求助须知:如何正确求助?哪些是违规求助? 3283833
关于积分的说明 10037107
捐赠科研通 3000659
什么是DOI,文献DOI怎么找? 1646647
邀请新用户注册赠送积分活动 783804
科研通“疑难数据库(出版商)”最低求助积分说明 750427