Evaluating generalizability of artificial intelligence models for molecular datasets

概化理论 人工智能 计算机科学 机器学习 数据科学 心理学 发展心理学
作者
Yasha Ektefaie,Andrew Shen,Daria Bykova,Maximillian G. Marin,Marinka Żitnik,Maha Farhat
标识
DOI:10.1101/2024.02.25.581982
摘要

Deep learning has made rapid advances in modeling molecular sequencing data. Despite achieving high performance on benchmarks, it remains unclear to what extent deep learning models learn general principles and generalize to previously unseen sequences. Benchmarks traditionally interrogate model generalizability by generating metadata based (MB) or sequence-similarity based (SB) train and test splits of input data before assessing model performance. Here, we show that this approach mischaracterizes model generalizability by failing to consider the full spectrum of cross-split overlap,
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
懦弱的硬币完成签到,获得积分10
刚刚
科研通AI5应助哒哒猪采纳,获得10
刚刚
刚刚
大喜发布了新的文献求助10
1秒前
tsn完成签到 ,获得积分10
1秒前
2秒前
2秒前
3秒前
科研小白发布了新的文献求助10
3秒前
4秒前
4秒前
彭洪泽发布了新的文献求助10
5秒前
5秒前
5秒前
独特的尔风完成签到,获得积分10
5秒前
小蘑菇应助luo0306采纳,获得10
6秒前
xzy完成签到,获得积分10
6秒前
甜甜的大米完成签到,获得积分10
6秒前
6秒前
偌佟发布了新的文献求助10
7秒前
DJH发布了新的文献求助10
7秒前
无尘发布了新的文献求助10
7秒前
无花果应助不羡采纳,获得10
7秒前
7秒前
7秒前
8秒前
夜阑风静完成签到,获得积分20
8秒前
歪歪扣叉完成签到,获得积分10
9秒前
9秒前
彭洪泽完成签到,获得积分10
9秒前
10秒前
10秒前
lyj发布了新的文献求助10
10秒前
万能图书馆应助夜阑风静采纳,获得10
11秒前
桃子关注了科研通微信公众号
11秒前
nanami完成签到 ,获得积分10
12秒前
13秒前
13秒前
13秒前
YJL完成签到,获得积分20
13秒前
高分求助中
All the Birds of the World 3000
IZELTABART TAPATANSINE 500
GNSS Applications in Earth and Space Observations 300
Handbook of Laboratory Animal Science 300
Not Equal : Towards an International Law of Finance 260
A method for calculating the flow in a centrifugal impeller when entropy gradients are present 240
Dynamics in Chinese Digital Commons: Law, Technology, and Governance 220
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3719155
求助须知:如何正确求助?哪些是违规求助? 3265747
关于积分的说明 9940479
捐赠科研通 2979449
什么是DOI,文献DOI怎么找? 1634075
邀请新用户注册赠送积分活动 775591
科研通“疑难数据库(出版商)”最低求助积分说明 745708