Exploring the limit of using a deep neural network on pileup data for germline variant calling

生殖系 计算机科学 标杆管理 深度测序 瓶颈 人工智能 计算生物学 开源 深度学习 基因组 数据挖掘 生物 遗传学 软件 操作系统 基因 业务 嵌入式系统 营销
作者
Ruibang Luo,Chak-Lim Wong,Yat-Sing Wong,Chi-Ian Tang,Chi-Man Liu,Chi-Ming Leung,Tak‐Wah Lam
出处
期刊:Nature Machine Intelligence [Nature Portfolio]
卷期号:2 (4): 220-227 被引量:112
标识
DOI:10.1038/s42256-020-0167-4
摘要

Single-molecule sequencing technologies have emerged in recent years and revolutionized structural variant calling, complex genome assembly and epigenetic mark detection. However, the lack of a highly accurate small variant caller has limited these technologies from being more widely used. Here, we present Clair, the successor to Clairvoyante, a program for fast and accurate germline small variant calling, using single-molecule sequencing data. For Oxford Nanopore Technology data, Clair achieves better precision, recall and speed than several competing programs, including Clairvoyante, Longshot and Medaka. Through studying the missed variants and benchmarking intentionally overfitted models, we found that Clair may be approaching the limit of possible accuracy for germline small variant calling using pileup data and deep neural networks. Clair requires only a conventional central processing unit (CPU) for variant calling and is an open-source project available at https://github.com/HKU-BAL/Clair. A lack of accurate and efficient variant calling methods has held back single-molecule sequencing technologies from clinical applications. The authors present a deep-learning method for fast and accurate germline small variant calling, using single-molecule sequencing data.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
1秒前
小蘑菇应助pct采纳,获得10
1秒前
1秒前
3秒前
摸鱼鱼发布了新的文献求助10
4秒前
Stardust完成签到,获得积分10
4秒前
4秒前
5秒前
5秒前
奇奇吃面完成签到,获得积分10
5秒前
情怀应助Yipeng98采纳,获得10
6秒前
傻瓜子完成签到,获得积分10
7秒前
三三完成签到 ,获得积分10
7秒前
8秒前
轻风发布了新的文献求助10
8秒前
9秒前
9秒前
10秒前
Lucas应助端庄的以寒采纳,获得10
10秒前
鹿茸与共发布了新的文献求助10
10秒前
10秒前
传奇3应助NOEYEDEER采纳,获得10
11秒前
orixero应助科研通管家采纳,获得10
11秒前
丘比特应助科研通管家采纳,获得10
11秒前
大模型应助科研通管家采纳,获得10
11秒前
科研通AI2S应助科研通管家采纳,获得10
12秒前
12秒前
英俊的铭应助科研通管家采纳,获得10
12秒前
12秒前
搜集达人应助优美的唇彩采纳,获得10
12秒前
13秒前
aich发布了新的文献求助10
13秒前
鹅小小发布了新的文献求助10
13秒前
13秒前
14秒前
15秒前
16秒前
三寒鸦发布了新的文献求助10
16秒前
16秒前
高分求助中
【此为提示信息,请勿应助】请按要求发布求助,避免被关 20000
All the Birds of the World 4000
Production Logging: Theoretical and Interpretive Elements 3000
Musculoskeletal Pain - Market Insight, Epidemiology And Market Forecast - 2034 2000
Am Rande der Geschichte : mein Leben in China / Ruth Weiss 1500
CENTRAL BOOKS: A BRIEF HISTORY 1939 TO 1999 by Dave Cope 1000
Density Functional Theory: A Practical Introduction, 2nd Edition 840
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3749152
求助须知:如何正确求助?哪些是违规求助? 3292411
关于积分的说明 10076547
捐赠科研通 3007880
什么是DOI,文献DOI怎么找? 1651897
邀请新用户注册赠送积分活动 786875
科研通“疑难数据库(出版商)”最低求助积分说明 751861