Accurate circular consensus long-read sequencing improves variant detection and assembly of a human genome

康蒂格 索引 杂交基因组组装 人类基因组 基因组 计算生物学 顺序装配 DNA测序 生物 深度测序 参考基因组 全基因组测序 遗传学 基因 单核苷酸多态性 基因型 转录组 基因表达
作者
Aaron M. Wenger,Paul Peluso,William J. Rowell,Pi-Chuan Chang,Richard Hall,Gregory T. Concepcion,Jana Ebler,Arkarachai Fungtammasan,Alexey Kolesnikov,Nathan D. Olson,Armin Töpfer,Michael Alonge,Medhat Mahmoud,Yufeng Qian,Chen-Shan Chin,Adam M. Phillippy,Michael C. Schatz,Gene Myers,Mark A. DePristo,Jue Ruan,Tobias Marschall,Fritz J. Sedlazeck,Justin M. Zook,Heng Li,Sergey Koren,Andrew Carroll,David R. Rank,Michael W. Hunkapiller
出处
期刊:Nature Biotechnology [Springer Nature]
卷期号:37 (10): 1155-1162 被引量:1194
标识
DOI:10.1038/s41587-019-0217-9
摘要

The DNA sequencing technologies in use today produce either highly accurate short reads or less-accurate long reads. We report the optimization of circular consensus sequencing (CCS) to improve the accuracy of single-molecule real-time (SMRT) sequencing (PacBio) and generate highly accurate (99.8%) long high-fidelity (HiFi) reads with an average length of 13.5 kilobases (kb). We applied our approach to sequence the well-characterized human HG002/NA24385 genome and obtained precision and recall rates of at least 99.91% for single-nucleotide variants (SNVs), 95.98% for insertions and deletions <50 bp (indels) and 95.99% for structural variants. Our CCS method matches or exceeds the ability of short-read sequencing to detect small variants and structural variants. We estimate that 2,434 discordances are correctable mistakes in the ‘genome in a bottle’ (GIAB) benchmark set. Nearly all (99.64%) variants can be phased into haplotypes, further improving variant detection. De novo genome assembly using CCS reads alone produced a contiguous and accurate genome with a contig N50 of >15 megabases (Mb) and concordance of 99.997%, substantially outperforming assembly with less-accurate long reads. High-fidelity reads improve variant detection and genome assembly on the PacBio platform.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
珂珂发布了新的文献求助10
刚刚
LLL完成签到,获得积分10
2秒前
121231完成签到,获得积分10
3秒前
平常亦凝发布了新的文献求助10
3秒前
凤凤发布了新的文献求助10
4秒前
花生王子完成签到 ,获得积分10
4秒前
yeye发布了新的文献求助10
4秒前
6秒前
HEIKU应助仁爱的雁芙采纳,获得20
6秒前
doctorbin完成签到 ,获得积分10
8秒前
8秒前
10秒前
10秒前
alex发布了新的文献求助10
11秒前
13秒前
Yxy完成签到,获得积分10
13秒前
冷傲的迎南完成签到 ,获得积分10
14秒前
丘比特应助坚定白风采纳,获得10
14秒前
李健应助平常亦凝采纳,获得10
14秒前
15秒前
weihe完成签到,获得积分10
15秒前
寒冷鸭子完成签到,获得积分10
15秒前
拉稀摆带发布了新的文献求助10
16秒前
我是老大应助珂珂采纳,获得10
16秒前
Creamai发布了新的文献求助10
16秒前
香蕉觅云应助独特的易形采纳,获得10
17秒前
小溜溜完成签到 ,获得积分10
18秒前
wanci应助超级美采纳,获得10
18秒前
PEI完成签到,获得积分10
18秒前
alex完成签到,获得积分10
19秒前
嘟嘟发布了新的文献求助10
20秒前
Dr.Liujun完成签到,获得积分10
20秒前
21秒前
笃定发布了新的文献求助10
22秒前
暴躁的初夏完成签到 ,获得积分10
23秒前
超人爱吃菠菜完成签到,获得积分10
23秒前
思源应助默默毛豆采纳,获得10
24秒前
zbg发布了新的文献求助10
24秒前
25秒前
感动的紊发布了新的文献求助10
26秒前
高分求助中
Sustainability in Tides Chemistry 2800
Kinetics of the Esterification Between 2-[(4-hydroxybutoxy)carbonyl] Benzoic Acid with 1,4-Butanediol: Tetrabutyl Orthotitanate as Catalyst 1000
The Young builders of New china : the visit of the delegation of the WFDY to the Chinese People's Republic 1000
Rechtsphilosophie 1000
Bayesian Models of Cognition:Reverse Engineering the Mind 888
Handbook of Qualitative Cross-Cultural Research Methods 600
Very-high-order BVD Schemes Using β-variable THINC Method 568
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3137308
求助须知:如何正确求助?哪些是违规求助? 2788393
关于积分的说明 7786079
捐赠科研通 2444547
什么是DOI,文献DOI怎么找? 1299936
科研通“疑难数据库(出版商)”最低求助积分说明 625650
版权声明 601023