Multiplex de Bruijn graphs enable genome assembly from long, high-fidelity reads

德布鲁因图 德布鲁恩序列 k-mer公司 基因组 计算生物学 生物 顺序装配 计算机科学 算法 遗传学 组合数学 数学 基因 基因表达 转录组
作者
Anton Bankevich,Andrey V. Bzikadze,Mikhail Kolmogorov,Dmitry Antipov,Pavel A. Pevzner
出处
期刊:Nature Biotechnology [Nature Portfolio]
卷期号:40 (7): 1075-1081 被引量:102
标识
DOI:10.1038/s41587-022-01220-6
摘要

Although most existing genome assemblers are based on de Bruijn graphs, the construction of these graphs for large genomes and large k-mer sizes has remained elusive. This algorithmic challenge has become particularly pressing with the emergence of long, high-fidelity (HiFi) reads that have been recently used to generate a semi-manual telomere-to-telomere assembly of the human genome. To enable automated assemblies of long, HiFi reads, we present the La Jolla Assembler (LJA), a fast algorithm using the Bloom filter, sparse de Bruijn graphs and disjointig generation. LJA reduces the error rate in HiFi reads by three orders of magnitude, constructs the de Bruijn graph for large genomes and large k-mer sizes and transforms it into a multiplex de Bruijn graph with varying k-mer sizes. Compared to state-of-the-art assemblers, our algorithm not only achieves five-fold fewer misassemblies but also generates more contiguous assemblies. We demonstrate the utility of LJA via the automated assembly of a human genome that completely assembled six chromosomes.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
gstaihn完成签到,获得积分10
刚刚
hhhhxxxx完成签到,获得积分10
2秒前
猪仔5号完成签到 ,获得积分10
2秒前
敏感的文龙完成签到,获得积分10
3秒前
研友_VZG7GZ应助yyy采纳,获得10
4秒前
我本人lrx完成签到 ,获得积分10
4秒前
不是省油的灯完成签到,获得积分10
5秒前
7秒前
tjfwg完成签到,获得积分10
7秒前
luoziwuhui完成签到,获得积分10
7秒前
冬烜完成签到 ,获得积分10
7秒前
7秒前
简单的觅儿完成签到 ,获得积分10
8秒前
甘特完成签到 ,获得积分10
10秒前
晚风的柔风6完成签到 ,获得积分10
10秒前
深情的羞花完成签到 ,获得积分10
10秒前
fei菲飞完成签到,获得积分10
12秒前
一只蓉馍馍完成签到 ,获得积分10
14秒前
莴苣完成签到,获得积分10
17秒前
书南完成签到 ,获得积分10
18秒前
陈永伟完成签到,获得积分10
18秒前
喻雷发布了新的文献求助10
20秒前
Owen应助呆萌的毛衣采纳,获得10
20秒前
生信小菜鸟完成签到 ,获得积分10
20秒前
FashionBoy应助好好学习采纳,获得30
20秒前
沉默寄凡完成签到,获得积分10
21秒前
21秒前
完美世界应助标致的大碗采纳,获得10
21秒前
lifeilong111完成签到,获得积分10
22秒前
polarisier完成签到,获得积分10
22秒前
沙克几十块完成签到,获得积分10
23秒前
23秒前
酒酿是也发布了新的文献求助10
24秒前
在水一方应助sdfwsdfsd采纳,获得10
26秒前
quzhenzxxx完成签到 ,获得积分10
26秒前
科研通AI6.1应助bono采纳,获得30
27秒前
忧心的涵菡应助勤恳雅莉采纳,获得10
27秒前
辞镜ing完成签到 ,获得积分10
27秒前
28秒前
清鸢发布了新的文献求助10
28秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Applied Min-Max Approach to Missile Guidance and Control 5000
Metallurgy at high pressures and high temperatures 2000
Inorganic Chemistry Eighth Edition 1200
Anionic polymerization of acenaphthylene: identification of impurity species formed as by-products 1000
The Psychological Quest for Meaning 800
Signals, Systems, and Signal Processing 610
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6326094
求助须知:如何正确求助?哪些是违规求助? 8142886
关于积分的说明 17072478
捐赠科研通 5379422
什么是DOI,文献DOI怎么找? 2854220
邀请新用户注册赠送积分活动 1831847
关于科研通互助平台的介绍 1683147