FLASH: fast length adjustment of short reads to improve genome assemblies

计算机科学 康蒂格 闪光灯(摄影) 基因组 软件 顺序装配 k-mer公司 杂交基因组组装 正确性 计算生物学 算法 生物 遗传学 操作系统 基因 艺术 基因表达 视觉艺术 转录组
作者
Tanja Magoč,Steven L. Salzberg
出处
期刊:Bioinformatics [Oxford University Press]
卷期号:27 (21): 2957-2963 被引量:12840
标识
DOI:10.1093/bioinformatics/btr507
摘要

Abstract Motivation: Next-generation sequencing technologies generate very large numbers of short reads. Even with very deep genome coverage, short read lengths cause problems in de novo assemblies. The use of paired-end libraries with a fragment size shorter than twice the read length provides an opportunity to generate much longer reads by overlapping and merging read pairs before assembling a genome. Results: We present FLASH, a fast computational tool to extend the length of short reads by overlapping paired-end reads from fragment libraries that are sufficiently short. We tested the correctness of the tool on one million simulated read pairs, and we then applied it as a pre-processor for genome assemblies of Illumina reads from the bacterium Staphylococcus aureus and human chromosome 14. FLASH correctly extended and merged reads >99% of the time on simulated reads with an error rate of <1%. With adequately set parameters, FLASH correctly merged reads over 90% of the time even when the reads contained up to 5% errors. When FLASH was used to extend reads prior to assembly, the resulting assemblies had substantially greater N50 lengths for both contigs and scaffolds. Availability and Implementation: The FLASH system is implemented in C and is freely available as open-source code at http://www.cbcb.umd.edu/software/flash. Contact: t.magoc@gmail.com
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
杰Sir完成签到,获得积分10
刚刚
无私的黄豆完成签到 ,获得积分10
2秒前
北辰完成签到,获得积分10
3秒前
鲤鱼火车发布了新的文献求助10
3秒前
3秒前
5秒前
上官若男应助lyyyy采纳,获得10
6秒前
天天快乐应助cumt采纳,获得10
6秒前
8秒前
小夏饭桶完成签到,获得积分10
9秒前
9秒前
westbobo发布了新的文献求助10
9秒前
10秒前
科研通AI5应助冷傲迎梅采纳,获得10
12秒前
13秒前
Siriya发布了新的文献求助10
14秒前
15秒前
yuyuyu完成签到,获得积分10
16秒前
乐乐应助五五采纳,获得10
16秒前
16秒前
16秒前
王二萌完成签到 ,获得积分10
18秒前
超级的鹅发布了新的文献求助10
18秒前
酸辣完成签到 ,获得积分10
19秒前
20秒前
20秒前
动漫大师发布了新的文献求助10
21秒前
Number_eight发布了新的文献求助10
22秒前
23秒前
Teslwang完成签到,获得积分10
23秒前
23秒前
yxsccjj完成签到 ,获得积分10
23秒前
zzZephyr应助老实的小王采纳,获得10
23秒前
DrWang发布了新的文献求助10
26秒前
27秒前
心静听炊烟完成签到 ,获得积分10
28秒前
超级的鹅完成签到,获得积分10
28秒前
28秒前
28秒前
丂枧完成签到 ,获得积分10
29秒前
高分求助中
Production Logging: Theoretical and Interpretive Elements 2700
Ophthalmic Equipment Market 1500
Neuromuscular and Electrodiagnostic Medicine Board Review 1000
こんなに痛いのにどうして「なんでもない」と医者にいわれてしまうのでしょうか 510
いちばんやさしい生化学 500
The First Nuclear Era: The Life and Times of a Technological Fixer 500
Unusual formation of 4-diazo-3-nitriminopyrazoles upon acid nitration of pyrazolo[3,4-d][1,2,3]triazoles 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3672384
求助须知:如何正确求助?哪些是违规求助? 3228736
关于积分的说明 9781794
捐赠科研通 2939160
什么是DOI,文献DOI怎么找? 1610638
邀请新用户注册赠送积分活动 760696
科研通“疑难数据库(出版商)”最低求助积分说明 736174