Fast and accurate short read alignment with Burrows–Wheeler transform

计算机科学 软件 自由序列分析 杂交基因组组装 哈希表 参考基因组 索引 多序列比对 数据挖掘 DNA测序 序列比对 散列函数 算法 生物 遗传学 程序设计语言 DNA 基因 基因型 单核苷酸多态性 肽序列
作者
Heng Li,Richard Durbin
出处
期刊:Bioinformatics [Oxford University Press]
卷期号:25 (14): 1754-1760 被引量:43894
标识
DOI:10.1093/bioinformatics/btp324
摘要

The enormous amount of short reads generated by the new DNA sequencing technologies call for the development of fast and accurate read alignment programs. A first generation of hash table-based methods has been developed, including MAQ, which is accurate, feature rich and fast enough to align short reads from a single individual. However, MAQ does not support gapped alignment for single-end reads, which makes it unsuitable for alignment of longer reads where indels may occur frequently. The speed of MAQ is also a concern when the alignment is scaled up to the resequencing of hundreds of individuals.We implemented Burrows-Wheeler Alignment tool (BWA), a new read alignment package that is based on backward search with Burrows-Wheeler Transform (BWT), to efficiently align short sequencing reads against a large reference sequence such as the human genome, allowing mismatches and gaps. BWA supports both base space reads, e.g. from Illumina sequencing machines, and color space reads from AB SOLiD machines. Evaluations on both simulated and real data suggest that BWA is approximately 10-20x faster than MAQ, while achieving similar accuracy. In addition, BWA outputs alignment in the new standard SAM (Sequence Alignment/Map) format. Variant calling and other downstream analyses after the alignment can be achieved with the open source SAMtools software package.http://maq.sourceforge.net.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
jiuyuan135发布了新的文献求助10
刚刚
哈哈完成签到,获得积分10
1秒前
1秒前
LXN完成签到,获得积分10
1秒前
1秒前
zho应助感动的溪灵采纳,获得10
2秒前
111完成签到,获得积分10
2秒前
3秒前
liu完成签到,获得积分10
3秒前
3秒前
科研通AI2S应助vivien采纳,获得10
3秒前
CipherSage应助vivien采纳,获得10
3秒前
4秒前
4秒前
完美世界应助至黎采纳,获得10
5秒前
5秒前
ZHANG发布了新的文献求助10
5秒前
隐形曼青应助小火锅采纳,获得10
6秒前
华仔应助冷傲的芾采纳,获得10
7秒前
岩松完成签到 ,获得积分10
7秒前
Singularity应助JxJ采纳,获得10
7秒前
7秒前
Jambo应助背书强采纳,获得10
9秒前
Dsunflower完成签到 ,获得积分10
9秒前
ABS发布了新的文献求助10
9秒前
卷耳发布了新的文献求助20
9秒前
一条淡水鱼应助yyyy采纳,获得10
10秒前
11秒前
11秒前
11秒前
佳佳完成签到,获得积分10
11秒前
世当珍惜完成签到,获得积分10
13秒前
青衍应助ZHANG采纳,获得10
14秒前
一程发布了新的文献求助10
15秒前
高高的戎完成签到,获得积分10
15秒前
Reftro发布了新的文献求助10
16秒前
16秒前
初(*^▽^*)心应助背书强采纳,获得10
18秒前
可爱的函函应助风汐5423采纳,获得10
19秒前
月亮夏的夏完成签到,获得积分10
19秒前
高分求助中
The late Devonian Standard Conodont Zonation 2000
Nickel superalloy market size, share, growth, trends, and forecast 2023-2030 2000
The Lali Section: An Excellent Reference Section for Upper - Devonian in South China 1500
Smart but Scattered: The Revolutionary Executive Skills Approach to Helping Kids Reach Their Potential (第二版) 1000
Very-high-order BVD Schemes Using β-variable THINC Method 830
Mantiden: Faszinierende Lauerjäger Faszinierende Lauerjäger 800
PraxisRatgeber: Mantiden: Faszinierende Lauerjäger 800
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3247880
求助须知:如何正确求助?哪些是违规求助? 2891121
关于积分的说明 8266211
捐赠科研通 2559325
什么是DOI,文献DOI怎么找? 1388116
科研通“疑难数据库(出版商)”最低求助积分说明 650698
邀请新用户注册赠送积分活动 627581