Analysis of the limitedM. tuberculosisaccessory genome reveals potential pitfalls of pan-genome analysis approaches

基因组 生物 计算生物学 肺结核 遗传学 进化生物学 基因 医学 病理
作者
Maximillian G. Marin,Christoph Wippel,Natalia Quinones‐Olvera,Mahboobeh Behruznia,Brendan M. Jeffrey,Michael A. Harris,B.C. Mann,Alex Rosenthal,Karen R. Jacobson,Robin M. Warren,Heng Li,Conor J. Meehan,Maha Farhat
标识
DOI:10.1101/2024.03.21.586149
摘要

Abstract Pan-genome analysis is a fundamental tool for studying bacterial genome evolution; however, the variety of methods used to define and measure the pan-genome poses challenges to the interpretation and reliability of results. To quantify sources of bias and error related to common pan-genome analysis approaches, we evaluated different approaches applied to curated collection of 151 Mycobacterium tuberculosis ( Mtb ) isolates. Mtb is characterized by its clonal evolution, absence of horizontal gene transfer, and limited accessory genome, making it an ideal test case for this study. Using a state-of-the-art graph-genome approach, we found that a majority of the structural variation observed in Mtb originates from rearrangement, deletion, and duplication of redundant nucleotide sequences. In contrast, we found that pan-genome analyses that focus on comparison of coding sequences (at the amino acid level) can yield surprisingly variable results, driven by differences in assembly quality and the softwares used. Upon closer inspection, we found that coding sequence annotation discrepancies were a major contributor to inflated Mtb accessory genome estimates. To address this, we developed panqc, a software that detects annotation discrepancies and collapses nucleotide redundancy in pan-genome estimates. When applied to Mtb and E. coli pan-genomes, panqc exposed distinct biases influenced by the genomic diversity of the population studied. Our findings underscore the need for careful methodological selection and quality control to accurately map the evolutionary dynamics of a bacterial species.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI

祝大家在新的一年里科研腾飞
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
1秒前
yar举报魁梧的鸿煊求助涉嫌违规
1秒前
2秒前
2秒前
Ting完成签到,获得积分10
2秒前
3秒前
希望天下0贩的0应助Shan5采纳,获得10
3秒前
大模型应助研友_8yN60L采纳,获得10
3秒前
111发布了新的文献求助10
3秒前
小欧医生完成签到,获得积分10
4秒前
5秒前
hefunan发布了新的文献求助10
5秒前
毅诚菌发布了新的文献求助20
5秒前
5秒前
waitstill完成签到,获得积分10
5秒前
kyt发布了新的文献求助10
5秒前
户户得振完成签到,获得积分10
5秒前
6秒前
6秒前
7秒前
lirongcas发布了新的文献求助10
8秒前
11完成签到,获得积分10
8秒前
张沐金关注了科研通微信公众号
8秒前
完美世界应助ExtroGod采纳,获得10
8秒前
9秒前
9秒前
QLR完成签到,获得积分10
9秒前
阿辉完成签到,获得积分10
10秒前
10秒前
cl发布了新的文献求助10
10秒前
shanbc完成签到,获得积分10
11秒前
调研昵称发布了新的文献求助10
11秒前
yj1506837246发布了新的文献求助10
12秒前
甄晓亦完成签到,获得积分10
12秒前
科研通AI2S应助言叶采纳,获得10
12秒前
winni完成签到,获得积分10
13秒前
xiaoyue发布了新的文献求助10
13秒前
13秒前
拉长的博超完成签到,获得积分10
13秒前
QLR发布了新的文献求助10
13秒前
高分求助中
Востребованный временем 2500
The Three Stars Each: The Astrolabes and Related Texts 1500
Les Mantodea de Guyane 800
Mantids of the euro-mediterranean area 700
Plate Tectonics 500
Igneous rocks and processes: a practical guide(第二版) 500
Mantodea of the World: Species Catalog 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 细胞生物学 免疫学 冶金
热门帖子
关注 科研通微信公众号,转发送积分 3408914
求助须知:如何正确求助?哪些是违规求助? 3012819
关于积分的说明 8856328
捐赠科研通 2700154
什么是DOI,文献DOI怎么找? 1480258
科研通“疑难数据库(出版商)”最低求助积分说明 684280
邀请新用户注册赠送积分活动 678614