First Steps in the Analysis of Prokaryotic Pan-Genomes

基因组 生物 基因组计划 基因 GenBank公司 遗传学 细菌基因组大小 比较基因组学 计算生物学 基因组学
作者
Sávio Souza Costa,Luís Carlos Guimarães,Artur M. S. Silva,Siomar C. Soares,Rafael Azevedo Baraúna
出处
期刊:Bioinformatics and Biology Insights [SAGE]
卷期号:14: 117793222093806-117793222093806 被引量:46
标识
DOI:10.1177/1177932220938064
摘要

Pan-genome is defined as the set of orthologous and unique genes of a specific group of organisms. The pan-genome is composed by the core genome, accessory genome, and species- or strain-specific genes. The pan-genome is considered open or closed based on the alpha value of the Heap law. In an open pan-genome, the number of gene families will continuously increase with the addition of new genomes to the analysis, while in a closed pan-genome, the number of gene families will not increase considerably. The first step of a pan-genome analysis is the homogenization of genome annotation. The same software should be used to annotate genomes, such as GeneMark or RAST. Subsequently, several software are used to calculate the pan-genome such as BPGA, GET_HOMOLOGUES, PGAP, among others. This review presents all these initial steps for those who want to perform a pan-genome analysis, explaining key concepts of the area. Furthermore, we present the pan-genomic analysis of 9 bacterial species. These are the species with the highest number of genomes deposited in GenBank. We also show the influence of the identity and coverage parameters on the prediction of orthologous and paralogous genes. Finally, we cite the perspectives of several research areas where pan-genome analysis can be used to answer important issues.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
1秒前
2秒前
xiaozhang完成签到 ,获得积分10
3秒前
英子发布了新的文献求助10
3秒前
土木研学僧完成签到,获得积分10
4秒前
漂亮的凝云完成签到,获得积分10
5秒前
flora完成签到 ,获得积分10
5秒前
academician发布了新的文献求助10
7秒前
传奇3应助eden采纳,获得10
7秒前
8秒前
liugm发布了新的文献求助10
8秒前
8秒前
所所应助一口李子皮采纳,获得10
10秒前
所所应助科研白采纳,获得10
10秒前
Jasper应助坦率道之采纳,获得10
12秒前
英俊的铭应助英子采纳,获得10
15秒前
aldehyde应助提米橘采纳,获得20
15秒前
CodeCraft应助yx采纳,获得10
15秒前
优秀的百川应助彩云追月采纳,获得10
16秒前
田様应助jeep先生采纳,获得10
16秒前
3366ll完成签到 ,获得积分10
17秒前
17秒前
大力发布了新的文献求助10
17秒前
17秒前
18秒前
至秦完成签到,获得积分10
18秒前
一口李子皮完成签到,获得积分10
19秒前
19秒前
王咕噜咕噜应助小蘑菇采纳,获得10
20秒前
21秒前
LX完成签到,获得积分10
22秒前
22秒前
深情安青应助Minicoper采纳,获得10
22秒前
坦率道之完成签到,获得积分20
23秒前
小京子发布了新的文献求助10
23秒前
搜集达人应助小吴采纳,获得10
24秒前
24秒前
liugm完成签到,获得积分10
25秒前
霸气小珍发布了新的文献求助10
25秒前
情怀应助大海之滨采纳,获得10
26秒前
高分求助中
中央政治學校研究部新政治月刊社出版之《新政治》(第二卷第四期) 1000
Hopemont Capacity Assessment Interview manual and scoring guide 1000
Classics in Total Synthesis IV: New Targets, Strategies, Methods 1000
Mantids of the euro-mediterranean area 600
【港理工学位论文】Telling the tale of health crisis response on social media : an exploration of narrative plot and commenters' co-narration 500
Mantodea of the World: Species Catalog Andrew M 500
Insecta 2. Blattodea, Mantodea, Isoptera, Grylloblattodea, Phasmatodea, Dermaptera and Embioptera 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 内科学 物理 纳米技术 计算机科学 基因 遗传学 化学工程 复合材料 免疫学 物理化学 细胞生物学 催化作用 病理
热门帖子
关注 科研通微信公众号,转发送积分 3434062
求助须知:如何正确求助?哪些是违规求助? 3031257
关于积分的说明 8941535
捐赠科研通 2719231
什么是DOI,文献DOI怎么找? 1491703
科研通“疑难数据库(出版商)”最低求助积分说明 689418
邀请新用户注册赠送积分活动 685548