Segmental duplications and their variation in a complete human genome

生物 基因组 人类基因组 结构变异 着丝粒 遗传学 端粒 节段重复 基因 杂合子丢失 进化生物学 参考基因组 单倍型 染色体 基因家族 等位基因 基因型
作者
Mitchell R. Vollger,X. Guitart,Philip C. Dishuck,Ludovica Mercuri,W. T. Harvey,Ariel Gershman,Mark Diekhans,Arvis Sulovari,Katherine M. Munson,A. M. Lewis,Kendra Hoekzema,David Porubsky,Robert K.Y. Li,Sergey Nurk,Srečko Koren,Karen H. Miga,Adam M. Phillippy,Winston Timp,M. Rita Ventura,Evan E. Eichler
标识
DOI:10.1101/2021.05.26.445678
摘要

ABSTRACT Despite their importance in disease and evolution, highly identical segmental duplications (SDs) have been among the last regions of the human reference genome (GRCh38) to be finished. Based on a complete telomere-to-telomere human genome (T2T-CHM13), we present the first comprehensive view of human SD organization. SDs account for nearly one-third of the additional sequence increasing the genome-wide estimate from 5.4% to 7.0% (218 Mbp). An analysis of 266 human genomes shows that 91% of the new T2T-CHM13 SD sequence (68.3 Mbp) better represents human copy number. We find that SDs show increased single-nucleotide variation diversity when compared to unique regions; we characterize methylation signatures that correlate with duplicate gene transcription and predict 182 novel protein-coding gene candidates. We find that 63% (35.11/55.7 Mbp) of acrocentric chromosomes consist of SDs distinct from rDNA and satellite sequences. Acrocentric SDs are 1.75-fold longer (p=0.00034) than other SDs, are frequently shared with autosomal pericentromeric regions, and are heteromorphic among human chromosomes. Comparing long-read assemblies from other human (n=12) and nonhuman primate (n=5) genomes, we use the T2T-CHM13 genome to systematically reconstruct the evolution and structural haplotype diversity of biomedically relevant ( LPA, SMN ) and duplicated genes ( TBC1D3, SRGAP2C, ARHGAP11B ) important in the expansion of the human frontal cortex. The analysis reveals unprecedented patterns of structural heterozygosity and massive evolutionary differences in SD organization between humans and their closest living relatives.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
刚刚
香香丿完成签到 ,获得积分10
1秒前
Gtpangda完成签到 ,获得积分10
2秒前
迟大猫应助乐易采纳,获得10
5秒前
涂涂完成签到 ,获得积分10
5秒前
Hello应助科研大哈巴采纳,获得10
5秒前
杨涛发布了新的文献求助10
5秒前
emxzemxz完成签到 ,获得积分10
9秒前
Angela完成签到,获得积分10
10秒前
梁嘉琦完成签到,获得积分10
12秒前
15秒前
suki完成签到 ,获得积分0
17秒前
思源应助轻松黄豆采纳,获得10
18秒前
W1ll完成签到,获得积分10
19秒前
赘婿应助mengmeng采纳,获得10
19秒前
weiwei完成签到,获得积分10
19秒前
20秒前
celia完成签到 ,获得积分10
20秒前
小透明应助任性盼兰采纳,获得30
21秒前
skycool完成签到,获得积分10
21秒前
刘总完成签到,获得积分10
22秒前
kittency完成签到 ,获得积分10
23秒前
23秒前
尺素寸心发布了新的文献求助10
24秒前
维生素完成签到,获得积分10
25秒前
嘿哈完成签到 ,获得积分10
26秒前
轻松黄豆完成签到,获得积分20
27秒前
英俊的铭应助科研通管家采纳,获得10
28秒前
28秒前
科研通AI5应助科研通管家采纳,获得10
28秒前
小飞七应助科研通管家采纳,获得10
28秒前
28秒前
28秒前
28秒前
29秒前
nove999完成签到 ,获得积分10
29秒前
HITvagary完成签到,获得积分10
29秒前
似风完成签到,获得积分10
29秒前
轻松黄豆发布了新的文献求助10
29秒前
高分求助中
Continuum Thermodynamics and Material Modelling 2000
Neuromuscular and Electrodiagnostic Medicine Board Review 1000
こんなに痛いのにどうして「なんでもない」と医者にいわれてしまうのでしょうか 510
いちばんやさしい生化学 500
The First Nuclear Era: The Life and Times of a Technological Fixer 500
岡本唐貴自伝的回想画集 500
Atmosphere-ice-ocean interactions in the Antarctic 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3678163
求助须知:如何正确求助?哪些是违规求助? 3231655
关于积分的说明 9798932
捐赠科研通 2942829
什么是DOI,文献DOI怎么找? 1613538
邀请新用户注册赠送积分活动 761639
科研通“疑难数据库(出版商)”最低求助积分说明 737048