Computationally efficient whole-genome regression for quantitative and binary traits

生命银行 计算机科学 回归 计算生物学 人口 生物 对比度(视觉) 回归分析 基因组 统计 遗传学 全基因组关联研究 机器学习 人工智能 基因型 数学 基因 社会学 人口学 单核苷酸多态性
作者
Joelle Mbatchou,Leland Barnard,Joshua Backman,Anthony Marcketta,Jack A. Kosmicki,Andrey Ziyatdinov,Christian Benner,Colm O’Dushlaine,Mathew Barber,Boris Boutkov,Lukas Habegger,Manuel A. R. Ferreira,Aris Baras,Jeffrey G. Reid,Gonçalo R. Abecasis,Evan K. Maxwell,Jonathan Marchini
出处
期刊:Nature Genetics [Springer Nature]
卷期号:53 (7): 1097-1103 被引量:671
标识
DOI:10.1038/s41588-021-00870-7
摘要

Genome-wide association analysis of cohorts with thousands of phenotypes is computationally expensive, particularly when accounting for sample relatedness or population structure. Here we present a novel machine-learning method called REGENIE for fitting a whole-genome regression model for quantitative and binary phenotypes that is substantially faster than alternatives in multi-trait analyses while maintaining statistical efficiency. The method naturally accommodates parallel analysis of multiple phenotypes and requires only local segments of the genotype matrix to be loaded in memory, in contrast to existing alternatives, which must load genome-wide matrices into memory. This results in substantial savings in compute time and memory usage. We introduce a fast, approximate Firth logistic regression test for unbalanced case-control phenotypes. The method is ideally suited to take advantage of distributed computing frameworks. We demonstrate the accuracy and computational benefits of this approach using the UK Biobank dataset with up to 407,746 individuals.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
啊哈完成签到 ,获得积分10
8秒前
小二郎应助BLUE采纳,获得10
9秒前
科目三应助左丘酬海采纳,获得10
10秒前
slx0410完成签到,获得积分10
11秒前
紧张的刺猬完成签到,获得积分10
13秒前
zzzyyyuuu完成签到 ,获得积分10
13秒前
Owen应助1234采纳,获得10
14秒前
16秒前
呆鸥完成签到,获得积分10
17秒前
duan完成签到,获得积分10
18秒前
19秒前
19秒前
Cat应助小海狸采纳,获得20
19秒前
aaa完成签到,获得积分10
21秒前
皮卡丘完成签到,获得积分10
21秒前
左丘酬海发布了新的文献求助10
22秒前
独特乘风完成签到,获得积分10
23秒前
23秒前
学术辉发布了新的文献求助10
23秒前
BLUE发布了新的文献求助10
24秒前
欣喜宛亦完成签到 ,获得积分10
24秒前
材料摆渡人完成签到,获得积分10
24秒前
畅快宛丝完成签到 ,获得积分10
24秒前
1234发布了新的文献求助10
27秒前
体贴的小天鹅完成签到,获得积分10
27秒前
绿叶完成签到,获得积分10
28秒前
29秒前
小丸子呀完成签到 ,获得积分10
30秒前
hailiangzheng完成签到,获得积分10
31秒前
where发布了新的文献求助10
31秒前
coolkid发布了新的文献求助10
32秒前
34秒前
熙泽发布了新的文献求助10
35秒前
金轩完成签到 ,获得积分10
37秒前
胡关完成签到,获得积分10
38秒前
Ava应助科研通管家采纳,获得10
41秒前
yufanhui应助科研通管家采纳,获得10
41秒前
TTTaT应助科研通管家采纳,获得20
41秒前
大模型应助科研通管家采纳,获得10
41秒前
蒋时晏应助科研通管家采纳,获得20
41秒前
高分求助中
中国国际图书贸易总公司40周年纪念文集: 回忆录 2000
Impact of Mitophagy-Related Genes on the Diagnosis and Development of Esophageal Squamous Cell Carcinoma via Single-Cell RNA-seq Analysis and Machine Learning Algorithms 2000
Die Elektra-Partitur von Richard Strauss : ein Lehrbuch für die Technik der dramatischen Komposition 1000
How to Create Beauty: De Lairesse on the Theory and Practice of Making Art 1000
Gerard de Lairesse : an artist between stage and studio 670
大平正芳: 「戦後保守」とは何か 550
LNG地下タンク躯体の構造性能照査指針 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3001565
求助须知:如何正确求助?哪些是违规求助? 2661260
关于积分的说明 7208254
捐赠科研通 2297263
什么是DOI,文献DOI怎么找? 1218219
科研通“疑难数据库(出版商)”最低求助积分说明 594103
版权声明 592990