已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

Efficiently controlling for case-control imbalance and sample relatedness in large-scale genetic association studies

生命银行 生物 遗传关联 I类和II类错误 遗传学 样本量测定 广义估计方程 全基因组关联研究 可扩展性 广义线性混合模型 关联测试 比例(比率) 统计 样品(材料) 计算机科学 数据挖掘 二进制数 单核苷酸多态性 数学 基因型 基因 算术 数据库 物理 量子力学 化学 色谱法
作者
Wei Zhou,Jonas B. Nielsen,Lars G. Fritsche,Rounak Dey,Maiken E. Gabrielsen,Brooke N. Wolford,Jonathon LeFaive,Peter VandeHaar,Sarah A. Gagliano Taliun,Aliya Gifford,Lisa A. Bastarache,Wei‐Qi Wei,Joshua C. Denny,Maoxuan Lin,Kristian Hveem,Hyun Min Kang,Gonçalo R. Abecasis,Cristen J. Willer,Seunggeun Lee
出处
期刊:Nature Genetics [Springer Nature]
卷期号:50 (9): 1335-1341 被引量:1055
标识
DOI:10.1038/s41588-018-0184-y
摘要

In genome-wide association studies (GWAS) for thousands of phenotypes in large biobanks, most binary traits have substantially fewer cases than controls. Both of the widely used approaches, the linear mixed model and the recently proposed logistic mixed model, perform poorly; they produce large type I error rates when used to analyze unbalanced case-control phenotypes. Here we propose a scalable and accurate generalized mixed model association test that uses the saddlepoint approximation to calibrate the distribution of score test statistics. This method, SAIGE (Scalable and Accurate Implementation of GEneralized mixed model), provides accurate P values even when case-control ratios are extremely unbalanced. SAIGE uses state-of-art optimization strategies to reduce computational costs; hence, it is applicable to GWAS for thousands of phenotypes by large biobanks. Through the analysis of UK Biobank data of 408,961 samples from white British participants with European ancestry for > 1,400 binary phenotypes, we show that SAIGE can efficiently analyze large sample data, controlling for unbalanced case-control ratios and sample relatedness. SAIGE (Scalable and Accurate Implementation of GEneralized mixed model) is a generalized mixed model association test that can efficiently analyze large data sets while controlling for unbalanced case-control ratios and sample relatedness, as shown by applying SAIGE to the UK Biobank data for > 1,400 binary phenotypes.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
liang完成签到 ,获得积分10
1秒前
Georgechan完成签到,获得积分10
3秒前
Chris完成签到 ,获得积分0
7秒前
竹筏过海应助dddlrb采纳,获得30
16秒前
17秒前
充电宝应助科研通管家采纳,获得10
18秒前
18秒前
20秒前
21秒前
nolan完成签到,获得积分20
25秒前
Eureka关注了科研通微信公众号
25秒前
kskdss发布了新的文献求助10
27秒前
29秒前
zmaifyc完成签到 ,获得积分10
32秒前
爆米花应助嗝嗝采纳,获得10
32秒前
34秒前
andrele发布了新的文献求助30
41秒前
43秒前
耿宇航完成签到 ,获得积分10
44秒前
xns关注了科研通微信公众号
50秒前
51秒前
52秒前
Tendency完成签到 ,获得积分10
54秒前
morena发布了新的文献求助10
57秒前
林夕发布了新的文献求助10
57秒前
一枚研究僧举报高高天抒求助涉嫌违规
1分钟前
杳鸢应助susu采纳,获得10
1分钟前
机灵晓刚完成签到 ,获得积分10
1分钟前
xjcy应助ureil采纳,获得10
1分钟前
一枚研究僧举报高高天抒求助涉嫌违规
1分钟前
半烟发布了新的文献求助10
1分钟前
iamhawthorn完成签到,获得积分10
1分钟前
susu完成签到,获得积分10
1分钟前
1分钟前
WZM完成签到 ,获得积分10
1分钟前
科研通AI2S应助Yuzusoft采纳,获得10
1分钟前
丘比特应助iamhawthorn采纳,获得10
1分钟前
1分钟前
Eureka发布了新的文献求助10
1分钟前
Russell完成签到 ,获得积分10
1分钟前
高分求助中
求国内可以测试或购买Loschmidt cell(或相同原理器件)的机构信息 1000
PraxisRatgeber: Mantiden: Faszinierende Lauerjäger 700
The Heath Anthology of American Literature: Early Nineteenth Century 1800 - 1865 Vol. B 500
A new species of Velataspis (Hemiptera Coccoidea Diaspididae) from tea in Assam 500
Sarcolestes leedsi Lydekker, an ankylosaurian dinosaur from the Middle Jurassic of England 500
Machine Learning for Polymer Informatics 500
《关于整治突出dupin问题的实施意见》(厅字〔2019〕52号) 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3219623
求助须知:如何正确求助?哪些是违规求助? 2868434
关于积分的说明 8160959
捐赠科研通 2535489
什么是DOI,文献DOI怎么找? 1367964
科研通“疑难数据库(出版商)”最低求助积分说明 645120
邀请新用户注册赠送积分活动 618457