Improving Genomic Prediction with Machine Learning Incorporating TPE for Hyperparameters Optimization

超参数优化 超参数 支持向量机 机器学习 人工智能 随机森林 计算机科学 回归 核(代数) 生物 数学 统计 组合数学
作者
Mang Liang,Bingxing An,Keanning Li,Lili Du,Tianyu Deng,Sheng Cao,Yueying Du,Lingyang Xu,Xue Gao,Lupei Zhang,Junya Li,Huijiang Gao
出处
期刊:Biology [Multidisciplinary Digital Publishing Institute]
卷期号:11 (11): 1647-1647 被引量:11
标识
DOI:10.3390/biology11111647
摘要

Depending on excellent prediction ability, machine learning has been considered the most powerful implement to analyze high-throughput sequencing genome data. However, the sophisticated process of tuning hyperparameters tremendously impedes the wider application of machine learning in animal and plant breeding programs. Therefore, we integrated an automatic tuning hyperparameters algorithm, tree-structured Parzen estimator (TPE), with machine learning to simplify the process of using machine learning for genomic prediction. In this study, we applied TPE to optimize the hyperparameters of Kernel ridge regression (KRR) and support vector regression (SVR). To evaluate the performance of TPE, we compared the prediction accuracy of KRR-TPE and SVR-TPE with the genomic best linear unbiased prediction (GBLUP) and KRR-RS, KRR-Grid, SVR-RS, and SVR-Grid, which tuned the hyperparameters of KRR and SVR by using random search (RS) and grid search (Gird) in a simulation dataset and the real datasets. The results indicated that KRR-TPE achieved the most powerful prediction ability considering all populations and was the most convenient. Especially for the Chinese Simmental beef cattle and Loblolly pine populations, the prediction accuracy of KRR-TPE had an 8.73% and 6.08% average improvement compared with GBLUP, respectively. Our study will greatly promote the application of machine learning in GP and further accelerate breeding progress.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
内向的绿完成签到 ,获得积分20
1秒前
三伏天完成签到,获得积分10
2秒前
2秒前
hint应助WxChen采纳,获得10
3秒前
向前进发布了新的文献求助10
4秒前
刘屁屁完成签到,获得积分10
5秒前
5秒前
LL完成签到,获得积分10
6秒前
JazzWon完成签到,获得积分10
6秒前
Orange应助nini采纳,获得10
7秒前
青塘龙仔发布了新的文献求助10
8秒前
9秒前
9秒前
无花果应助刘屁屁采纳,获得10
9秒前
WxChen完成签到,获得积分10
12秒前
qwert118应助Merlin采纳,获得10
13秒前
青塘龙仔发布了新的文献求助10
13秒前
14秒前
拼搏的问凝完成签到,获得积分10
19秒前
晨时明月发布了新的文献求助10
20秒前
21秒前
高贵尔蝶发布了新的文献求助10
21秒前
柳绿柳完成签到,获得积分10
23秒前
章芷雪完成签到,获得积分10
24秒前
25秒前
沙新镇完成签到,获得积分10
26秒前
Dr.Joseph完成签到,获得积分10
26秒前
Wesley完成签到,获得积分10
27秒前
一路生花碎西瓜完成签到 ,获得积分10
28秒前
crazy完成签到,获得积分10
29秒前
慕雪发布了新的文献求助20
31秒前
32秒前
在水一方应助125采纳,获得10
33秒前
飘叶随风完成签到,获得积分10
34秒前
bie完成签到,获得积分10
35秒前
zengyl发布了新的文献求助10
35秒前
Jay完成签到,获得积分10
36秒前
Lu完成签到,获得积分10
37秒前
深情安青应助山青水秀采纳,获得10
37秒前
38秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Salmon nasal cartilage-derived proteoglycan complexes influence the gut microbiota and bacterial metabolites in mice 2000
The Composition and Relative Chronology of Dynasties 16 and 17 in Egypt 1500
Picture this! Including first nations fiction picture books in school library collections 1500
ON THE THEORY OF BIRATIONAL BLOWING-UP 666
Signals, Systems, and Signal Processing 610
The Impostor Phenomenon: When Success Makes You Feel Like a Fake 600
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6377654
求助须知:如何正确求助?哪些是违规求助? 8190822
关于积分的说明 17302932
捐赠科研通 5431252
什么是DOI,文献DOI怎么找? 2873421
邀请新用户注册赠送积分活动 1850065
关于科研通互助平台的介绍 1695375