A multiple kernel ensemble approach for genomic prediction

超参数 超参数优化 支持向量机 最佳线性无偏预测 随机森林 核(代数) 计算机科学 机器学习 多核学习 人工智能 选择(遗传算法) Boosting(机器学习) 树(集合论) 基因组选择 数学 核方法 生物 组合数学 数学分析 生物化学 单核苷酸多态性 基因型 基因
作者
Zhihong Wang,Huanchen Wang,Tingxi Yu,Wuping Zhang,Jiwan Han,Fuzhong Li
标识
DOI:10.1117/12.2671691
摘要

Genomic selection (GS) to estimate genomic estimated breeding values (GEBVs) of individuals by using high-density molecular markers covering a genome-wide range combined with phenotypic records or pedigree information has revolutionized animal and plant breeding. Support vector machines (SVM) have been shown to be an important method for implementing genomic selection, showing excellent prediction performance on a variety of traits, but the choice of hyperparameters and kernel functions has an important impact on the prediction performance. In this study, we integrated four kernel functions of SVM to construct a multiple kernel ensemble (MKE) learning framework and combined gradient boosting decision tree (GBDT), genomic best linear unbiased prediction (GBLUP) and random forest (RF) to predict GEBVs for three economic traits of milk fat percentage (MFP), milk yield (MY), and somatic cell score (SCS) in German Holstein dairy cattle. We also constructed an Optuna hyperparameter optimization (HO) framework and compared the prediction performance and time to find the optimal parameters with two commonly used grid search and random search methods. The results show that the MKE framework outperforms the single kernel SVM as well as several other machine learning (ML) algorithms, with an average improvement of 10% in prediction accuracy for the three traits. Besides, the MKE framework with Optuna optimization has the best predictive performance on each trait. Therefore, we believed that MKE is an efficient and stable GS method for phenotypes prediction.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
1秒前
cdercder应助lrf采纳,获得10
2秒前
脑洞疼应助乐观悟空采纳,获得10
2秒前
胡小飞完成签到 ,获得积分10
2秒前
znl发布了新的文献求助10
4秒前
NexusExplorer应助虚幻的酒窝采纳,获得10
5秒前
小蘑菇应助独特亦旋采纳,获得10
5秒前
queer发布了新的文献求助10
5秒前
东方一斩完成签到,获得积分10
6秒前
不安青牛应助zhuyimin913采纳,获得10
6秒前
7秒前
精明匪发布了新的文献求助10
7秒前
现代的绣连完成签到,获得积分10
9秒前
9秒前
9秒前
11秒前
今天真暖发布了新的文献求助10
13秒前
yy发布了新的文献求助10
14秒前
在水一方应助季末默相依采纳,获得10
14秒前
调研昵称发布了新的文献求助10
14秒前
Lucas应助meinv666采纳,获得10
14秒前
失眠的蓝完成签到,获得积分10
15秒前
16秒前
约三十完成签到,获得积分10
16秒前
NexusExplorer应助rr采纳,获得10
17秒前
1004完成签到,获得积分10
17秒前
科研通AI2S应助是小小李哇采纳,获得10
18秒前
完美世界应助今天真暖采纳,获得10
18秒前
不安青牛应助zhuyimin913采纳,获得10
20秒前
香蕉觅云应助lulu采纳,获得30
20秒前
21秒前
TANGYU发布了新的文献求助10
23秒前
热心的银耳汤完成签到 ,获得积分10
23秒前
JamesPei应助纯真一江采纳,获得10
24秒前
24秒前
24秒前
传奇3应助queer采纳,获得10
25秒前
yujie发布了新的文献求助10
26秒前
Yifan2024给cxx的求助进行了留言
26秒前
27秒前
高分求助中
Production Logging: Theoretical and Interpretive Elements 2500
Востребованный временем 2500
Aspects of Babylonian celestial divination : the lunar eclipse tablets of enuma anu enlil 1500
Agaricales of New Zealand 1: Pluteaceae - Entolomataceae 1040
Healthcare Finance: Modern Financial Analysis for Accelerating Biomedical Innovation 1000
Classics in Total Synthesis IV: New Targets, Strategies, Methods 1000
Devlopment of GaN Resonant Cavity LEDs 666
热门求助领域 (近24小时)
化学 医学 材料科学 生物 工程类 有机化学 生物化学 纳米技术 内科学 物理 化学工程 计算机科学 复合材料 基因 遗传学 物理化学 催化作用 细胞生物学 免疫学 电极
热门帖子
关注 科研通微信公众号,转发送积分 3455164
求助须知:如何正确求助?哪些是违规求助? 3050441
关于积分的说明 9021374
捐赠科研通 2739114
什么是DOI,文献DOI怎么找? 1502413
科研通“疑难数据库(出版商)”最低求助积分说明 694501
邀请新用户注册赠送积分活动 693293