Delta Machine Learning to Improve Scoring-Ranking-Screening Performances of Protein–Ligand Scoring Functions

机器学习 马修斯相关系数 人工智能 计算机科学 虚拟筛选 稳健性(进化) 试验装置 梯度升压 支持向量机 集成学习 数据挖掘 生物信息学 随机森林 药物发现 生物 基因 生物化学
作者
Chao Yang,Yingkai Zhang
出处
期刊:Journal of Chemical Information and Modeling [American Chemical Society]
卷期号:62 (11): 2696-2712 被引量:41
标识
DOI:10.1021/acs.jcim.2c00485
摘要

Protein–ligand scoring functions are widely used in structure-based drug design for fast evaluation of protein–ligand interactions, and it is of strong interest to develop scoring functions with machine-learning approaches. In this work, by expanding the training set, developing physically meaningful features, employing our recently developed linear empirical scoring function Lin_F9 (Yang, C. J. Chem. Inf. Model. 2021, 61, 4630−4644) as the baseline, and applying extreme gradient boosting (XGBoost) with Δ-machine learning, we have further improved the robustness and applicability of machine-learning scoring functions. Besides the top performances for scoring-ranking-screening power tests of the CASF-2016 benchmark, the new scoring function ΔLin_F9XGB also achieves superior scoring and ranking performances in different structure types that mimic real docking applications. The scoring powers of ΔLin_F9XGB for locally optimized poses, flexible redocked poses, and ensemble docked poses of the CASF-2016 core set achieve Pearson's correlation coefficient (R) values of 0.853, 0.839, and 0.813, respectively. In addition, the large-scale docking-based virtual screening test on the LIT-PCBA data set demonstrates the reliability and robustness of ΔLin_F9XGB in virtual screening application. The ΔLin_F9XGB scoring function and its code are freely available on the web at (https://yzhang.hpc.nyu.edu/Delta_LinF9_XGB).
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
爱卿5271完成签到,获得积分10
1秒前
曾经耳机完成签到 ,获得积分10
5秒前
liuyq0501完成签到,获得积分0
6秒前
吹梦西洲完成签到 ,获得积分0
11秒前
yuanletong完成签到 ,获得积分10
13秒前
Pride完成签到 ,获得积分10
13秒前
克姑美完成签到 ,获得积分10
15秒前
阿猩a完成签到 ,获得积分10
19秒前
junjie完成签到,获得积分10
20秒前
guo完成签到 ,获得积分10
21秒前
大脸猫发布了新的文献求助10
21秒前
kento完成签到,获得积分0
21秒前
25秒前
英俊的铭应助cjh采纳,获得10
26秒前
jixuchance完成签到,获得积分10
27秒前
bigpluto完成签到,获得积分10
28秒前
35秒前
善学以致用应助霜降采纳,获得10
37秒前
小蘑菇应助霜降采纳,获得10
37秒前
37秒前
猪猪女孩完成签到,获得积分10
38秒前
勇往直前完成签到,获得积分10
40秒前
charon完成签到 ,获得积分10
41秒前
Wang发布了新的文献求助10
42秒前
LJ_2完成签到 ,获得积分10
43秒前
LZX完成签到 ,获得积分10
45秒前
jeffrey完成签到,获得积分10
50秒前
从容映易完成签到,获得积分10
50秒前
看文献完成签到,获得积分10
55秒前
丝丢皮的完成签到 ,获得积分10
56秒前
大脸猫发布了新的文献求助10
56秒前
端庄代荷完成签到 ,获得积分10
1分钟前
小妮子完成签到,获得积分10
1分钟前
丝丢皮得完成签到 ,获得积分10
1分钟前
整齐的惮完成签到 ,获得积分10
1分钟前
超帅从彤完成签到 ,获得积分10
1分钟前
杨fafa完成签到 ,获得积分10
1分钟前
1分钟前
1分钟前
七羽完成签到,获得积分10
1分钟前
高分求助中
BIOLOGY OF NON-CHORDATES 1000
进口的时尚——14世纪东方丝绸与意大利艺术 Imported Fashion:Oriental Silks and Italian Arts in the 14th Century 800
Autoregulatory progressive resistance exercise: linear versus a velocity-based flexible model 550
Zeitschrift für Orient-Archäologie 500
The Collected Works of Jeremy Bentham: Rights, Representation, and Reform: Nonsense upon Stilts and Other Writings on the French Revolution 320
Play from birth to twelve: Contexts, perspectives, and meanings – 3rd Edition 300
Pediatric Nurse Telephone Triage 300
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 细胞生物学 免疫学 冶金
热门帖子
关注 科研通微信公众号,转发送积分 3350056
求助须知:如何正确求助?哪些是违规求助? 2975877
关于积分的说明 8671840
捐赠科研通 2657000
什么是DOI,文献DOI怎么找? 1454824
科研通“疑难数据库(出版商)”最低求助积分说明 673517
邀请新用户注册赠送积分活动 663979