A knowledge-guided pre-training framework for improving molecular representation learning

计算机科学 机器学习 人工智能 特征学习 药物发现 图形 生物信息学 理论计算机科学 生物
作者
Han Li,Ruotian Zhang,Yaosen Min,Dacheng Ma,Dan Zhao,Jianyang Zeng
出处
期刊:Nature Communications [Springer Nature]
卷期号:14 (1) 被引量:13
标识
DOI:10.1038/s41467-023-43214-1
摘要

Learning effective molecular feature representation to facilitate molecular property prediction is of great significance for drug discovery. Recently, there has been a surge of interest in pre-training graph neural networks (GNNs) via self-supervised learning techniques to overcome the challenge of data scarcity in molecular property prediction. However, current self-supervised learning-based methods suffer from two main obstacles: the lack of a well-defined self-supervised learning strategy and the limited capacity of GNNs. Here, we propose Knowledge-guided Pre-training of Graph Transformer (KPGT), a self-supervised learning framework to alleviate the aforementioned issues and provide generalizable and robust molecular representations. The KPGT framework integrates a graph transformer specifically designed for molecular graphs and a knowledge-guided pre-training strategy, to fully capture both structural and semantic knowledge of molecules. Through extensive computational tests on 63 datasets, KPGT exhibits superior performance in predicting molecular properties across various domains. Moreover, the practical applicability of KPGT in drug discovery has been validated by identifying potential inhibitors of two antitumor targets: hematopoietic progenitor kinase 1 (HPK1) and fibroblast growth factor receptor 1 (FGFR1). Overall, KPGT can provide a powerful and useful tool for advancing the artificial intelligence (AI)-aided drug discovery process.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
多情靖易发布了新的文献求助10
3秒前
三火发布了新的文献求助30
4秒前
yongyong6784发布了新的文献求助10
6秒前
6秒前
游标卡尺关注了科研通微信公众号
8秒前
虚拟的念烟完成签到,获得积分10
9秒前
12秒前
red关闭了red文献求助
12秒前
慕青应助科研通管家采纳,获得10
15秒前
Lucas应助科研通管家采纳,获得10
15秒前
舒适青槐发布了新的文献求助10
15秒前
15秒前
Ava应助科研通管家采纳,获得10
15秒前
慕青应助科研通管家采纳,获得10
15秒前
脑洞疼应助科研通管家采纳,获得10
15秒前
在水一方应助科研通管家采纳,获得10
15秒前
英姑应助科研通管家采纳,获得10
16秒前
16秒前
超级白昼发布了新的文献求助30
17秒前
saikun发布了新的文献求助10
18秒前
18秒前
chemcarbon发布了新的文献求助10
20秒前
yongyong6784完成签到,获得积分10
20秒前
21秒前
简让完成签到 ,获得积分10
21秒前
wyg1994完成签到,获得积分10
21秒前
KD发布了新的文献求助10
22秒前
星辰大海应助活泼学生采纳,获得10
23秒前
大模型应助chemcarbon采纳,获得10
24秒前
27秒前
脑洞疼应助一个小菜鸡采纳,获得10
28秒前
28秒前
orixero应助KD采纳,获得10
28秒前
28秒前
嘻嘻完成签到,获得积分10
30秒前
sophia完成签到 ,获得积分10
30秒前
小刘恨香菜完成签到 ,获得积分10
32秒前
hahahaweiwei完成签到,获得积分10
32秒前
寂寞的寄文完成签到 ,获得积分10
32秒前
33秒前
高分求助中
LNG地下式貯槽指針(JGA指-107) 1000
LNG地上式貯槽指針 (JGA指 ; 108) 1000
LNG as a marine fuel—Safety and Operational Guidelines - Bunkering 560
How Stories Change Us A Developmental Science of Stories from Fiction and Real Life 500
九经直音韵母研究 500
Full waveform acoustic data processing 500
Clinical Interviewing, 7th ed 400
热门求助领域 (近24小时)
化学 医学 材料科学 生物 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 免疫学 细胞生物学 电极
热门帖子
关注 科研通微信公众号,转发送积分 2933586
求助须知:如何正确求助?哪些是违规求助? 2587898
关于积分的说明 6974198
捐赠科研通 2234150
什么是DOI,文献DOI怎么找? 1186400
版权声明 589766
科研通“疑难数据库(出版商)”最低求助积分说明 580827