BatmanNet: bi-branch masked graph transformer autoencoder for molecular representation

计算机科学 自编码 分子图 人工智能 图形 特征学习 机器学习 变压器 药物发现 代表(政治) 深度学习 模式识别(心理学) 理论计算机科学 化学 物理 政治学 法学 电压 生物化学 政治 量子力学
作者
Zhen Wang,Zhenghe Feng,Yanjun Li,Bowen Li,Yongrui Wang,Sha Chen,Min He,Xin Li
出处
期刊:Briefings in Bioinformatics [Oxford University Press]
卷期号:25 (1)
标识
DOI:10.1093/bib/bbad400
摘要

Abstract Although substantial efforts have been made using graph neural networks (GNNs) for artificial intelligence (AI)-driven drug discovery, effective molecular representation learning remains an open challenge, especially in the case of insufficient labeled molecules. Recent studies suggest that big GNN models pre-trained by self-supervised learning on unlabeled datasets enable better transfer performance in downstream molecular property prediction tasks. However, the approaches in these studies require multiple complex self-supervised tasks and large-scale datasets , which are time-consuming, computationally expensive and difficult to pre-train end-to-end. Here, we design a simple yet effective self-supervised strategy to simultaneously learn local and global information about molecules, and further propose a novel bi-branch masked graph transformer autoencoder (BatmanNet) to learn molecular representations. BatmanNet features two tailored complementary and asymmetric graph autoencoders to reconstruct the missing nodes and edges, respectively, from a masked molecular graph. With this design, BatmanNet can effectively capture the underlying structure and semantic information of molecules, thus improving the performance of molecular representation. BatmanNet achieves state-of-the-art results for multiple drug discovery tasks, including molecular properties prediction, drug–drug interaction and drug–target interaction, on 13 benchmark datasets, demonstrating its great potential and superiority in molecular representation learning.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
huohuo143完成签到,获得积分10
刚刚
暮冬完成签到 ,获得积分10
刚刚
刚刚
激情的含巧完成签到,获得积分10
1秒前
圆锥香蕉应助俊逸的代曼采纳,获得20
1秒前
1秒前
付榆峰发布了新的文献求助10
1秒前
大胆洋葱发布了新的文献求助10
1秒前
2秒前
卷卷睡完成签到,获得积分10
2秒前
叉叉茶发布了新的文献求助10
2秒前
2秒前
boyue发布了新的文献求助10
2秒前
重要的溪流完成签到,获得积分10
3秒前
安详靖柏完成签到 ,获得积分10
3秒前
4秒前
FashionBoy应助天真的一斩采纳,获得10
5秒前
阿七完成签到,获得积分10
5秒前
个别发布了新的文献求助10
6秒前
6秒前
sos完成签到,获得积分10
6秒前
宓不评完成签到,获得积分10
7秒前
Lucas应助橘子果酱采纳,获得10
7秒前
7秒前
7秒前
天天快乐应助GGGGGG果果采纳,获得10
7秒前
丁又菡完成签到,获得积分10
8秒前
磨人的老妖精完成签到,获得积分10
8秒前
8秒前
8秒前
liu完成签到,获得积分20
9秒前
GaajeoiC完成签到,获得积分10
9秒前
Bo0108完成签到,获得积分10
9秒前
Andy1201完成签到,获得积分10
9秒前
9秒前
付榆峰完成签到,获得积分10
9秒前
David_xx发布了新的文献求助10
10秒前
10秒前
Jasper应助Y123采纳,获得10
10秒前
superman完成签到,获得积分10
11秒前
高分求助中
【提示信息,请勿应助】关于scihub 10000
A new approach to the extrapolation of accelerated life test data 1000
徐淮辽南地区新元古代叠层石及生物地层 500
Coking simulation aids on-stream time 450
康复物理因子治疗 400
北师大毕业论文 基于可调谐半导体激光吸收光谱技术泄漏气体检测系统的研究 390
Phylogenetic study of the order Polydesmida (Myriapoda: Diplopoda) 370
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 冶金 细胞生物学 免疫学
热门帖子
关注 科研通微信公众号,转发送积分 4016558
求助须知:如何正确求助?哪些是违规求助? 3556732
关于积分的说明 11322479
捐赠科研通 3289455
什么是DOI,文献DOI怎么找? 1812490
邀请新用户注册赠送积分活动 888053
科研通“疑难数据库(出版商)”最低求助积分说明 812074