Prototype-based contrastive substructure identification for molecular property prediction

下部结构 计算机科学 鉴定(生物学) 财产(哲学) 人工智能 聚类分析 一致性(知识库) 可视化 代表(政治) 机器学习 数据挖掘 政治 生物 认识论 结构工程 工程类 哲学 植物 法学 政治学
作者
Gaoqi He,Liu Shun,Zhuoran Liu,Changbo Wang,Kai Zhang,Honglin Li
出处
期刊:Briefings in Bioinformatics [Oxford University Press]
卷期号:25 (6)
标识
DOI:10.1093/bib/bbae565
摘要

Abstract Substructure-based representation learning has emerged as a powerful approach to featurize complex attributed graphs, with promising results in molecular property prediction (MPP). However, existing MPP methods mainly rely on manually defined rules to extract substructures. It remains an open challenge to adaptively identify meaningful substructures from numerous molecular graphs to accommodate MPP tasks. To this end, this paper proposes Prototype-based cOntrastive Substructure IdentificaTion (POSIT), a self-supervised framework to autonomously discover substructural prototypes across graphs so as to guide end-to-end molecular fragmentation. During pre-training, POSIT emphasizes two key aspects of substructure identification: firstly, it imposes a soft connectivity constraint to encourage the generation of topologically meaningful substructures; secondly, it aligns resultant substructures with derived prototypes through a prototype-substructure contrastive clustering objective, ensuring attribute-based similarity within clusters. In the fine-tuning stage, a cross-scale attention mechanism is designed to integrate substructure-level information to enhance molecular representations. The effectiveness of the POSIT framework is demonstrated by experimental results from diverse real-world datasets, covering both classification and regression tasks. Moreover, visualization analysis validates the consistency of chemical priors with identified substructures. The source code is publicly available at https://github.com/VRPharmer/POSIT.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
SciGPT应助健忘道罡采纳,获得10
刚刚
充电宝应助渔婆采纳,获得10
刚刚
刚刚
坦率的枕头完成签到,获得积分10
刚刚
充电宝应助清秀语儿采纳,获得10
1秒前
科研顺利完成签到,获得积分10
1秒前
1秒前
2秒前
3秒前
郁金完成签到,获得积分20
3秒前
3秒前
4秒前
4秒前
请叫我女侠完成签到,获得积分10
5秒前
SciGPT应助竹马子采纳,获得10
5秒前
hhhhh完成签到,获得积分20
5秒前
是人发布了新的文献求助10
7秒前
土拨鼠发布了新的文献求助10
7秒前
Ccc完成签到 ,获得积分10
8秒前
hhhhh发布了新的文献求助10
9秒前
hhh发布了新的文献求助10
9秒前
NDY发布了新的文献求助10
10秒前
10秒前
寸心台水完成签到,获得积分10
10秒前
zhoudada发布了新的文献求助10
11秒前
笨笨忆萝请问完成签到,获得积分20
12秒前
orange完成签到,获得积分10
13秒前
13秒前
14秒前
15秒前
15秒前
PG发布了新的文献求助10
15秒前
benbenca发布了新的文献求助10
15秒前
龙傲天完成签到 ,获得积分10
16秒前
16秒前
哈哈发布了新的文献求助10
17秒前
科研通AI6.2应助心心相连采纳,获得10
18秒前
NDY完成签到,获得积分20
18秒前
18秒前
王纯妍完成签到,获得积分10
18秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Cowries - A Guide to the Gastropod Family Cypraeidae 1200
Quality by Design - An Indispensable Approach to Accelerate Biopharmaceutical Product Development 800
Pulse width control of a 3-phase inverter with non sinusoidal phase voltages 777
Signals, Systems, and Signal Processing 610
A Social and Cultural History of the Hellenistic World 500
Chemistry and Physics of Carbon Volume 15 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6397529
求助须知:如何正确求助?哪些是违规求助? 8212793
关于积分的说明 17401122
捐赠科研通 5450855
什么是DOI,文献DOI怎么找? 2881103
邀请新用户注册赠送积分活动 1857661
关于科研通互助平台的介绍 1699693