Prototype-based contrastive substructure identification for molecular property prediction

下部结构 计算机科学 鉴定(生物学) 财产(哲学) 人工智能 聚类分析 一致性(知识库) 可视化 代表(政治) 机器学习 数据挖掘 政治 生物 认识论 结构工程 工程类 哲学 植物 法学 政治学
作者
Gaoqi He,Liu Shun,Zhuoran Liu,Changbo Wang,Kai Zhang,Honglin Li
出处
期刊:Briefings in Bioinformatics [Oxford University Press]
卷期号:25 (6)
标识
DOI:10.1093/bib/bbae565
摘要

Abstract Substructure-based representation learning has emerged as a powerful approach to featurize complex attributed graphs, with promising results in molecular property prediction (MPP). However, existing MPP methods mainly rely on manually defined rules to extract substructures. It remains an open challenge to adaptively identify meaningful substructures from numerous molecular graphs to accommodate MPP tasks. To this end, this paper proposes Prototype-based cOntrastive Substructure IdentificaTion (POSIT), a self-supervised framework to autonomously discover substructural prototypes across graphs so as to guide end-to-end molecular fragmentation. During pre-training, POSIT emphasizes two key aspects of substructure identification: firstly, it imposes a soft connectivity constraint to encourage the generation of topologically meaningful substructures; secondly, it aligns resultant substructures with derived prototypes through a prototype-substructure contrastive clustering objective, ensuring attribute-based similarity within clusters. In the fine-tuning stage, a cross-scale attention mechanism is designed to integrate substructure-level information to enhance molecular representations. The effectiveness of the POSIT framework is demonstrated by experimental results from diverse real-world datasets, covering both classification and regression tasks. Moreover, visualization analysis validates the consistency of chemical priors with identified substructures. The source code is publicly available at https://github.com/VRPharmer/POSIT.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
潇洒的以柳完成签到 ,获得积分10
1秒前
流沙无言发布了新的文献求助10
1秒前
2秒前
3秒前
4秒前
4秒前
眠羊发布了新的文献求助10
4秒前
5秒前
嘉心糖应助天然純真采纳,获得30
6秒前
jinjinjin完成签到,获得积分10
7秒前
斗罗大陆完成签到,获得积分10
8秒前
Jonathan发布了新的文献求助10
9秒前
Rainor发布了新的文献求助10
9秒前
天真的小亚完成签到,获得积分10
10秒前
mlml完成签到,获得积分10
10秒前
11秒前
jinjinjin发布了新的文献求助10
11秒前
SciGPT应助豆豆的姐姐采纳,获得10
11秒前
11秒前
柚子茶完成签到 ,获得积分10
13秒前
sunshine完成签到 ,获得积分10
13秒前
zuko发布了新的文献求助30
14秒前
You完成签到,获得积分10
14秒前
缥缈嘉熙完成签到,获得积分10
14秒前
Rainor完成签到,获得积分10
15秒前
科研通AI6.1应助细腻听白采纳,获得10
16秒前
mlml发布了新的文献求助30
16秒前
17秒前
17秒前
充电宝应助Linly采纳,获得10
17秒前
17秒前
彭于晏应助魔幻花卷采纳,获得10
18秒前
Pkaming发布了新的文献求助20
18秒前
浅墨桃妞完成签到,获得积分20
18秒前
blind发布了新的文献求助10
18秒前
19秒前
19秒前
heija完成签到,获得积分10
21秒前
跃轩发布了新的文献求助10
22秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
The Wiley Blackwell Companion to Diachronic and Historical Linguistics 3000
The impact of workplace variables on juvenile probation officers’ job satisfaction 1000
When the badge of honor holds no meaning anymore 1000
HANDBOOK OF CHEMISTRY AND PHYSICS 106th edition 1000
ASPEN Adult Nutrition Support Core Curriculum, Fourth Edition 1000
AnnualResearch andConsultation Report of Panorama survey and Investment strategy onChinaIndustry 1000
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6282141
求助须知:如何正确求助?哪些是违规求助? 8100972
关于积分的说明 16938034
捐赠科研通 5349144
什么是DOI,文献DOI怎么找? 2843367
邀请新用户注册赠送积分活动 1820558
关于科研通互助平台的介绍 1677469