Prototype-based contrastive substructure identification for molecular property prediction

下部结构 计算机科学 鉴定(生物学) 财产(哲学) 人工智能 聚类分析 一致性(知识库) 可视化 代表(政治) 机器学习 数据挖掘 政治 生物 认识论 结构工程 工程类 哲学 植物 法学 政治学
作者
Gaoqi He,Liu Shun,Zhuoran Liu,Changbo Wang,Kai Zhang,Honglin Li
出处
期刊:Briefings in Bioinformatics [Oxford University Press]
卷期号:25 (6)
标识
DOI:10.1093/bib/bbae565
摘要

Abstract Substructure-based representation learning has emerged as a powerful approach to featurize complex attributed graphs, with promising results in molecular property prediction (MPP). However, existing MPP methods mainly rely on manually defined rules to extract substructures. It remains an open challenge to adaptively identify meaningful substructures from numerous molecular graphs to accommodate MPP tasks. To this end, this paper proposes Prototype-based cOntrastive Substructure IdentificaTion (POSIT), a self-supervised framework to autonomously discover substructural prototypes across graphs so as to guide end-to-end molecular fragmentation. During pre-training, POSIT emphasizes two key aspects of substructure identification: firstly, it imposes a soft connectivity constraint to encourage the generation of topologically meaningful substructures; secondly, it aligns resultant substructures with derived prototypes through a prototype-substructure contrastive clustering objective, ensuring attribute-based similarity within clusters. In the fine-tuning stage, a cross-scale attention mechanism is designed to integrate substructure-level information to enhance molecular representations. The effectiveness of the POSIT framework is demonstrated by experimental results from diverse real-world datasets, covering both classification and regression tasks. Moreover, visualization analysis validates the consistency of chemical priors with identified substructures. The source code is publicly available at https://github.com/VRPharmer/POSIT.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
温暖宛筠完成签到,获得积分10
4秒前
李健的小迷弟应助Su采纳,获得10
7秒前
平淡寒烟完成签到 ,获得积分10
7秒前
大个应助科研通管家采纳,获得10
7秒前
赘婿应助科研通管家采纳,获得10
8秒前
情怀应助科研通管家采纳,获得10
8秒前
8秒前
8秒前
CO2完成签到,获得积分10
10秒前
陈雅玲完成签到 ,获得积分10
11秒前
14秒前
呆鹅喵喵完成签到,获得积分10
15秒前
马登完成签到,获得积分10
17秒前
Somnolence咩完成签到,获得积分10
17秒前
Owen应助周周采纳,获得10
17秒前
暮商完成签到 ,获得积分10
17秒前
彩色的蓝天完成签到,获得积分10
18秒前
21秒前
朻安完成签到,获得积分10
21秒前
在水一方应助匆匆采纳,获得10
23秒前
假装超人会飞完成签到,获得积分10
23秒前
忒寒碜完成签到,获得积分10
27秒前
MI发布了新的文献求助10
28秒前
赵一完成签到,获得积分10
28秒前
35秒前
阳光的梦寒完成签到,获得积分10
36秒前
ba完成签到 ,获得积分10
36秒前
高贵幼枫完成签到 ,获得积分10
37秒前
匆匆完成签到,获得积分0
38秒前
专注雁发布了新的文献求助10
39秒前
mark完成签到,获得积分10
44秒前
冷酷的海露完成签到,获得积分10
44秒前
酷酷的曼凡完成签到,获得积分10
47秒前
蜡笔小z完成签到 ,获得积分10
51秒前
小王小王完成签到,获得积分10
51秒前
鹅鹅Namae应助专注雁采纳,获得10
54秒前
Maglev完成签到,获得积分10
55秒前
一人完成签到,获得积分10
55秒前
刘丽梅完成签到 ,获得积分0
56秒前
萌&完成签到,获得积分10
56秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
PowerCascade: A Synthetic Dataset for Cascading Failure Analysis in Power Systems 2000
Signals, Systems, and Signal Processing 610
Unlocking Chemical Thinking: Reimagining Chemistry Teaching and Learning 555
Photodetectors: From Ultraviolet to Infrared 500
On the Dragon Seas, a sailor's adventures in the far east 500
Yangtze Reminiscences. Some Notes And Recollections Of Service With The China Navigation Company Ltd., 1925-1939 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6355811
求助须知:如何正确求助?哪些是违规求助? 8170527
关于积分的说明 17201160
捐赠科研通 5411774
什么是DOI,文献DOI怎么找? 2864385
邀请新用户注册赠送积分活动 1841922
关于科研通互助平台的介绍 1690224