亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

SMICLR: Contrastive Learning on Multiple Molecular Representations for Semisupervised and Unsupervised Representation Learning

计算机科学 人工智能 特征学习 代表(政治) 编码器 图形 自然语言处理 机器学习 堆积 嵌入 集合(抽象数据类型) 无监督学习 模式识别(心理学) 理论计算机科学 物理 政治 政治学 法学 程序设计语言 操作系统 核磁共振
作者
Gabriel A. Pinheiro,Juarez L. F. Da Silva,Marcos G. Quiles
出处
期刊:Journal of Chemical Information and Modeling [American Chemical Society]
卷期号:62 (17): 3948-3960 被引量:12
标识
DOI:10.1021/acs.jcim.2c00521
摘要

Machine learning as a tool for chemical space exploration broadens horizons to work with known and unknown molecules. At its core lies molecular representation, an essential key to improve learning about structure-property relationships. Recently, contrastive frameworks have been showing impressive results for representation learning in diverse domains. Therefore, this paper proposes a contrastive framework that embraces multimodal molecular data. Specifically, our approach jointly trains a graph encoder and an encoder for the simplified molecular-input line-entry system (SMILES) string to perform the contrastive learning objective. Since SMILES is the basis of our method, i.e., we built the molecular graph from the SMILES, we call our framework as SMILES Contrastive Learning (SMICLR). When stacking a nonlinear regressor on the SMICLR's pretrained encoder and fine-tuning the entire model, we reduced the prediction error by, on average, 44% and 25% for the energetic and electronic properties of the QM9 data set, respectively, over the supervised baseline. We further improved our framework's performance when applying data augmentations in each molecular-input representation. Moreover, SMICLR demonstrated competitive representation learning results in an unsupervised setting.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
10秒前
Oasis完成签到 ,获得积分10
1分钟前
共享精神应助科研通管家采纳,获得10
1分钟前
2分钟前
Cutewm完成签到,获得积分10
2分钟前
Cutewm发布了新的文献求助10
2分钟前
Artin驳回了Jasper应助
2分钟前
我和你完成签到 ,获得积分10
3分钟前
Omni完成签到,获得积分10
3分钟前
诺hn完成签到 ,获得积分10
3分钟前
meng完成签到,获得积分10
5分钟前
6分钟前
溯whale发布了新的文献求助10
6分钟前
8分钟前
晓晓发布了新的文献求助10
8分钟前
8分钟前
9分钟前
YangMengJing_发布了新的文献求助10
9分钟前
FashionBoy应助YangMengJing_采纳,获得10
9分钟前
wyg1994发布了新的文献求助10
10分钟前
jyy应助YIN采纳,获得10
10分钟前
11分钟前
11分钟前
vassallo完成签到 ,获得积分10
12分钟前
GAOGONGZI完成签到,获得积分10
12分钟前
12分钟前
Aaron完成签到,获得积分10
12分钟前
13分钟前
QAZ完成签到 ,获得积分10
13分钟前
开拖拉机的医学僧完成签到 ,获得积分10
13分钟前
13分钟前
酷波er应助科研雪瑞采纳,获得30
14分钟前
14分钟前
YYMM发布了新的文献求助10
14分钟前
15分钟前
麻花精发布了新的文献求助10
15分钟前
麻花精完成签到,获得积分10
15分钟前
YYMM完成签到,获得积分10
15分钟前
back you up完成签到,获得积分10
16分钟前
斯文败类应助qingshu采纳,获得10
16分钟前
高分求助中
Licensing Deals in Pharmaceuticals 2019-2024 3000
Effect of reactor temperature on FCC yield 2000
Very-high-order BVD Schemes Using β-variable THINC Method 1020
PraxisRatgeber: Mantiden: Faszinierende Lauerjäger 800
Impiego dell'associazione acetazolamide/pentossifillina nel trattamento dell'ipoacusia improvvisa idiopatica in pazienti affetti da glaucoma cronico 730
錢鍾書楊絳親友書札 600
A new species of Coccus (Homoptera: Coccoidea) from Malawi 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3294585
求助须知:如何正确求助?哪些是违规求助? 2930487
关于积分的说明 8446123
捐赠科研通 2602765
什么是DOI,文献DOI怎么找? 1420700
科研通“疑难数据库(出版商)”最低求助积分说明 660658
邀请新用户注册赠送积分活动 643433