Graph-Based Deep Learning Models for Thermodynamic Property Prediction: The Interplay between Target Definition, Data Distribution, Featurization, and Model Architecture

计算机科学 图形 财产(哲学) 人工智能 理论计算机科学 数据挖掘 哲学 认识论
作者
Bowen Deng,Thijs Stuyver
出处
期刊:Journal of Chemical Information and Modeling [American Chemical Society]
标识
DOI:10.1021/acs.jcim.4c02014
摘要

In this contribution, we examine the interplay between target definition, data distribution, featurization approaches, and model architectures on graph-based deep learning models for thermodynamic property prediction. Through consideration of five curated data sets, exhibiting diversity in elemental composition, multiplicity, charge state, and size, we examine the impact of each of these factors on model accuracy. We observe that target definition, i.e., using formation instead of atomization energy/enthalpy, is a decisive factor, and so is a careful selection of the featurization approach. Our attempts at directly modifying model architectures result in more modest, though not negligible, accuracy gains. Remarkably, we observe that molecule-level predictions tend to outperform atom-level increment predictions, in contrast to previous findings. Overall, this work paves the way toward the development of robust graph-based thermodynamic model architectures with more universal capabilities, i.e., architectures that can reach excellent accuracy across data sets and compound domains.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
Wy完成签到,获得积分10
刚刚
LLL完成签到 ,获得积分10
1秒前
1秒前
1秒前
科研通AI5应助八九采纳,获得10
2秒前
领导范儿应助少夫人采纳,获得10
2秒前
葡萄完成签到,获得积分10
2秒前
2秒前
lin发布了新的文献求助10
2秒前
幸运鱼完成签到,获得积分10
3秒前
3秒前
3秒前
昏睡的傻姑完成签到,获得积分10
3秒前
yunhuang完成签到,获得积分10
4秒前
4秒前
4秒前
aqb发布了新的文献求助10
4秒前
4秒前
孤独如曼发布了新的文献求助10
4秒前
cyb发布了新的文献求助10
4秒前
sasa完成签到,获得积分10
4秒前
可爱的函函应助Otto Curious采纳,获得30
5秒前
5秒前
5秒前
ttelsa发布了新的文献求助10
5秒前
Zxc发布了新的文献求助10
6秒前
6秒前
7秒前
海光发布了新的文献求助10
7秒前
WissF-完成签到,获得积分10
7秒前
1213完成签到 ,获得积分10
7秒前
7秒前
DAYDAY发布了新的文献求助10
7秒前
h'c'z完成签到,获得积分10
7秒前
lcc完成签到,获得积分10
8秒前
8秒前
科研小白发布了新的文献求助10
8秒前
隐形曼青应助Wwy采纳,获得20
9秒前
乐乐应助免疫人采纳,获得10
9秒前
9秒前
高分求助中
Continuum Thermodynamics and Material Modelling 3000
Production Logging: Theoretical and Interpretive Elements 2700
Mechanistic Modeling of Gas-Liquid Two-Phase Flow in Pipes 2500
Kelsen’s Legacy: Legal Normativity, International Law and Democracy 1000
Conference Record, IAS Annual Meeting 1977 610
The Laschia-complex (Basidiomycetes) 600
Interest Rate Modeling. Volume 3: Products and Risk Management 600
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 量子力学 光电子学 冶金
热门帖子
关注 科研通微信公众号,转发送积分 3541500
求助须知:如何正确求助?哪些是违规求助? 3118893
关于积分的说明 9337169
捐赠科研通 2816755
什么是DOI,文献DOI怎么找? 1548646
邀请新用户注册赠送积分活动 721597
科研通“疑难数据库(出版商)”最低求助积分说明 712731