Feature optimization for atomistic machine learning yields a data-driven construction of the periodic table of the elements

代表(政治) 计算机科学 核(代数) 周期表 理论(学习稳定性) 表(数据库) 集合(抽象数据类型) 组分(热力学) 特征(语言学) 比例(比率) 人工智能 机器学习 理论计算机科学 生物系统 算法 数据挖掘 化学 数学 物理 语言学 有机化学 组合数学 量子力学 政治 生物 政治学 法学 程序设计语言 热力学 哲学
作者
Michael J. Willatt,Félix Musil,Michele Ceriotti
出处
期刊:Physical Chemistry Chemical Physics [The Royal Society of Chemistry]
卷期号:20 (47): 29661-29668 被引量:89
标识
DOI:10.1039/c8cp05921g
摘要

Machine-learning of atomic-scale properties amounts to extracting correlations between structure, composition and the quantity that one wants to predict. Representing the input structure in a way that best reflects such correlations makes it possible to improve the accuracy of the model for a given amount of reference data. When using a description of the structures that is transparent and well-principled, optimizing the representation might reveal insights into the chemistry of the data set. Here we show how one can generalize the SOAP kernel to introduce a distance-dependent weight that accounts for the multi-scale nature of the interactions, and a description of correlations between chemical species. We show that this improves substantially the performance of ML models of molecular and materials stability, while making it easier to work with complex, multi-component systems and to extend SOAP to coarse-grained intermolecular potentials. The element correlations that give the best performing model show striking similarities with the conventional periodic table of the elements, providing an inspiring example of how machine learning can rediscover, and generalize, intuitive concepts that constitute the foundations of chemistry.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
蜗牛应助33采纳,获得30
刚刚
TTTTT发布了新的文献求助10
1秒前
鱼苏大大不吃鱼关注了科研通微信公众号
3秒前
打打应助xtt采纳,获得10
3秒前
3秒前
3秒前
李爱国应助和谐的安南采纳,获得10
3秒前
5秒前
6秒前
JamesPei应助哈哈哈采纳,获得10
7秒前
8秒前
8秒前
T102892发布了新的文献求助10
8秒前
桐桐应助爱笑的南风采纳,获得10
8秒前
李子敬发布了新的文献求助10
11秒前
12秒前
dpp发布了新的文献求助10
12秒前
13秒前
13秒前
13秒前
Lynn_L发布了新的文献求助30
14秒前
YJ发布了新的文献求助10
16秒前
18秒前
顾矜应助Tian采纳,获得10
18秒前
无花果应助天黑不打烊采纳,获得10
18秒前
18秒前
逃跑计划完成签到,获得积分10
18秒前
19秒前
鲤鱼懿轩发布了新的文献求助10
19秒前
19秒前
sparks完成签到,获得积分10
20秒前
汉堡包应助Spike采纳,获得10
21秒前
Jenishining发布了新的文献求助10
21秒前
22秒前
雨田发布了新的文献求助10
22秒前
22秒前
科目三应助o原来是草莓吖采纳,获得10
24秒前
dpp关闭了dpp文献求助
26秒前
dq1992发布了新的文献求助10
26秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
HIGH DYNAMIC RANGE CMOS IMAGE SENSORS FOR LOW LIGHT APPLICATIONS 1500
Constitutional and Administrative Law 1000
The Social Work Ethics Casebook: Cases and Commentary (revised 2nd ed.). Frederic G. Reamer 800
Holistic Discourse Analysis 600
Vertébrés continentaux du Crétacé supérieur de Provence (Sud-Est de la France) 600
Vertebrate Palaeontology, 5th Edition 530
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 物理化学 基因 遗传学 催化作用 冶金 量子力学 光电子学
热门帖子
关注 科研通微信公众号,转发送积分 5353187
求助须知:如何正确求助?哪些是违规求助? 4485831
关于积分的说明 13964569
捐赠科研通 4386047
什么是DOI,文献DOI怎么找? 2409731
邀请新用户注册赠送积分活动 1402013
关于科研通互助平台的介绍 1375783