Machine learning descriptors in materials chemistry used in multiple experimentally validated studies: Oliynyk elemental property dataset

支持向量机 随机森林 计算机科学 材料信息学 财产(哲学) 机器学习 人工智能 克里金 电负性 解析 数据挖掘 集成学习 化学 健康信息学 哲学 认识论 医学 护理部 有机化学 工程信息学 公共卫生
作者
Sangjoon Lee,Clio Chen,Griheydi Garcia,Anton O. Oliynyk
出处
期刊:Data in Brief [Elsevier]
卷期号:53: 110178-110178 被引量:2
标识
DOI:10.1016/j.dib.2024.110178
摘要

Materials informatics employs data-driven approaches for analysis and discovery of materials. Features also referred to as descriptors are essential in generating reliable and accurate machine-learning models. While general data can be obtained through public and commercial sources, features must be tailored to specific applications. Common featurizers suitable for generic chemical problems may not be effective in features-property mapping in solid-state materials with ML models. Here, we have assembled the Oliynyk property list for compositional feature generation, which performs well on limited datasets (50 to 1,000 training data points) in the solid-state materials domain. The dataset contains 98 elemental features for atomic numbers from 1 to 92, including thermodynamic properties, electronic structure data, size, electronegativity, and bulk properties such as melting point, density, and conductivity. The dataset has been utilized peer-reviewed publications in predicting material hardness, classification, discovery of novel Heusler compounds, band gap prediction, and determining the site preference of atoms using machine learning models including support vector machines, random forests for classification, and support vector regression for regression problems. We have compiled the dataset by parsing data from publicly available databases and literature and further supplementing it by interpolating values with Gaussian process regression.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
852应助小余采纳,获得10
刚刚
饱满秋完成签到,获得积分10
1秒前
夜白发布了新的文献求助20
1秒前
搜集达人应助明月清风采纳,获得10
1秒前
希夷发布了新的文献求助10
2秒前
2秒前
爆米花应助通~采纳,获得10
2秒前
苏靖完成签到,获得积分10
2秒前
luoyutian发布了新的文献求助10
2秒前
2秒前
2秒前
3秒前
科研通AI5应助猪猪采纳,获得10
3秒前
3秒前
海绵体宝宝应助an采纳,获得10
4秒前
wwww完成签到,获得积分10
4秒前
4秒前
桐桐应助柔弱凡松采纳,获得10
4秒前
爆米花应助丶呆久自然萌采纳,获得10
5秒前
5秒前
wanyanjin应助流云采纳,获得10
5秒前
心花怒放发布了新的文献求助10
6秒前
DrYang发布了新的文献求助10
6秒前
6秒前
跑在颖完成签到,获得积分20
6秒前
希望天下0贩的0应助Jackson采纳,获得10
6秒前
徐徐发布了新的文献求助10
7秒前
落花生完成签到,获得积分10
7秒前
y123完成签到 ,获得积分10
7秒前
mnm完成签到,获得积分10
7秒前
7秒前
狂野雁丝应助小张张采纳,获得10
8秒前
qwt_hello关注了科研通微信公众号
8秒前
12彡完成签到,获得积分10
8秒前
虾仁发布了新的文献求助10
9秒前
9秒前
sx发布了新的文献求助10
9秒前
9秒前
陈尹蓝完成签到 ,获得积分10
9秒前
猪猪完成签到,获得积分20
9秒前
高分求助中
Continuum Thermodynamics and Material Modelling 3000
Production Logging: Theoretical and Interpretive Elements 2700
Social media impact on athlete mental health: #RealityCheck 1020
Ensartinib (Ensacove) for Non-Small Cell Lung Cancer 1000
Unseen Mendieta: The Unpublished Works of Ana Mendieta 1000
Bacterial collagenases and their clinical applications 800
El viaje de una vida: Memorias de María Lecea 800
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 量子力学 光电子学 冶金
热门帖子
关注 科研通微信公众号,转发送积分 3527742
求助须知:如何正确求助?哪些是违规求助? 3107867
关于积分的说明 9286956
捐赠科研通 2805612
什么是DOI,文献DOI怎么找? 1540026
邀请新用户注册赠送积分活动 716884
科研通“疑难数据库(出版商)”最低求助积分说明 709762