A review of molecular representation in the age of machine learning

化学信息学 计算机科学 代表(政治) 化学空间 人工智能 标识符 表(数据库) 数据科学 自编码 理论计算机科学 机器学习 药物发现 数据挖掘 化学 深度学习 程序设计语言 计算化学 生物化学 法学 政治 政治学
作者
Daniel Wigh,Jonathan M. Goodman,Alexei A. Lapkin
出处
期刊:Wiley Interdisciplinary Reviews: Computational Molecular Science [Wiley]
卷期号:12 (5) 被引量:131
标识
DOI:10.1002/wcms.1603
摘要

Abstract Research in chemistry increasingly requires interdisciplinary work prompted by, among other things, advances in computing, machine learning, and artificial intelligence. Everyone working with molecules, whether chemist or not, needs an understanding of the representation of molecules in a machine‐readable format, as this is central to computational chemistry. Four classes of representations are introduced: string, connection table, feature‐based, and computer‐learned representations. Three of the most significant representations are simplified molecular‐input line‐entry system (SMILES), International Chemical Identifier (InChI), and the MDL molfile, of which SMILES was the first to successfully be used in conjunction with a variational autoencoder (VAE) to yield a continuous representation of molecules. This is noteworthy because a continuous representation allows for efficient navigation of the immensely large chemical space of possible molecules. Since 2018, when the first model of this type was published, considerable effort has been put into developing novel and improved methodologies. Most, if not all, researchers in the community make their work easily accessible on GitHub, though discussion of computation time and domain of applicability is often overlooked. Herein, we present questions for consideration in future work which we believe will make chemical VAEs even more accessible. This article is categorized under: Data Science > Chemoinformatics
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
鲤鱼灵阳完成签到,获得积分10
2秒前
Shuhe_Gong完成签到 ,获得积分10
20秒前
安然完成签到 ,获得积分10
22秒前
荔枝酱完成签到,获得积分10
32秒前
wangye完成签到 ,获得积分10
41秒前
yugongjie完成签到 ,获得积分10
43秒前
janer完成签到 ,获得积分10
46秒前
xwl9955完成签到 ,获得积分10
50秒前
脑洞疼应助richardzhang1984采纳,获得200
56秒前
墨水完成签到 ,获得积分10
56秒前
乒坛巨人完成签到 ,获得积分10
1分钟前
川藏客完成签到 ,获得积分10
1分钟前
mumuyayaguoguo完成签到 ,获得积分10
1分钟前
jbear完成签到 ,获得积分10
1分钟前
Tonald Yang发布了新的文献求助10
1分钟前
Ava应助科研通管家采纳,获得10
1分钟前
清爽达完成签到 ,获得积分10
1分钟前
沉默采波完成签到 ,获得积分10
1分钟前
孤独听雨的猫完成签到 ,获得积分10
1分钟前
changfox完成签到,获得积分10
1分钟前
钱塘小虾米完成签到,获得积分10
1分钟前
NXYZSM完成签到 ,获得积分10
1分钟前
海孩子完成签到,获得积分10
1分钟前
子明完成签到 ,获得积分10
1分钟前
richardzhang1984完成签到 ,获得积分10
1分钟前
Richardisme完成签到 ,获得积分10
2分钟前
XX完成签到 ,获得积分10
2分钟前
陈静完成签到,获得积分10
2分钟前
2分钟前
飘逸的冬日完成签到,获得积分10
2分钟前
陈静发布了新的文献求助10
2分钟前
Tonald Yang发布了新的文献求助10
2分钟前
ggg完成签到 ,获得积分10
2分钟前
小孟吖完成签到 ,获得积分10
2分钟前
woshiwuziq完成签到 ,获得积分10
2分钟前
火星上惜天完成签到 ,获得积分10
2分钟前
南风完成签到 ,获得积分10
2分钟前
柒月完成签到 ,获得积分10
2分钟前
开心的短靴完成签到 ,获得积分10
2分钟前
科研狗完成签到 ,获得积分10
2分钟前
高分求助中
System in Systemic Functional Linguistics A System-based Theory of Language 1000
The Data Economy: Tools and Applications 1000
Essentials of thematic analysis 700
Mantiden - Faszinierende Lauerjäger – Buch gebraucht kaufen 600
PraxisRatgeber Mantiden., faszinierende Lauerjäger. – Buch gebraucht kaufe 600
A Dissection Guide & Atlas to the Rabbit 600
Academia de Coimbra: 1537-1990: história, praxe, boémia e estudo, partidas e piadas, organismos académicos 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3117561
求助须知:如何正确求助?哪些是违规求助? 2767639
关于积分的说明 7691727
捐赠科研通 2422995
什么是DOI,文献DOI怎么找? 1286599
科研通“疑难数据库(出版商)”最低求助积分说明 620426
版权声明 599868