Comparative Study of Deep Generative Models on Chemical Space Coverage

化学空间 生成语法 水准点(测量) 公制(单位) 计算机科学 人工智能 一般化 生成模型 机器学习 深度学习 集合(抽象数据类型) 空格(标点符号) 数学 药物发现 生物信息学 生物 工程类 数学分析 运营管理 大地测量学 地理 程序设计语言 操作系统
作者
Jie Zhang,Rocío Mercado,Ola Engkvist,Hongming Chen
出处
期刊:Journal of Chemical Information and Modeling [American Chemical Society]
卷期号:61 (6): 2572-2581 被引量:44
标识
DOI:10.1021/acs.jcim.0c01328
摘要

In recent years, deep molecular generative models have emerged as promising methods for de novo molecular design. Thanks to the rapid advance of deep learning techniques, deep learning architectures such as recurrent neural networks, variational autoencoders, and adversarial networks have been successfully employed for constructing generative models. Recently, quite a few metrics have been proposed to evaluate these deep generative models. However, many of these metrics cannot evaluate the chemical space coverage of sampled molecules. This work presents a novel and complementary metric for evaluating deep molecular generative models. The metric is based on the chemical space coverage of a reference dataset—GDB-13. The performance of seven different molecular generative models was compared by calculating what fraction of the structures, ring systems, and functional groups could be reproduced from the largely unseen reference set when using only a small fraction of GDB-13 for training. The results show that the performance of the generative models studied varies significantly using the benchmark metrics introduced herein, such that the generalization capabilities of the generative models can be clearly differentiated. In addition, the coverages of GDB-13 ring systems and functional groups were compared between the models. Our study provides a useful new metric that can be used for evaluating and comparing generative models.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
1秒前
香辣脆皮坤完成签到,获得积分10
1秒前
赘婿应助blingcmeng采纳,获得10
1秒前
小油菜发布了新的文献求助20
1秒前
2秒前
李李发布了新的文献求助10
2秒前
YanXT发布了新的文献求助30
3秒前
基拉发布了新的文献求助10
4秒前
5秒前
OIC发布了新的文献求助10
5秒前
6秒前
6秒前
7秒前
8秒前
10秒前
小铭发布了新的文献求助10
12秒前
一路生花完成签到,获得积分10
12秒前
欢喜的元蝶完成签到,获得积分10
13秒前
14秒前
温暖的天与完成签到 ,获得积分10
15秒前
坚强的初夏完成签到,获得积分10
16秒前
Hello应助英语六级采纳,获得10
17秒前
YanXT完成签到,获得积分10
17秒前
完美世界应助ZHI采纳,获得10
18秒前
不语发布了新的文献求助10
19秒前
19秒前
20秒前
叮叮叮铛完成签到,获得积分10
21秒前
Jasper应助基拉采纳,获得10
24秒前
25秒前
Alan发布了新的文献求助10
25秒前
25秒前
25秒前
26秒前
26秒前
不语完成签到,获得积分10
27秒前
wlscj举报lq求助涉嫌违规
27秒前
changping应助木子雨采纳,获得10
28秒前
贾明灵发布了新的文献求助10
28秒前
28秒前
高分求助中
Pipeline and riser loss of containment 2001 - 2020 (PARLOC 2020) 1000
哈工大泛函分析教案课件、“72小时速成泛函分析:从入门到入土.PDF”等 660
Theory of Dislocations (3rd ed.) 500
Comparing natural with chemical additive production 500
The Leucovorin Guide for Parents: Understanding Autism’s Folate 500
Phylogenetic study of the order Polydesmida (Myriapoda: Diplopoda) 500
A Manual for the Identification of Plant Seeds and Fruits : Second revised edition 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 内科学 生物化学 物理 计算机科学 纳米技术 遗传学 基因 复合材料 化学工程 物理化学 病理 催化作用 免疫学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 5218912
求助须知:如何正确求助?哪些是违规求助? 4392767
关于积分的说明 13677175
捐赠科研通 4255477
什么是DOI,文献DOI怎么找? 2334980
邀请新用户注册赠送积分活动 1332572
关于科研通互助平台的介绍 1286834