Machine-Learning-Guided Cocrystal Prediction Based on Large Data Base

共晶 虚拟筛选 肌氨酸 化学 计算机科学 分子 从头算 药物发现 人工智能 组合化学 晶体结构预测 机器学习 氢键 有机化学 氨基酸 生物化学 甘氨酸
作者
Dingyan Wang,Zeen Yang,Bingqing Zhu,Xuefeng Mei,Xiaomin Luo
出处
期刊:Crystal Growth & Design [American Chemical Society]
卷期号:20 (10): 6610-6621 被引量:80
标识
DOI:10.1021/acs.cgd.0c00767
摘要

A machine-learning model trained on the whole Cambridge Structural Database was developed to assist high-throughput cocrystal screening. With only 2D structures taken as inputs, the probability of cocrystal formation is returned for two given molecules. All of the cocrystal records in the CSD were used as positive samples, while negative samples were constructed by randomly combining different molecules into chemical pairs. Our model showed a prediction ability comparable with that of a widely used ab initio method in a head-to-head comparison test. Both experimental and virtual cocrystal screening against captopril were conducted at the same time to further validate the model. Two cocrystals of captopril with l-proline and sarcosine were obtained and characterized by PXRD, DSC, and FT-IR. These two coformers were also successfully predicted by our model. These results suggest that the tool we developed can be used to effectively guide coformer selection in the discovery of new cocrystals.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
晚风完成签到 ,获得积分10
2秒前
卿莞尔发布了新的文献求助10
2秒前
帅帅发布了新的文献求助10
3秒前
dliu201304发布了新的文献求助10
6秒前
7秒前
科研通AI6.4应助zjz采纳,获得10
10秒前
大力的灵雁应助super chan采纳,获得10
10秒前
12秒前
zheng_chen发布了新的文献求助10
14秒前
15秒前
bylee发布了新的文献求助10
17秒前
凯子哥完成签到,获得积分10
18秒前
liu完成签到,获得积分10
21秒前
22秒前
XIAOJUhao关注了科研通微信公众号
23秒前
高挑的怜翠完成签到 ,获得积分10
24秒前
Destiny完成签到,获得积分10
24秒前
IF完成签到,获得积分10
27秒前
所所应助zheng_chen采纳,获得10
27秒前
卡夫卡完成签到,获得积分20
27秒前
FashionBoy应助dliu201304采纳,获得10
28秒前
29秒前
30秒前
有钱完成签到 ,获得积分10
30秒前
九月应助美美全力冲采纳,获得10
31秒前
31秒前
蝴蝶变成毛毛虫完成签到,获得积分10
33秒前
小宋发布了新的文献求助100
33秒前
Jasper应助等待的安露采纳,获得10
34秒前
肥猫啊平发布了新的文献求助10
35秒前
37秒前
dx199015完成签到,获得积分10
38秒前
xiaoju完成签到,获得积分20
38秒前
pluto应助白梓采纳,获得10
39秒前
40秒前
香菜完成签到,获得积分10
41秒前
大刘完成签到 ,获得积分10
41秒前
Hermione发布了新的文献求助10
43秒前
隐形曼青应助Nian采纳,获得10
43秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
PowerCascade: A Synthetic Dataset for Cascading Failure Analysis in Power Systems 2000
Various Faces of Animal Metaphor in English and Polish 800
Signals, Systems, and Signal Processing 610
Photodetectors: From Ultraviolet to Infrared 500
Diagnostic Performance of Preoperative Imaging-based Radiomics Models for Predicting Liver Metastases in Colorectal Cancer: A Systematic Review and Meta-analysis 500
On the Dragon Seas, a sailor's adventures in the far east 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6347883
求助须知:如何正确求助?哪些是违规求助? 8162741
关于积分的说明 17171404
捐赠科研通 5404115
什么是DOI,文献DOI怎么找? 2861637
邀请新用户注册赠送积分活动 1839438
关于科研通互助平台的介绍 1688741