Image2InChI: Automated Molecular Optical Image Recognition

编码器 人工智能 计算机科学 特征(语言学) 子序列 模式识别(心理学) 图像(数学) 数学 有界函数 语言学 操作系统 数学分析 哲学
作者
Dazhou Li,Xin Xu,Jia-heng Pan,Wei Gao,Shi-rui Zhang
出处
期刊:Journal of Chemical Information and Modeling [American Chemical Society]
卷期号:64 (9): 3640-3649 被引量:1
标识
DOI:10.1021/acs.jcim.3c02082
摘要

The accurate identification and analysis of chemical structures in molecular images are prerequisites of artificial intelligence for drug discovery. It is important to efficiently and automatically convert molecular images into machine-readable representations. Therefore, in this paper, we propose an automated molecular optical image recognition model based on deep learning, called Image2InChI. Additionally, the proposed Image2InChI introduces a novel feature fusion network with attention to integrate image patch and InChI prediction. The improved SwinTransformer as an encoder and the Transformer Decoder as a decoder with patch embedding are applied to predict the image features for the corresponding InChI. The experimental results showed that the Image2InChI model achieves an accuracy of InChI (InChI acc) of 99.8%, a Morgan FP of 94.1%, an accuracy of maximum common structures (MCS acc) of 94.8%, and an accuracy of longest common subsequence (LCS acc) of 96.2%. The experiments demonstrated that the proposed Image2InChI model improves the accuracy and efficiency of molecular image recognition and provided a valuable reference about optical chemical structure recognition for InChI.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
zzz应助细腻的灵槐采纳,获得30
刚刚
隐形曼青应助asbc采纳,获得10
刚刚
高大乌龟发布了新的文献求助10
刚刚
英姑应助阿桐慕采纳,获得10
刚刚
Owen应助哈哈哈哈采纳,获得10
1秒前
wyh798完成签到,获得积分10
1秒前
斯文败类应助Danyang采纳,获得10
1秒前
1秒前
ZFX完成签到 ,获得积分10
1秒前
李慧珍完成签到,获得积分10
1秒前
被划分发布了新的文献求助10
2秒前
来杯拿铁完成签到,获得积分10
3秒前
奋斗笑珊发布了新的文献求助10
3秒前
香蕉觅云应助高大乌龟采纳,获得10
3秒前
3秒前
4秒前
沉静笑蓝完成签到,获得积分10
4秒前
4秒前
momo6完成签到 ,获得积分10
4秒前
Hello应助fx_ll2000采纳,获得10
4秒前
4秒前
田様应助巴拉巴拉采纳,获得10
4秒前
4秒前
大个应助Litrain采纳,获得10
5秒前
努力的xl完成签到,获得积分10
5秒前
星辰大海应助友好的千凡采纳,获得10
5秒前
7秒前
7秒前
nnnnn发布了新的文献求助10
7秒前
7秒前
Zenia发布了新的文献求助10
7秒前
张丫丫发布了新的文献求助10
7秒前
maz123456发布了新的文献求助10
8秒前
8秒前
清脆画板发布了新的文献求助10
9秒前
9秒前
外向夏天完成签到,获得积分10
9秒前
Tanxaio发布了新的文献求助10
9秒前
完美世界应助wzy采纳,获得10
9秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Cronologia da história de Macau 5000
Merrill's Atlas of Radiographic Positioning and Procedures - 3-Volume Set, 16th Edition 2000
Matrix Methods in Data Mining and Pattern Recognition 510
Interactions of Vowel Quality and Prosody in East Slavic 500
Vander's Renal Physiology第10版 500
Virus-like particles empower RNAi for effective control of a Coleopteran pest 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 内科学 物理 复合材料 催化作用 细胞生物学 无机化学 光电子学 物理化学 电极 基因
热门帖子
关注 科研通微信公众号,转发送积分 7072954
求助须知:如何正确求助?哪些是违规求助? 8733630
关于积分的说明 18481543
捐赠科研通 6608353
什么是DOI,文献DOI怎么找? 3128884
关于科研通互助平台的介绍 2227055
邀请新用户注册赠送积分活动 2103995