Identifying molecular functional groups of organic compounds by deep learning of NMR data

人工智能 采样(信号处理) 支持向量机 模式识别(心理学) 超参数 特征(语言学) 一般化 人工神经网络 机器学习 数据集 原始数据 化学 计算机科学 数学 滤波器(信号处理) 数学分析 哲学 语言学 程序设计语言 计算机视觉
作者
Chongcan Li,Yong Cong,Weihua Deng
出处
期刊:Magnetic Resonance in Chemistry [Wiley]
卷期号:60 (11): 1061-1069 被引量:8
标识
DOI:10.1002/mrc.5292
摘要

We preprocess the raw nuclear magnetic resonance (NMR) spectrum and extract key features by using two different methodologies, called equidistant sampling and peak sampling for subsequent substructure pattern recognition. We also provide a strategy to address the imbalance issue frequently encountered in statistical modeling of NMR data set and establish two conventional support vector machine (SVM) and K-nearest neighbor (KNN) models to assess the capability of two feature selections, respectively. Our results in this study show that the models using the selected features of peak sampling outperform those using equidistant sampling. Then we build the recurrent neural network (RNN) model trained by data collected from peak sampling. Furthermore, we illustrate the easier optimization of hyperparameters and the better generalization ability of the RNN deep learning model by detailed comparison with traditional machine learning SVM and KNN models.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
1秒前
海人发布了新的文献求助20
1秒前
1秒前
2秒前
NexusExplorer应助忧郁问寒采纳,获得30
2秒前
2秒前
SONG完成签到,获得积分10
4秒前
哭泣的幼蓉完成签到 ,获得积分10
4秒前
梁婷发布了新的文献求助10
5秒前
苹果映菱完成签到,获得积分10
6秒前
。。。。。。完成签到,获得积分10
7秒前
浮华乱世完成签到 ,获得积分10
10秒前
小蘑菇应助Jason-1024采纳,获得10
10秒前
土豆晴完成签到,获得积分10
11秒前
12秒前
13秒前
Orange应助梁婷采纳,获得10
13秒前
alooof发布了新的文献求助30
15秒前
芽衣完成签到 ,获得积分10
16秒前
学不动完成签到 ,获得积分10
17秒前
caixukun完成签到 ,获得积分10
17秒前
seventonight2完成签到,获得积分10
17秒前
氯吡格蕾发布了新的文献求助10
18秒前
18秒前
liuce0307完成签到,获得积分10
19秒前
19秒前
唯有一个心完成签到 ,获得积分10
20秒前
Darknewnew完成签到,获得积分10
20秒前
MHCL完成签到 ,获得积分10
21秒前
阳炎完成签到,获得积分10
22秒前
yaoyao应助why采纳,获得10
23秒前
zhuzhu完成签到,获得积分10
23秒前
23秒前
粗心的含莲完成签到,获得积分10
23秒前
哎哟喂发布了新的文献求助20
23秒前
吃花生酱的猫完成签到,获得积分10
24秒前
子寒完成签到,获得积分10
24秒前
晓先森完成签到,获得积分10
25秒前
qi-keyan完成签到 ,获得积分10
25秒前
邵翎365发布了新的文献求助10
27秒前
高分求助中
Effect of reactor temperature on FCC yield 2000
Production Logging: Theoretical and Interpretive Elements 1500
Very-high-order BVD Schemes Using β-variable THINC Method 1000
PraxisRatgeber: Mantiden: Faszinierende Lauerjäger 800
Uncertainty Quantification: Theory, Implementation, and Applications, Second Edition 800
錢鍾書楊絳親友書札 600
A new species of Coccus (Homoptera: Coccoidea) from Malawi 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3288526
求助须知:如何正确求助?哪些是违规求助? 2925909
关于积分的说明 8423799
捐赠科研通 2596928
什么是DOI,文献DOI怎么找? 1416795
科研通“疑难数据库(出版商)”最低求助积分说明 659507
邀请新用户注册赠送积分活动 641889