Data-Based Prediction of Redox Potentials via Introducing Chemical Features into the Transformer Architecture

氧化还原 变压器 建筑 计算机科学 生物系统 化学 组合化学 人工智能 有机化学 生物 电气工程 工程类 电压 艺术 视觉艺术
作者
Zhan Si,Deguang Liu,Wan Nie,Jingjing Hu,Wei Wang,Tingting Jiang,Haizhu Yu,Yao Fu
出处
期刊:Journal of Chemical Information and Modeling [American Chemical Society]
标识
DOI:10.1021/acs.jcim.4c01299
摘要

Rapid and accurate prediction of basic physicochemical parameters of molecules will greatly accelerate the target-orientated design of novel reactions and materials but has been long challenging. Herein, a chemical language model-based deep learning method, TransChem, has been developed for the prediction of redox potentials of organic molecules. Embedding an effective molecular characterization (combining spatial and electronic features), a nonlinear molecular messaging approach (Mol-Attention), and a perturbation learning method, TransChem, shows high accuracy in predicting the redox potential of organic radicals comprising over 100,000 data (R2 > 0.97, MAE <0.09 V) and is generalized to the smaller 2,1,3-benzothiadiazole data set (<3000 data points) and electron affinity data set (660 data) with low MAE of 0.07 V and 0.18 eV, respectively. In this context, a self-developed data set, i.e., the oxidation potential (OP) of a full-space disubstituted phenol data set (OPP-data set, total set: 74,529), has been predicted by TransChem with a high-throughput, and active learning strategy. The rapid and reliable prediction of OP could hopefully accelerate the screening of plausible reagents in highly selective cross-coupling of phenol derivatives. This study presents an important attempt to guide language modeling with chemical knowledge, while TransChem demonstrates state-of-the-art (SOTA) predictive performance on redox potential prediction benchmark data sets for its better understanding of molecular design and conformational relationships.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
火山上的鲍师傅完成签到,获得积分10
3秒前
4秒前
程哲瀚完成签到,获得积分10
6秒前
浮光完成签到,获得积分10
6秒前
小猛哥完成签到,获得积分10
6秒前
钰宁完成签到,获得积分10
7秒前
jiangcai完成签到,获得积分10
8秒前
dssouc发布了新的文献求助10
8秒前
呵呵呵呵完成签到,获得积分10
8秒前
JamesPei应助苹果发夹采纳,获得10
9秒前
小化化爱学习完成签到,获得积分10
9秒前
柳煜城完成签到,获得积分10
10秒前
负数完成签到,获得积分10
11秒前
shuzi发布了新的文献求助10
11秒前
12秒前
Brendan完成签到,获得积分10
12秒前
12秒前
ll2925203完成签到,获得积分10
12秒前
mcl关闭了mcl文献求助
12秒前
东耦完成签到,获得积分10
13秒前
13秒前
思源应助小猛哥采纳,获得10
13秒前
苹果小蜜蜂完成签到,获得积分10
14秒前
whyme完成签到,获得积分10
14秒前
lily完成签到 ,获得积分10
15秒前
Dragon完成签到 ,获得积分10
15秒前
yangzhang发布了新的文献求助10
17秒前
Bailan完成签到,获得积分10
18秒前
MY发布了新的文献求助10
18秒前
haohao完成签到,获得积分10
18秒前
布布完成签到,获得积分10
18秒前
朴素代芙完成签到,获得积分10
20秒前
zzzz完成签到,获得积分10
20秒前
科研小天才完成签到,获得积分10
21秒前
Bingtao_Lian完成签到 ,获得积分10
21秒前
酶来研去发布了新的文献求助10
21秒前
sometimesawake完成签到,获得积分10
21秒前
炼丹炉完成签到,获得积分10
21秒前
空城完成签到,获得积分10
22秒前
光亮的自行车完成签到,获得积分0
22秒前
高分求助中
The Mother of All Tableaux: Order, Equivalence, and Geometry in the Large-scale Structure of Optimality Theory 3000
Social Research Methods (4th Edition) by Maggie Walter (2019) 2390
A new approach to the extrapolation of accelerated life test data 1000
北师大毕业论文 基于可调谐半导体激光吸收光谱技术泄漏气体检测系统的研究 390
Phylogenetic study of the order Polydesmida (Myriapoda: Diplopoda) 370
Robot-supported joining of reinforcement textiles with one-sided sewing heads 360
Atlas of Interventional Pain Management 300
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 冶金 细胞生物学 免疫学
热门帖子
关注 科研通微信公众号,转发送积分 4008933
求助须知:如何正确求助?哪些是违规求助? 3548669
关于积分的说明 11299538
捐赠科研通 3283228
什么是DOI,文献DOI怎么找? 1810311
邀请新用户注册赠送积分活动 886034
科研通“疑难数据库(出版商)”最低求助积分说明 811259