Data-Based Prediction of Redox Potentials via Introducing Chemical Features into the Transformer Architecture

氧化还原 变压器 建筑 计算机科学 生物系统 化学 无机化学 生物 电气工程 工程类 电压 艺术 视觉艺术
作者
Zhan Si,Deguang Liu,Wan Nie,Jingjing Hu,Chen Wang,Tingting Jiang,Haizhu Yu,Yao Fu
出处
期刊:Journal of Chemical Information and Modeling [American Chemical Society]
卷期号:64 (22): 8453-8463
标识
DOI:10.1021/acs.jcim.4c01299
摘要

Rapid and accurate prediction of basic physicochemical parameters of molecules will greatly accelerate the target-orientated design of novel reactions and materials but has been long challenging. Herein, a chemical language model-based deep learning method, TransChem, has been developed for the prediction of redox potentials of organic molecules. Embedding an effective molecular characterization (combining spatial and electronic features), a nonlinear molecular messaging approach (Mol-Attention), and a perturbation learning method, TransChem, shows high accuracy in predicting the redox potential of organic radicals comprising over 100,000 data (R2 > 0.97, MAE <0.09 V) and is generalized to the smaller 2,1,3-benzothiadiazole data set (<3000 data points) and electron affinity data set (660 data) with low MAE of 0.07 V and 0.18 eV, respectively. In this context, a self-developed data set, i.e., the oxidation potential (OP) of a full-space disubstituted phenol data set (OPP-data set, total set: 74,529), has been predicted by TransChem with a high-throughput, and active learning strategy. The rapid and reliable prediction of OP could hopefully accelerate the screening of plausible reagents in highly selective cross-coupling of phenol derivatives. This study presents an important attempt to guide language modeling with chemical knowledge, while TransChem demonstrates state-of-the-art (SOTA) predictive performance on redox potential prediction benchmark data sets for its better understanding of molecular design and conformational relationships.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
咕噜咕噜完成签到,获得积分10
1秒前
2秒前
背后尔安完成签到,获得积分10
2秒前
绿豆冰完成签到,获得积分10
4秒前
pep完成签到 ,获得积分10
4秒前
7秒前
王乐康完成签到,获得积分10
8秒前
9秒前
10秒前
LYChou发布了新的文献求助10
11秒前
fuan完成签到,获得积分10
12秒前
14秒前
14秒前
尧尧发布了新的文献求助10
15秒前
亲爱的安德烈完成签到,获得积分10
18秒前
可可奇发布了新的文献求助10
19秒前
20秒前
老仙翁发布了新的文献求助200
21秒前
HK完成签到,获得积分10
21秒前
幽默沛山完成签到 ,获得积分10
21秒前
Ava应助碧蓝的河马采纳,获得10
25秒前
满意的冰凡完成签到,获得积分10
26秒前
uu完成签到,获得积分10
26秒前
寻123发布了新的文献求助10
26秒前
流沙完成签到,获得积分10
26秒前
Yang完成签到,获得积分10
27秒前
28秒前
桐桐应助xh采纳,获得10
29秒前
wsyiming完成签到,获得积分10
31秒前
满意的青寒完成签到 ,获得积分10
33秒前
34秒前
华仔应助刻苦的元灵采纳,获得10
36秒前
TheSail完成签到,获得积分10
36秒前
量子星尘发布了新的文献求助10
36秒前
向日葵完成签到,获得积分10
36秒前
37秒前
zyshao完成签到,获得积分10
38秒前
寻123完成签到,获得积分10
40秒前
香蕉觅云应助LYChou采纳,获得10
41秒前
含蓄怀蕊完成签到,获得积分10
42秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
人脑智能与人工智能 1000
King Tyrant 720
Silicon in Organic, Organometallic, and Polymer Chemistry 500
Principles of Plasma Discharges and Materials Processing, 3rd Edition 400
Pharmacology for Chemists: Drug Discovery in Context 400
El poder y la palabra: prensa y poder político en las dictaduras : el régimen de Franco ante la prensa y el periodismo 400
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 计算机科学 有机化学 物理 生物化学 纳米技术 复合材料 内科学 化学工程 人工智能 催化作用 遗传学 数学 基因 量子力学 物理化学
热门帖子
关注 科研通微信公众号,转发送积分 5604031
求助须知:如何正确求助?哪些是违规求助? 4688850
关于积分的说明 14856729
捐赠科研通 4696120
什么是DOI,文献DOI怎么找? 2541105
邀请新用户注册赠送积分活动 1507256
关于科研通互助平台的介绍 1471832