Machine learning-assisted data filtering and QSAR models for prediction of chemical acute toxicity on rat and mouse

数量结构-活动关系 化学毒性 急性毒性 机器学习 毒性 计算机科学 人工智能 计算生物学 生物 化学 有机化学
作者
Tao Bo,Yaohui Lin,Jinglong Han,Zhineng Hao,Jingfu Liu
出处
期刊:Journal of Hazardous Materials [Elsevier BV]
卷期号:452: 131344-131344 被引量:19
标识
DOI:10.1016/j.jhazmat.2023.131344
摘要

Machine learning (ML) methods provide a new opportunity to build quantitative structure-activity relationship (QSAR) models for predicting chemicals’ toxicity based on large toxicity data sets, but they are limited in insufficient model robustness due to poor data set quality for chemicals with certain structures. To address this issue and improve model robustness, we built a large data set on rat oral acute toxicity for thousands of chemicals, then used ML to filter chemicals favorable for regression models (CFRM). In comparison to chemicals not favorable for regression models (CNRM), CFRM accounted for 67% of chemicals in the original data set, and had a higher structural similarity and a smaller toxicity distribution in 2–4 log10 (mg/kg). The performance of established regression models for CFRM was greatly improved, with root-mean-square deviations (RMSE) in the range of 0.45–0.48 log10 (mg/kg). Classification models were built for CNRM using all chemicals in the original data set, and the area under receiver operating characteristic (AUROC) reached 0.75–0.76. The proposed strategy was successfully applied to a mouse oral acute data set, yielding RMSE and AUROC in the range of 0.36–0.38 log10 (mg/kg) and 0.79, respectively.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
Ava应助菠萝吹雪采纳,获得10
1秒前
Forward发布了新的文献求助30
1秒前
看我表演发布了新的文献求助10
2秒前
完美世界应助渐殇雨采纳,获得10
2秒前
2秒前
华国锋应助云墨采纳,获得20
2秒前
搜集达人应助hhdr采纳,获得10
3秒前
无敌吴硕完成签到,获得积分10
3秒前
3秒前
4秒前
量子星尘发布了新的文献求助50
4秒前
5秒前
章鱼发布了新的文献求助10
5秒前
6秒前
酷bile完成签到,获得积分20
6秒前
7秒前
HMX完成签到,获得积分10
7秒前
Zx_1993应助Forward采纳,获得100
8秒前
莫晓岚发布了新的文献求助50
8秒前
8秒前
8秒前
爱喝冰可乐完成签到,获得积分10
9秒前
9秒前
上官若男应助DS采纳,获得10
9秒前
星落枕畔发布了新的文献求助10
10秒前
11秒前
麦候发布了新的文献求助10
12秒前
木子木子李完成签到,获得积分10
12秒前
西西发布了新的文献求助10
12秒前
干净的烧鹅完成签到,获得积分10
13秒前
SciGPT应助yeung采纳,获得10
14秒前
量子星尘发布了新的文献求助50
14秒前
15秒前
15秒前
萌宁发布了新的文献求助10
15秒前
在水一方应助ckk采纳,获得10
15秒前
所所应助章鱼采纳,获得10
16秒前
夕雨嘘完成签到,获得积分10
16秒前
爆米花应助云墨采纳,获得10
17秒前
18秒前
高分求助中
Comprehensive Toxicology Fourth Edition 24000
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
LRZ Gitlab附件(3D Matching of TerraSAR-X Derived Ground Control Points to Mobile Mapping Data 附件) 2000
World Nuclear Fuel Report: Global Scenarios for Demand and Supply Availability 2025-2040 800
The Social Work Ethics Casebook(2nd,Frederic G. R) 600
Lloyd's Register of Shipping's Approach to the Control of Incidents of Brittle Fracture in Ship Structures 500
AASHTO LRFD Bridge Design Specifications (10th Edition) with 2025 Errata 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 内科学 生物化学 物理 计算机科学 纳米技术 遗传学 基因 复合材料 化学工程 物理化学 病理 催化作用 免疫学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 5124448
求助须知:如何正确求助?哪些是违规求助? 4328721
关于积分的说明 13488255
捐赠科研通 4163099
什么是DOI,文献DOI怎么找? 2282182
邀请新用户注册赠送积分活动 1283377
关于科研通互助平台的介绍 1222607