Modelling of ready biodegradability based on combined public and industrial data sources

背景(考古学) 计算机科学 领域(数学分析) 数据挖掘 集合(抽象数据类型) 公共领域 预测建模 生化工程 机器学习 工程类 数学 哲学 古生物学 数学分析 神学 程序设计语言 生物
作者
Filippo Lunghini,Gilles Marcou,Philippe Gantzer,Philippe Azam,Dragos Horvath,Erik Van Miert,Alexandre Varnek
出处
期刊:Sar and Qsar in Environmental Research [Informa]
卷期号:31 (3): 171-186 被引量:16
标识
DOI:10.1080/1062936x.2019.1697360
摘要

The European Registration, Evaluation, Authorization and Restriction of Chemical Substances Regulation, requires marketed chemicals to be evaluated for Ready Biodegradability (RB), considering in silico prediction as valid alternative to experimental testing. However, currently available models may not be relevant to predict compounds of industrial interest, due to accuracy and applicability domain restriction issues. In this work, we present a new and extended RB dataset (2830 compounds), issued by the merging of several public data sources. It was used to train classification models, which were externally validated and benchmarked against already-existing tools on a set of 316 compounds coming from the industrial context. New models showed good performances in terms of predictive power (Balance Accuracy (BA) = 0.74–0.79) and data coverage (83–91%). The Generative Topographic Mapping approach identified several chemotypes and structural motifs unique to the industrial dataset, highlighting for which chemical classes currently available models may have less reliable predictions. Finally, public and industrial data were merged into global dataset containing 3146 compounds. This is the biggest dataset reported in the literature so far, covering some chemotypes absent in the public data. Thus, predictive model developed on the Global dataset has larger applicability domain than the existing ones.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
量子星尘发布了新的文献求助10
2秒前
今后应助奥里给医学生采纳,获得10
3秒前
魔幻的妖丽完成签到 ,获得积分0
4秒前
shuan完成签到,获得积分10
8秒前
吴晨曦完成签到,获得积分10
9秒前
量子星尘发布了新的文献求助10
12秒前
落叶完成签到 ,获得积分0
13秒前
研友_Zrlk7L完成签到,获得积分10
14秒前
丽莫莫完成签到,获得积分10
19秒前
丁丁发布了新的文献求助10
19秒前
安静严青完成签到 ,获得积分10
23秒前
量子星尘发布了新的文献求助10
26秒前
科科通通完成签到,获得积分10
26秒前
量子星尘发布了新的文献求助10
27秒前
28秒前
大猫不吃鱼完成签到,获得积分10
28秒前
29秒前
成就大白菜真实的钥匙完成签到 ,获得积分10
31秒前
草莓熊1215完成签到 ,获得积分10
32秒前
江湖完成签到,获得积分10
35秒前
东日完成签到,获得积分10
37秒前
sunnyqqz完成签到,获得积分10
38秒前
刚子完成签到 ,获得积分10
39秒前
葡紫明完成签到 ,获得积分10
39秒前
岁月如歌完成签到 ,获得积分0
41秒前
排骨年糕完成签到 ,获得积分10
42秒前
longmad完成签到,获得积分10
43秒前
小小咸鱼完成签到 ,获得积分10
44秒前
陈富贵完成签到 ,获得积分10
46秒前
魄魄olm发布了新的文献求助10
47秒前
小男孩完成签到,获得积分10
48秒前
王皮皮完成签到 ,获得积分10
48秒前
繁荣的安白完成签到 ,获得积分10
49秒前
qiaorankongling完成签到 ,获得积分10
49秒前
49秒前
52秒前
七七完成签到 ,获得积分10
52秒前
量子星尘发布了新的文献求助10
54秒前
量子星尘发布了新的文献求助10
55秒前
Ao_Jiang完成签到,获得积分10
58秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Digitizing Enlightenment: Digital Humanities and the Transformation of Eighteenth-Century Studies 1000
Translanguaging in Action in English-Medium Classrooms: A Resource Book for Teachers 700
Real World Research, 5th Edition 680
Qualitative Data Analysis with NVivo By Jenine Beekhuyzen, Pat Bazeley · 2024 660
Handbook of Migration, International Relations and Security in Asia 555
Between high and low : a chronology of the early Hellenistic period 500
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 计算机科学 有机化学 物理 生物化学 纳米技术 复合材料 内科学 化学工程 人工智能 催化作用 遗传学 数学 基因 量子力学 物理化学
热门帖子
关注 科研通微信公众号,转发送积分 5671581
求助须知:如何正确求助?哪些是违规求助? 4920068
关于积分的说明 15135054
捐赠科研通 4830410
什么是DOI,文献DOI怎么找? 2587061
邀请新用户注册赠送积分活动 1540682
关于科研通互助平台的介绍 1498986