MolPipeline: A Python Package for Processing Molecules with RDKit in Scikit-learn

Python(编程语言) 计算机科学 R包 程序设计语言
作者
Jochen Sieg,Christian Feldmann,Jennifer Hemmerich,Conrad Stork,Frederik Sandfort,Philipp Eiden,Miriam Mathea
出处
期刊:Journal of Chemical Information and Modeling [American Chemical Society]
标识
DOI:10.1021/acs.jcim.4c00863
摘要

The open-source package scikit-learn provides various machine learning algorithms and data processing tools, including the Pipeline class, which allows users to prepend custom data transformation steps to the machine learning model. We introduce the MolPipeline package, which extends this concept to cheminformatics by wrapping standard RDKit functionality, such as reading and writing SMILES strings or calculating molecular descriptors from a molecule object. We aimed to build an easy-to-use Python package to create completely automated end-to-end pipelines that scale to large data sets. Particular emphasis was put on handling erroneous instances, where resolution would require manual intervention in default pipelines. MolPipeline provides the building blocks to enable seamless integration of common cheminformatics tasks within scikit-learn's pipeline framework, such as scaffold splits and molecular standardization, making pipeline building easily adaptable to diverse project requirements.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
刚刚
3秒前
睡觉做大梦完成签到 ,获得积分10
5秒前
zhoujiahui发布了新的文献求助10
7秒前
7秒前
7秒前
自觉士萧发布了新的文献求助10
8秒前
希瓜西米露完成签到,获得积分10
9秒前
一二发布了新的文献求助10
9秒前
不配.应助奋斗的从凝采纳,获得20
10秒前
10秒前
gaobowang完成签到,获得积分10
10秒前
陈小青完成签到 ,获得积分10
12秒前
14秒前
Ava应助小小斌采纳,获得10
15秒前
16秒前
16秒前
19秒前
Venus发布了新的文献求助10
20秒前
20秒前
小李发布了新的文献求助10
21秒前
Midsummer完成签到,获得积分10
21秒前
21秒前
liux98完成签到,获得积分10
22秒前
共享精神应助一二采纳,获得10
22秒前
白映完成签到,获得积分10
22秒前
饼子完成签到 ,获得积分10
23秒前
24秒前
24秒前
25秒前
25秒前
艺术家脾气完成签到,获得积分10
26秒前
wenxian发布了新的文献求助10
26秒前
小鱼完成签到,获得积分10
27秒前
淘宝叮咚发布了新的文献求助10
27秒前
百变小数完成签到,获得积分10
28秒前
29秒前
淘宝叮咚发布了新的文献求助10
29秒前
淘宝叮咚发布了新的文献求助10
29秒前
高分求助中
Sustainability in Tides Chemistry 2800
The Young builders of New china : the visit of the delegation of the WFDY to the Chinese People's Republic 1000
Rechtsphilosophie 1000
Bayesian Models of Cognition:Reverse Engineering the Mind 888
Le dégorgement réflexe des Acridiens 800
Defense against predation 800
Very-high-order BVD Schemes Using β-variable THINC Method 568
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3134988
求助须知:如何正确求助?哪些是违规求助? 2785963
关于积分的说明 7774538
捐赠科研通 2441779
什么是DOI,文献DOI怎么找? 1298177
科研通“疑难数据库(出版商)”最低求助积分说明 625088
版权声明 600825