Kernels for small molecules and the prediction of mutagenicity, toxicity and anti-cancer activity

成对比较 计算机科学 相似性(几何) 直方图 小分子 理论计算机科学 数据挖掘 机器学习 人工智能 生物 图像(数学) 遗传学
作者
S. Joshua Swamidass,Jonathan Chen,Jocelyne Bruand,P. Phung,Liva Ralaivola,Pierre Baldi
出处
期刊:Bioinformatics [Oxford University Press]
卷期号:21 (Suppl 1): i359-i368 被引量:188
标识
DOI:10.1093/bioinformatics/bti1055
摘要

Motivation: Small molecules play a fundamental role in organic chemistry and biology. They can be used to probe biological systems and to discover new drugs and other useful compounds. As increasing numbers of large datasets of small molecules become available, it is necessary to develop computational methods that can deal with molecules of variable size and structure and predict their physical, chemical and biological properties. Results: Here we develop several new classes of kernels for small molecules using their 1D, 2D and 3D representations. In 1D, we consider string kernels based on SMILES strings. In 2D, we introduce several similarity kernels based on conventional or generalized fingerprints. Generalized fingerprints are derived by counting in different ways subpaths contained in the graph of bonds, using depth-first searches. In 3D, we consider similarity measures between histograms of pairwise distances between atom classes. These kernels can be computed efficiently and are applied to problems of classification and prediction of mutagenicity, toxicity and anti-cancer activity on three publicly available datasets. The results derived using cross-validation methods are state-of-the-art. Tradeoffs between various kernels are briefly discussed. Availability: Datasets available from http://www.igb.uci.edu/servers/servers.html Contact:pfbaldi@ics.uci.edu

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
伊可发布了新的文献求助10
1秒前
Lzx111完成签到,获得积分10
1秒前
儒雅紫夏发布了新的文献求助10
1秒前
顾矜应助虚心傲丝采纳,获得10
1秒前
Lisa_Li_123发布了新的文献求助10
2秒前
2秒前
18922406869发布了新的文献求助100
3秒前
arcgen发布了新的文献求助10
4秒前
4秒前
领导范儿应助lvsehx采纳,获得10
4秒前
5秒前
快乐科研发布了新的文献求助10
5秒前
5秒前
linnnn完成签到,获得积分10
6秒前
6秒前
6秒前
xiaohuang完成签到,获得积分20
6秒前
keykey完成签到,获得积分10
7秒前
烟花应助ggb采纳,获得10
7秒前
ding应助scalar采纳,获得10
7秒前
打打应助谨慎的橘子采纳,获得50
8秒前
无聊的完成签到,获得积分10
8秒前
YwYzzZ发布了新的文献求助10
9秒前
Cynthia发布了新的文献求助10
9秒前
10秒前
sheh发布了新的文献求助10
10秒前
123给123的求助进行了留言
11秒前
一一应助yy采纳,获得30
11秒前
12秒前
新小pi完成签到,获得积分10
12秒前
12秒前
mr.pork发布了新的文献求助10
12秒前
13秒前
热情诗云完成签到,获得积分10
14秒前
春风柳上原完成签到 ,获得积分20
16秒前
HYUN完成签到,获得积分10
16秒前
16秒前
17秒前
18秒前
18秒前
高分求助中
The Data Economy: Tools and Applications 1000
Bayesian Models of Cognition:Reverse Engineering the Mind 800
Essentials of thematic analysis 700
A Dissection Guide & Atlas to the Rabbit 600
Внешняя политика КНР: о сущности внешнеполитического курса современного китайского руководства 500
Academia de Coimbra: 1537-1990: história, praxe, boémia e estudo, partidas e piadas, organismos académicos 500
Revolution und Konterrevolution in China [by A. Losowsky] 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3120530
求助须知:如何正确求助?哪些是违规求助? 2771150
关于积分的说明 7706625
捐赠科研通 2426370
什么是DOI,文献DOI怎么找? 1288511
科研通“疑难数据库(出版商)”最低求助积分说明 621036
版权声明 600069