PseDNA‐Pro: DNA‐Binding Protein Identification by Combining Chou’s PseAAC and Physicochemical Distance Transformation

伪氨基酸组成 支持向量机 蛋白质测序 转化(遗传学) 水准点(测量) 计算机科学 人工智能 计算生物学 序列(生物学) 特征向量 特征(语言学) 蛋白质法 DNA DNA测序 机器学习 模式识别(心理学) 肽序列 序列分析 氨基酸 生物 生物化学 基因 语言学 哲学 大地测量学 二肽 地理
作者
Bin Liu,Jinghao Xu,Shixi Fan,Ruifeng Xu,Jiyun Zhou,Xiaolong Wang
出处
期刊:Molecular Informatics [Wiley]
卷期号:34 (1): 8-17 被引量:157
标识
DOI:10.1002/minf.201400025
摘要

Identification of DNA-binding proteins is an important problem in biomedical research as DNA-binding proteins are crucial for various cellular processes. Currently, the machine learning methods achieve the-state-of-the-art performance with different features. A key step to improve the performance of these methods is to find a suitable representation of proteins. In this study, we proposed a feature vector composed of three kinds of sequence-based features, including overall amino acid composition, pseudo amino acid composition (PseAAC) proposed by Chou and physicochemical distance transformation. These features not only consider the sequence composition of proteins, but also incorporate the sequence-order information of amino acids in proteins. The feature vectors were fed into Support Vector Machine (SVM) for DNA-binding protein identification. The proposed method is called PseDNA-Pro. Experiments on stringent benchmark datasets and independent test datasets by using the Jackknife test showed that PseDNA-Pro can achieve an accuracy of higher than 80 %, outperforming several state-of-the-art methods, including DNAbinder, DNA-Prot, and iDNA-Prot. These results indicate that the combination of various features for DNA-binding protein prediction is a suitable approach, and the sequence-order information among residues in proteins is relative for discrimination. For practical applications, a web-server of PseDNA-Pro was established, which is available from http://bioinformatics.hitsz.edu.cn/PseDNA-Pro/.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
深海不言完成签到 ,获得积分10
1秒前
叶夜南完成签到 ,获得积分10
1秒前
量子星尘发布了新的文献求助10
2秒前
cdercder应助科研通管家采纳,获得20
2秒前
大模型应助科研通管家采纳,获得10
2秒前
Jasper应助科研通管家采纳,获得10
2秒前
3秒前
3秒前
香蕉觅云应助科研通管家采纳,获得10
3秒前
昏睡的访云完成签到 ,获得积分10
3秒前
大个应助科研通管家采纳,获得10
3秒前
田様应助科研通管家采纳,获得10
3秒前
可爱的函函应助木野狐采纳,获得30
3秒前
5秒前
5秒前
xrrrr完成签到 ,获得积分10
5秒前
酷酷的乌龟完成签到 ,获得积分10
6秒前
7秒前
吴兰田完成签到,获得积分10
7秒前
香蕉觅云应助闲闲采纳,获得10
9秒前
11秒前
量子星尘发布了新的文献求助10
12秒前
14秒前
苏源智完成签到,获得积分10
14秒前
fz1完成签到 ,获得积分10
14秒前
笨蛋美女完成签到 ,获得积分10
17秒前
yn完成签到 ,获得积分10
17秒前
一只想做科研的狗完成签到,获得积分10
18秒前
量子星尘发布了新的文献求助10
19秒前
奋斗完成签到 ,获得积分10
20秒前
20秒前
抓个小孩完成签到 ,获得积分10
21秒前
21秒前
皮皮团完成签到 ,获得积分10
23秒前
24秒前
24秒前
lnscan完成签到 ,获得积分10
25秒前
你好明天完成签到 ,获得积分10
25秒前
哦哦完成签到,获得积分10
25秒前
Candice发布了新的文献求助30
26秒前
高分求助中
Production Logging: Theoretical and Interpretive Elements 2700
Neuromuscular and Electrodiagnostic Medicine Board Review 1000
Statistical Methods for the Social Sciences, Global Edition, 6th edition 600
こんなに痛いのにどうして「なんでもない」と医者にいわれてしまうのでしょうか 510
The Insulin Resistance Epidemic: Uncovering the Root Cause of Chronic Disease  500
Walter Gilbert: Selected Works 500
An Annotated Checklist of Dinosaur Species by Continent 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3662431
求助须知:如何正确求助?哪些是违规求助? 3223253
关于积分的说明 9750555
捐赠科研通 2933042
什么是DOI,文献DOI怎么找? 1605896
邀请新用户注册赠送积分活动 758208
科研通“疑难数据库(出版商)”最低求助积分说明 734743