DBP-CNN: Deep learning-based prediction of DNA-binding proteins by coupling discrete cosine transform with two-dimensional convolutional neural network

计算机科学 随机森林 人工神经网络 人工智能 卷积神经网络 特征提取 特征(语言学) 模式识别(心理学) 极限学习机 离散余弦变换 图像(数学) 语言学 哲学
作者
Omar Barukab,Farman Ali,Wajdi Alghamdi,Yoosef Bassam,Sher Afzal Khan
出处
期刊:Expert Systems With Applications [Elsevier BV]
卷期号:197: 116729-116729 被引量:31
标识
DOI:10.1016/j.eswa.2022.116729
摘要

To improve the prediction of DNA-binding Proteins (DBPs), this paper presents a deep learning-based method, named DBP-CNN. To efficiently extract the important features, we design a novel feature descriptor namely position-specific scoring matrix-tetra slices-discrete cosine transform (PSSM-TS-DCT). PSSM-TS-DCT explores the local features using tetra-slices notion with PSSM and captures decisive information by a compression scheme called DCT. The conventional feature descriptors such as DDE (dipeptide deviation from expected mean) and BiPSSM (bigram position-specific scoring matrix) are also used for feature extraction. The feature vectors of these feature descriptors are provided to RF (random forest), ERT (extremely randomized trees), XGB (eXtreme gradient boosting), and 2D CNN (two-dimensional convolutional neural network) classifiers. Our proposed feature descriptor (PSSM-TS-DCT) performs better than DDE and BiPSSM on all four classifiers. Similarly, among all classifiers, 2D CNN with PSSM-TS-DCT attains 2.80% and 0.92% higher accuracies than the recent predictor on both training and independent datasets, respectively. The experimental results show that our novel method (DBP-CNN) can predict DBPs more accurately than existing predictors in the literature.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
手可摘星辰不去高声语完成签到,获得积分10
6秒前
明朗完成签到 ,获得积分10
8秒前
慕青应助六六采纳,获得30
14秒前
LGH完成签到 ,获得积分10
16秒前
清水完成签到,获得积分10
17秒前
美满惜寒完成签到,获得积分10
17秒前
cityhunter7777完成签到,获得积分10
18秒前
Syan完成签到,获得积分10
18秒前
ElioHuang完成签到,获得积分0
18秒前
张浩林完成签到,获得积分10
19秒前
675完成签到,获得积分10
19秒前
prrrratt完成签到,获得积分10
19秒前
车访枫完成签到 ,获得积分10
19秒前
王jyk完成签到,获得积分10
20秒前
CGBIO完成签到,获得积分10
20秒前
qq完成签到,获得积分10
20秒前
朝夕之晖完成签到,获得积分10
21秒前
runtang完成签到,获得积分10
21秒前
ys1008完成签到,获得积分10
21秒前
阳光完成签到,获得积分10
21秒前
BMG完成签到,获得积分10
21秒前
Temperature完成签到,获得积分10
21秒前
呵呵哒完成签到,获得积分10
21秒前
tingting完成签到,获得积分10
21秒前
洋芋饭饭完成签到,获得积分10
22秒前
zwzw完成签到,获得积分10
22秒前
闪闪的音响完成签到 ,获得积分10
24秒前
jixiekaifa完成签到 ,获得积分10
27秒前
28秒前
六六发布了新的文献求助30
31秒前
31秒前
JJZ完成签到,获得积分10
36秒前
Ziang_Liu完成签到 ,获得积分10
38秒前
CJW完成签到 ,获得积分10
39秒前
Neko完成签到,获得积分0
42秒前
成熟完成签到,获得积分20
47秒前
小文完成签到 ,获得积分10
47秒前
落寞的枫叶完成签到 ,获得积分10
49秒前
孟啊啊完成签到 ,获得积分10
54秒前
CJY完成签到 ,获得积分10
1分钟前
高分求助中
Malcolm Fraser : a biography 680
Signals, Systems, and Signal Processing 610
天津市智库成果选编 600
Climate change and sports: Statistics report on climate change and sports 500
Forced degradation and stability indicating LC method for Letrozole: A stress testing guide 500
Organic Reactions Volume 118 400
A Foreign Missionary on the Long March: The Unpublished Memoirs of Arnolis Hayman of the China Inland Mission 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6459002
求助须知:如何正确求助?哪些是违规求助? 8268242
关于积分的说明 17621329
捐赠科研通 5528084
什么是DOI,文献DOI怎么找? 2905848
邀请新用户注册赠送积分活动 1882572
关于科研通互助平台的介绍 1727573