亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

PDNAPred: Interpretable prediction of protein-DNA binding sites based on pre-trained protein language models

计算生物学 自然语言处理 蛋白质结构预测 人工智能 计算机科学 生物 蛋白质结构 生物化学
作者
Lingrong Zhang,Taigang Liu
出处
期刊:International Journal of Biological Macromolecules [Elsevier]
卷期号:: 136147-136147 被引量:1
标识
DOI:10.1016/j.ijbiomac.2024.136147
摘要

Protein-DNA interactions play critical roles in various biological processes and are essential for drug discovery. However, traditional experimental methods are labor-intensive and unable to keep pace with the increasing volume of protein sequences, leading to a substantial number of proteins lacking DNA-binding annotations. Therefore, developing an efficient computational method to identify protein-DNA binding sites is crucial. Unfortunately, most existing computational methods rely on manually selected features or protein structure information, making these methods inapplicable to large-scale prediction tasks. In this study, we introduced PDNAPred, a sequence-based method that combines two pre-trained protein language models with a designed CNN-GRU network to identify DNA-binding sites. Additionally, to tackle the issue of imbalanced dataset samples, we employed focal loss. Our comprehensive experiments demonstrated that PDNAPred significantly improved the accuracy of DNA-binding site prediction, outperforming existing state-of-the-art sequence-based methods. Remarkably, PDNAPred also achieved results comparable to advanced structure-based methods. The designed CNN-GRU network enhances its capability to detect DNA-binding sites accurately. Furthermore, we validated the versatility of PDNAPred by training it on RNA-binding site datasets, showing its potential as a general framework for amino acid binding site prediction. Finally, we conducted model interpretability analysis to elucidate the reasons behind PDNAPred's outstanding performance.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
6秒前
kaginagain发布了新的文献求助10
9秒前
17秒前
科研通AI2S应助kaginagain采纳,获得10
57秒前
yhr完成签到 ,获得积分10
1分钟前
1分钟前
只如初完成签到,获得积分10
1分钟前
2分钟前
2分钟前
qqq发布了新的文献求助10
2分钟前
2分钟前
jokerhoney完成签到,获得积分10
2分钟前
2分钟前
青木完成签到 ,获得积分10
2分钟前
3分钟前
涂山发布了新的文献求助10
3分钟前
3分钟前
3分钟前
绝尘发布了新的文献求助10
3分钟前
4分钟前
Aliceq发布了新的文献求助10
4分钟前
涂山完成签到,获得积分10
4分钟前
sinan发布了新的文献求助10
4分钟前
sinan发布了新的文献求助10
5分钟前
无语的冰淇淋完成签到 ,获得积分10
6分钟前
完美的海完成签到 ,获得积分0
6分钟前
kaginagain发布了新的文献求助10
6分钟前
6分钟前
麦尔哈巴发布了新的文献求助10
7分钟前
Zhou应助美味肉蟹煲采纳,获得10
7分钟前
美味肉蟹煲完成签到,获得积分10
7分钟前
wangfaqing942完成签到 ,获得积分10
7分钟前
充电宝应助麦尔哈巴采纳,获得10
7分钟前
WXHL完成签到 ,获得积分10
9分钟前
星流xx完成签到 ,获得积分10
9分钟前
gy完成签到,获得积分10
9分钟前
坚强的小白菜关注了科研通微信公众号
9分钟前
击倒大树的风暴完成签到,获得积分10
10分钟前
10分钟前
oleskarabach发布了新的文献求助10
10分钟前
高分求助中
Earth System Geophysics 1000
Co-opetition under Endogenous Bargaining Power 666
Medicina di laboratorio. Logica e patologia clinica 600
Handbook of Marine Craft Hydrodynamics and Motion Control, 2nd Edition 500
Sarcolestes leedsi Lydekker, an ankylosaurian dinosaur from the Middle Jurassic of England 500
《关于整治突出dupin问题的实施意见》(厅字〔2019〕52号) 500
Language injustice and social equity in EMI policies in China 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3213132
求助须知:如何正确求助?哪些是违规求助? 2861929
关于积分的说明 8131215
捐赠科研通 2527854
什么是DOI,文献DOI怎么找? 1361909
科研通“疑难数据库(出版商)”最低求助积分说明 643529
邀请新用户注册赠送积分活动 615885