已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

Deciphering the Language of Protein-DNA Interactions: A Deep Learning Approach Combining Contextual Embeddings and Multi-Scale Sequence Modeling

计算机科学 深度学习 人工智能 序列(生物学) 卷积神经网络 水准点(测量) 机器学习 代表(政治) 计算生物学 蛋白质测序 生物 肽序列 遗传学 基因 大地测量学 政治 政治学 法学 地理
作者
Yuchen Liu,Yi-Jing Lin,Yan-Yun Chang,Cheng-Che Chuang,Yu‐Yen Ou
出处
期刊:Journal of Molecular Biology [Elsevier]
卷期号:436 (22): 168769-168769
标识
DOI:10.1016/j.jmb.2024.168769
摘要

Deciphering the mechanisms governing protein-DNA interactions is crucial for understanding key cellular processes and disease pathways. In this work, we present a powerful deep learning approach that significantly advances the computational prediction of DNA-interacting residues from protein sequences. Our method leverages the rich contextual representations learned by pre-trained protein language models, such as ProtTrans, to capture intrinsic biochemical properties and sequence motifs indicative of DNA binding sites. We then integrate these contextual embeddings with a multi-window convolutional neural network architecture, which scans across the sequence at varying window sizes to effectively identify both local and global binding patterns. Comprehensive evaluation on curated benchmark datasets demonstrates the remarkable performance of our approach, achieving an area under the ROC curve (AUC) of 0.89 - a substantial improvement over previous state-of-the-art sequence-based predictors. This showcases the immense potential of pairing advanced representation learning and deep neural network designs for uncovering the complex syntax governing protein-DNA interactions directly from primary sequences. Our work not only provides a robust computational tool for characterizing DNA-binding mechanisms, but also highlights the transformative opportunities at the intersection of language modeling, deep learning, and protein sequence analysis. The publicly available code and data further facilitate broader adoption and continued development of these techniques for accelerating mechanistic insights into vital biological processes and disease pathways. In addition, the code and data for this work are available at https://github.com/B1607/DIRP.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
三水完成签到,获得积分10
刚刚
赘婿应助李浅墨采纳,获得10
刚刚
figshare完成签到,获得积分10
3秒前
zz完成签到,获得积分10
4秒前
5秒前
5秒前
颖果发布了新的文献求助10
5秒前
Hello应助初级黄金矿工采纳,获得10
6秒前
......发布了新的文献求助10
6秒前
6秒前
6秒前
单纯的乌冬面应助852采纳,获得10
8秒前
Michstabe发布了新的文献求助10
9秒前
hajy发布了新的文献求助10
12秒前
12秒前
阳阳发布了新的文献求助10
12秒前
李浅墨发布了新的文献求助10
12秒前
希望天下0贩的0应助......采纳,获得10
12秒前
Hiraeth完成签到 ,获得积分10
13秒前
fev123完成签到,获得积分10
14秒前
yourkit完成签到 ,获得积分10
15秒前
玩命的海冬完成签到 ,获得积分20
15秒前
16秒前
SciGPT应助soulcard采纳,获得50
18秒前
细雨带风吹完成签到,获得积分10
18秒前
科目三应助hajy采纳,获得10
18秒前
21秒前
起风了发布了新的文献求助10
21秒前
羊加橙发布了新的文献求助10
22秒前
丘比特应助zjcbk985采纳,获得10
22秒前
廖紊完成签到,获得积分10
23秒前
25秒前
刘柑橘完成签到,获得积分10
28秒前
haiqi发布了新的文献求助10
29秒前
科研通AI2S应助暴躁的板栗采纳,获得10
30秒前
大大小小发布了新的文献求助10
30秒前
33秒前
哈哈哈哈应助初雪平寒采纳,获得10
34秒前
35秒前
36秒前
高分求助中
Continuum Thermodynamics and Material Modelling 3000
Production Logging: Theoretical and Interpretive Elements 2700
Mechanistic Modeling of Gas-Liquid Two-Phase Flow in Pipes 2500
Structural Load Modelling and Combination for Performance and Safety Evaluation 1000
Conference Record, IAS Annual Meeting 1977 610
電気学会論文誌D(産業応用部門誌), 141 巻, 11 号 510
Virulence Mechanisms of Plant-Pathogenic Bacteria 500
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 量子力学 光电子学 冶金
热门帖子
关注 科研通微信公众号,转发送积分 3561680
求助须知:如何正确求助?哪些是违规求助? 3135271
关于积分的说明 9411778
捐赠科研通 2835787
什么是DOI,文献DOI怎么找? 1558642
邀请新用户注册赠送积分活动 728413
科研通“疑难数据库(出版商)”最低求助积分说明 716806