AlphaFold2-aware protein–DNA binding site prediction using graph transformer

计算机科学 图形 变压器 马修斯相关系数 DNA结合位点 计算生物学 机器学习 人工智能 数据挖掘 理论计算机科学 生物 基因 遗传学 工程类 基因表达 发起人 电压 支持向量机 电气工程
作者
Qianmu Yuan,Sheng Chen,Jiahua Rao,Shuangjia Zheng,Huiying Zhao,Yuedong Yang
出处
期刊:Briefings in Bioinformatics [Oxford University Press]
卷期号:23 (2) 被引量:43
标识
DOI:10.1093/bib/bbab564
摘要

Protein-DNA interactions play crucial roles in the biological systems, and identifying protein-DNA binding sites is the first step for mechanistic understanding of various biological activities (such as transcription and repair) and designing novel drugs. How to accurately identify DNA-binding residues from only protein sequence remains a challenging task. Currently, most existing sequence-based methods only consider contextual features of the sequential neighbors, which are limited to capture spatial information. Based on the recent breakthrough in protein structure prediction by AlphaFold2, we propose an accurate predictor, GraphSite, for identifying DNA-binding residues based on the structural models predicted by AlphaFold2. Here, we convert the binding site prediction problem into a graph node classification task and employ a transformer-based variant model to take the protein structural information into account. By leveraging predicted protein structures and graph transformer, GraphSite substantially improves over the latest sequence-based and structure-based methods. The algorithm is further confirmed on the independent test set of 181 proteins, where GraphSite surpasses the state-of-the-art structure-based method by 16.4% in area under the precision-recall curve and 11.2% in Matthews correlation coefficient, respectively. We provide the datasets, the predicted structures and the source codes along with the pre-trained models of GraphSite at https://github.com/biomed-AI/GraphSite. The GraphSite web server is freely available at https://biomed.nscc-gz.cn/apps/GraphSite.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
微瑕完成签到,获得积分10
1秒前
wuyi完成签到,获得积分10
1秒前
东方宏发布了新的文献求助10
1秒前
1秒前
2秒前
dingbeicn完成签到,获得积分10
2秒前
Carson发布了新的文献求助10
3秒前
Shrine完成签到,获得积分10
3秒前
3秒前
NewMoon发布了新的文献求助30
3秒前
莫x莫完成签到 ,获得积分10
5秒前
5秒前
SS1025861完成签到,获得积分10
5秒前
lancydear发布了新的文献求助10
6秒前
小蓝完成签到 ,获得积分10
6秒前
晨昏蒙影完成签到 ,获得积分10
6秒前
12e关注了科研通微信公众号
7秒前
蛙蛙完成签到 ,获得积分10
8秒前
不灭钻石发布了新的文献求助10
8秒前
哇owao发布了新的文献求助10
8秒前
idiom完成签到 ,获得积分10
8秒前
MRzhu发布了新的文献求助10
8秒前
8秒前
Carson完成签到,获得积分10
9秒前
果冻完成签到 ,获得积分10
9秒前
Hello应助木卫二采纳,获得10
10秒前
all661完成签到,获得积分10
10秒前
浮游应助hull采纳,获得10
12秒前
kingmantj发布了新的文献求助30
12秒前
12秒前
Wang完成签到 ,获得积分10
13秒前
all661发布了新的文献求助10
13秒前
呆小仙发布了新的文献求助10
13秒前
完美世界应助NewMoon采纳,获得10
14秒前
参商完成签到,获得积分10
14秒前
15秒前
可恶啊完成签到,获得积分10
15秒前
共享精神应助Once采纳,获得10
15秒前
朱厚璁完成签到,获得积分10
16秒前
高分求助中
Signals, Systems, and Signal Processing 610
Annie Ernaux: De la perte au corps glorieux 600
Petrology and Plate Tectonics,2025 500
Moore's Clinically Oriented Anatomy 10th Edition 400
Direct and Iterative Linear System Solvers 400
Cardiopulmonary Bypass and Mechanical Support: Principles and Practice, Fifth Edition 400
Circular Polar Constellations Providing Continuous Single or Multiple Coverage Above a Specified Latitude 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6762776
求助须知:如何正确求助?哪些是违规求助? 8489357
关于积分的说明 18092513
捐赠科研通 6049801
什么是DOI,文献DOI怎么找? 3011369
邀请新用户注册赠送积分活动 1988111
关于科研通互助平台的介绍 1963321