AlphaFold2-aware protein–DNA binding site prediction using graph transformer

计算机科学 图形 变压器 马修斯相关系数 DNA结合位点 计算生物学 机器学习 人工智能 数据挖掘 理论计算机科学 生物 基因 遗传学 工程类 电压 基因表达 电气工程 发起人 支持向量机
作者
Qianmu Yuan,Sheng Chen,Jiahua Rao,Shuangjia Zheng,Huiying Zhao,Yuedong Yang
出处
期刊:Briefings in Bioinformatics [Oxford University Press]
卷期号:23 (2) 被引量:43
标识
DOI:10.1093/bib/bbab564
摘要

Protein-DNA interactions play crucial roles in the biological systems, and identifying protein-DNA binding sites is the first step for mechanistic understanding of various biological activities (such as transcription and repair) and designing novel drugs. How to accurately identify DNA-binding residues from only protein sequence remains a challenging task. Currently, most existing sequence-based methods only consider contextual features of the sequential neighbors, which are limited to capture spatial information. Based on the recent breakthrough in protein structure prediction by AlphaFold2, we propose an accurate predictor, GraphSite, for identifying DNA-binding residues based on the structural models predicted by AlphaFold2. Here, we convert the binding site prediction problem into a graph node classification task and employ a transformer-based variant model to take the protein structural information into account. By leveraging predicted protein structures and graph transformer, GraphSite substantially improves over the latest sequence-based and structure-based methods. The algorithm is further confirmed on the independent test set of 181 proteins, where GraphSite surpasses the state-of-the-art structure-based method by 16.4% in area under the precision-recall curve and 11.2% in Matthews correlation coefficient, respectively. We provide the datasets, the predicted structures and the source codes along with the pre-trained models of GraphSite at https://github.com/biomed-AI/GraphSite. The GraphSite web server is freely available at https://biomed.nscc-gz.cn/apps/GraphSite.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
故里完成签到,获得积分10
刚刚
小二郎应助小卡啦采纳,获得30
刚刚
1秒前
天上人间完成签到,获得积分10
1秒前
2秒前
w_应助hjm采纳,获得10
3秒前
王辰北发布了新的文献求助10
5秒前
jason发布了新的文献求助10
6秒前
saber_panda发布了新的文献求助20
6秒前
6秒前
7秒前
yx发布了新的文献求助10
9秒前
无花果应助jiemy采纳,获得10
10秒前
112233发布了新的文献求助10
11秒前
Owen应助莉亚采纳,获得10
11秒前
00发布了新的文献求助10
13秒前
满意之玉发布了新的文献求助10
15秒前
16秒前
李琳赛发布了新的文献求助30
16秒前
17秒前
bubble完成签到,获得积分10
18秒前
18秒前
20秒前
放空的酸奶完成签到 ,获得积分10
20秒前
Qin发布了新的文献求助10
21秒前
TBOLY发布了新的文献求助10
21秒前
22秒前
郝好完成签到 ,获得积分10
23秒前
小卡啦发布了新的文献求助30
23秒前
故里发布了新的文献求助10
23秒前
英俊的大远完成签到,获得积分10
24秒前
25秒前
25秒前
莉亚发布了新的文献求助10
26秒前
28秒前
yx发布了新的文献求助10
29秒前
29秒前
bubble关注了科研通微信公众号
30秒前
Liu发布了新的文献求助10
30秒前
31秒前
高分求助中
Impact of Mitophagy-Related Genes on the Diagnosis and Development of Esophageal Squamous Cell Carcinoma via Single-Cell RNA-seq Analysis and Machine Learning Algorithms 2000
Die Elektra-Partitur von Richard Strauss : ein Lehrbuch für die Technik der dramatischen Komposition 1000
How to Create Beauty: De Lairesse on the Theory and Practice of Making Art 1000
Gerard de Lairesse : an artist between stage and studio 670
大平正芳: 「戦後保守」とは何か 550
LNG地下タンク躯体の構造性能照査指針 500
Cathodoluminescence and its Application to Geoscience 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3000753
求助须知:如何正确求助?哪些是违规求助? 2660659
关于积分的说明 7205936
捐赠科研通 2296528
什么是DOI,文献DOI怎么找? 1217704
科研通“疑难数据库(出版商)”最低求助积分说明 593864
版权声明 592943