Mitigating the missing-fragmentation problem in de novo peptide sequencing with a two-stage graph-based deep learning model

碎片(计算) 串联质谱法 计算机科学 深度学习 计算生物学 图形 循环神经网络 人工神经网络 人工智能 生物 化学 质谱法 生物化学 理论计算机科学 操作系统 色谱法
作者
Zeping Mao,Ruixue Zhang,Lei Xin,Ming Li
出处
期刊:Nature Machine Intelligence [Nature Portfolio]
卷期号:5 (11): 1250-1260 被引量:37
标识
DOI:10.1038/s42256-023-00738-x
摘要

Novel protein discovery and immunopeptidomics depend on highly sensitive de novo peptide sequencing with tandem mass spectrometry. Despite notable improvement using deep learning models, the missing-fragmentation problem remains an important hurdle that severely degrades the performance of de novo peptide sequencing. Here we reveal that in the process of peptide prediction, missing fragmentation results in the generation of incorrect amino acids within those regions and causes error accumulation thereafter. To tackle this problem, we propose GraphNovo, a two-stage de novo peptide-sequencing algorithm based on a graph neural network. GraphNovo focuses on finding the optimal path in the first stage to guide the sequence prediction in the second stage. Our experiments demonstrate that GraphNovo mitigates the effects of missing fragmentation and outperforms the state-of-the-art de novo peptide-sequencing algorithms. Identifying unknown peptides in tandem mass spectrometry is challenging as fragmentation of precursor peptides can be incomplete. Mao and colleagues present a method based on graph neural networks and a path-searching model to create more stable sequence predictions.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
1秒前
AndrEw完成签到,获得积分10
1秒前
CodeCraft应助菠萝采纳,获得10
1秒前
3秒前
3秒前
懒懒羊完成签到,获得积分10
4秒前
许小亮完成签到,获得积分10
4秒前
SJJ完成签到,获得积分20
5秒前
盈虚者完成签到,获得积分10
6秒前
Ljr123发布了新的文献求助10
7秒前
7秒前
8秒前
晴枫3648完成签到,获得积分10
8秒前
曹大壮发布了新的文献求助10
8秒前
序与海完成签到,获得积分10
9秒前
zp19877891完成签到,获得积分10
9秒前
Hushluo完成签到,获得积分10
10秒前
10秒前
如梦发布了新的文献求助10
11秒前
11秒前
11秒前
12秒前
沐雨篱边发布了新的文献求助10
12秒前
12秒前
菠萝发布了新的文献求助10
15秒前
Spine Lin发布了新的文献求助10
16秒前
Voskov发布了新的文献求助10
16秒前
伈X完成签到,获得积分10
17秒前
Lan发布了新的文献求助10
17秒前
heli发布了新的文献求助10
19秒前
kong发布了新的文献求助10
20秒前
伈X发布了新的文献求助10
20秒前
Spine Lin完成签到,获得积分10
20秒前
21秒前
21秒前
21秒前
fff5210发布了新的文献求助20
22秒前
24秒前
24秒前
Naloxone发布了新的文献求助10
25秒前
高分求助中
Principles of Economics, 11th Edition 10000
Prescott's Microbiology: 2026 Release ISE 10000
University Physics with Modern Physics, 16th edition 10000
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Environmental Leverage in Times of Climate Crisis: Product Standards, Carbon Border Measures and Preferential Trade Agreements 1000
Interactions of Vowel Quality and Prosody in East Slavic 1000
Erwählung und Berufung bei Paulus: Bedeutung, Entwicklung und Funktion einer Vorstellung in ihrem frühjüdischen und griechisch-römischen Kontext 850
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 内科学 物理 复合材料 催化作用 细胞生物学 无机化学 光电子学 物理化学 电极 基因
热门帖子
关注 科研通微信公众号,转发送积分 7190519
求助须知:如何正确求助?哪些是违规求助? 8827746
关于积分的说明 18637737
捐赠科研通 6824484
什么是DOI,文献DOI怎么找? 3175033
关于科研通互助平台的介绍 2326353
邀请新用户注册赠送积分活动 2149412