Learning to Rank Peptide-Spectrum Matches Using Genetic Programming

秩(图论) 排名(信息检索) 计算机科学 支持向量机 功能(生物学) 人工智能 模式识别(心理学) 数据挖掘 计算生物学 机器学习 数学 生物 遗传学 生物化学 组合数学
作者
Samaneh Azari,Jun Zhang,Bing Xue,Lifeng Peng
标识
DOI:10.1109/cec.2019.8790049
摘要

The analysis of tandem mass spectrometry (MS/MS) proteomics data relies on automated methods that assign peptides to observed MS/MS spectra. Typically these methods return a list of candidate peptide-spectrum matches (PSMs), ranked according to a scoring function. Normally the highest-scoring candidate peptide is considered as the best match for each spectrum. However, these best matches do not necessary always indicate the true matches. Identifying a full-length correct peptide by peptide identification tools is crucial, and we do not want to assign a spectrum to the peptide which is not expressed in the given biological sample. Therefore in this paper, we present a new approach to improving the previous ordering/ranking of the PSMs, aiming at bringing the correct PSM for spectrum ahead of all the incorrect ones for the same spectrum. We develop a new method called GP-PSM-rank, which employs genetic programming (GP) to learn a ranking function by combining different feature functions that measure the quality of PSMs from different perspectives. We compare GP-PSM-rank with SVM-rank. The results show that GP-PSM-rank outperforms SVM-rank in terms of the number of identified peptides which are true matches. On a validation dataset with 120 spectra, the proposed method is used as the post processing step on the results of peptide identifications by two de novo sequencing algorithms. GP-PSM-rank improves the results of both de novo methods in terms of identifying the true matches.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
lyxxll完成签到,获得积分10
1秒前
闪闪的夜柳应助文件撤销了驳回
1秒前
Xavier完成签到 ,获得积分10
2秒前
keke完成签到 ,获得积分10
2秒前
3秒前
ling关注了科研通微信公众号
5秒前
6秒前
6秒前
想吃芝士荔枝烤鱼完成签到,获得积分10
6秒前
李爱国应助yunianan采纳,获得10
6秒前
飘逸钥匙关注了科研通微信公众号
8秒前
芬芬完成签到 ,获得积分10
8秒前
molihuakai应助小池采纳,获得10
8秒前
小札过完成签到,获得积分10
9秒前
深情安青应助淡淡的洋葱采纳,获得10
9秒前
在水一方应助Nike采纳,获得10
9秒前
Owen应助Nike采纳,获得10
9秒前
共享精神应助Nike采纳,获得10
9秒前
9秒前
orixero应助Nike采纳,获得10
9秒前
SciGPT应助Nike采纳,获得10
9秒前
万能图书馆应助Nike采纳,获得10
9秒前
希望天下0贩的0应助Nike采纳,获得10
9秒前
所所应助Nike采纳,获得10
9秒前
充电宝应助Nike采纳,获得10
9秒前
白鸽鸽发布了新的文献求助30
10秒前
雅思莫拉发布了新的文献求助10
11秒前
11秒前
王瑞媛发布了新的文献求助10
12秒前
12秒前
卢星彤完成签到 ,获得积分10
12秒前
云书完成签到,获得积分10
13秒前
光头强发布了新的文献求助10
14秒前
15秒前
Muddle发布了新的文献求助10
17秒前
酷波er应助文献求助采纳,获得10
17秒前
阿白发布了新的文献求助10
17秒前
Rich应助个性的觅双采纳,获得50
18秒前
yunianan发布了新的文献求助10
19秒前
饼干完成签到,获得积分10
19秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
The Cambridge History of China: Volume 4, Sui and T'ang China, 589–906 AD, Part Two 1500
Cowries - A Guide to the Gastropod Family Cypraeidae 1200
Quality by Design - An Indispensable Approach to Accelerate Biopharmaceutical Product Development 800
Pulse width control of a 3-phase inverter with non sinusoidal phase voltages 777
Signals, Systems, and Signal Processing 610
Research Methods for Applied Linguistics: A Practical Guide 600
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6400805
求助须知:如何正确求助?哪些是违规求助? 8217669
关于积分的说明 17414982
捐赠科研通 5453838
什么是DOI,文献DOI怎么找? 2882311
邀请新用户注册赠送积分活动 1858934
关于科研通互助平台的介绍 1700618