PepFormer: End-to-End Transformer-Based Siamese Network to Predict and Enhance Peptide Detectability Based on Sequence Only

判别式 人工智能 变压器 水准点(测量) 计算机科学 一般化 源代码 机器学习 端到端原则 化学 地理 大地测量学 电压 数学分析 物理 操作系统 量子力学 数学
作者
Hao Cheng,B. Dharma Rao,Lei Liu,Lizhen Cui,Guobao Xiao,Ran Su,Leyi Wei
出处
期刊:Analytical Chemistry [American Chemical Society]
卷期号:93 (16): 6481-6490 被引量:49
标识
DOI:10.1021/acs.analchem.1c00354
摘要

The detectability of peptides is fundamentally important in shotgun proteomics experiments. At present, there are many computational methods to predict the detectability of peptides based on sequential composition or physicochemical properties, but they all have various shortcomings. Here, we present PepFormer, a novel end-to-end Siamese network coupled with a hybrid architecture of a Transformer and gated recurrent units that is able to predict the peptide detectability based on peptide sequences only. Specially, we, for the first time, use contrastive learning and construct a new loss function for model training, greatly improving the generalization ability of our predictive model. Comparative results demonstrate that our model performs significantly better than state-of-the-art methods on benchmark data sets in two species (Homo sapiens and Mus musculus). To make the model more interpretable, we further investigate the embedded representations of peptide sequences automatically learnt from our model, and the visualization results indicate that our model can efficiently capture high-latent discriminative information, improving the predictive performance. In addition, our model shows a strong ability of cross-species transfer learning and adaptability, demonstrating that it has great potential in robust prediction of peptides detectability on different species. The source code of our proposed method can be found via https://github.com/WLYLab/PepFormer.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
向日葵完成签到,获得积分10
1秒前
gao完成签到 ,获得积分10
2秒前
小梦完成签到,获得积分10
2秒前
ghjghk发布了新的文献求助10
3秒前
一二完成签到,获得积分10
5秒前
LLLKJ完成签到,获得积分10
6秒前
lxcy0612完成签到,获得积分10
7秒前
zhangxin完成签到,获得积分10
8秒前
量子星尘发布了新的文献求助10
9秒前
晓风完成签到,获得积分10
9秒前
小点完成签到 ,获得积分10
9秒前
获野千完成签到 ,获得积分10
11秒前
鸽子完成签到 ,获得积分10
12秒前
13秒前
彭于彦祖应助科研通管家采纳,获得150
13秒前
彭于彦祖应助科研通管家采纳,获得50
13秒前
FashionBoy应助科研通管家采纳,获得10
13秒前
日天的马铃薯完成签到,获得积分10
13秒前
lit应助科研通管家采纳,获得10
13秒前
lit应助科研通管家采纳,获得10
13秒前
13秒前
我说我话完成签到 ,获得积分10
14秒前
16秒前
文龙完成签到 ,获得积分10
20秒前
20秒前
量子星尘发布了新的文献求助10
22秒前
Sindy完成签到,获得积分10
23秒前
一水独流完成签到,获得积分10
23秒前
火星上的羞花完成签到,获得积分10
23秒前
関电脑完成签到,获得积分10
23秒前
宝玉发布了新的文献求助10
27秒前
飘飘玲应助宝玉采纳,获得10
31秒前
量子星尘发布了新的文献求助10
32秒前
38秒前
世外完成签到,获得积分10
38秒前
克泷完成签到 ,获得积分10
41秒前
peng完成签到 ,获得积分10
42秒前
45秒前
包子牛奶完成签到,获得积分10
47秒前
47秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Cowries - A Guide to the Gastropod Family Cypraeidae 1200
Handbook of Milkfat Fractionation Technology and Application, by Kerry E. Kaylegian and Robert C. Lindsay, AOCS Press, 1995 1000
Nach dem Geist? 500
The Affinity Designer Manual - Version 2: A Step-by-Step Beginner's Guide 500
Affinity Designer Essentials: A Complete Guide to Vector Art: Your Ultimate Handbook for High-Quality Vector Graphics 500
Optimisation de cristallisation en solution de deux composés organiques en vue de leur purification 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 内科学 生物化学 物理 计算机科学 纳米技术 遗传学 基因 复合材料 化学工程 物理化学 病理 催化作用 免疫学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 5044644
求助须知:如何正确求助?哪些是违规求助? 4274226
关于积分的说明 13323416
捐赠科研通 4087927
什么是DOI,文献DOI怎么找? 2236588
邀请新用户注册赠送积分活动 1244008
关于科研通互助平台的介绍 1172033