TULIP: A transformer-based unsupervised language model for interacting peptides and T cell receptors that generalizes to unseen epitopes

表位 计算机科学 人工智能 T细胞受体 变压器 无监督学习 语言模型 经济短缺 机器学习 计算生物学 T细胞 生物 免疫系统 抗原 免疫学 电压 语言学 哲学 物理 量子力学 政府(语言学)
作者
Barthelemy Meynard-Piganeau,Christoph Feinauer,Martin Weigt,Aleksandra M. Walczak,Thierry Mora
出处
期刊:Proceedings of the National Academy of Sciences of the United States of America [Proceedings of the National Academy of Sciences]
卷期号:121 (24) 被引量:6
标识
DOI:10.1073/pnas.2316401121
摘要

The accurate prediction of binding between T cell receptors (TCR) and their cognate epitopes is key to understanding the adaptive immune response and developing immunotherapies. Current methods face two significant limitations: the shortage of comprehensive high-quality data and the bias introduced by the selection of the negative training data commonly used in the supervised learning approaches. We propose a method, Transformer-based Unsupervised Language model for Interacting Peptides and T cell receptors (TULIP), that addresses both limitations by leveraging incomplete data and unsupervised learning and using the transformer architecture of language models. Our model is flexible and integrates all possible data sources, regardless of their quality or completeness. We demonstrate the existence of a bias introduced by the sampling procedure used in previous supervised approaches, emphasizing the need for an unsupervised approach. TULIP recognizes the specific TCRs binding an epitope, performing well on unseen epitopes. Our model outperforms state-of-the-art models and offers a promising direction for the development of more accurate TCR epitope recognition models.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
1秒前
ssnha完成签到 ,获得积分10
2秒前
何小熊发布了新的文献求助10
6秒前
一只东北鸟完成签到 ,获得积分10
8秒前
隐形曼青应助ty采纳,获得30
12秒前
今后应助何小熊采纳,获得10
13秒前
14秒前
打打应助梦璃采纳,获得10
15秒前
zhq完成签到,获得积分20
20秒前
23秒前
24秒前
24秒前
脑洞疼应助有风的晴天采纳,获得10
27秒前
梦璃发布了新的文献求助10
28秒前
劝儿发布了新的文献求助30
29秒前
30秒前
雍雍完成签到 ,获得积分10
32秒前
007完成签到 ,获得积分20
33秒前
iu完成签到,获得积分10
34秒前
35秒前
莫离发布了新的文献求助10
36秒前
twist完成签到,获得积分10
36秒前
37秒前
38秒前
白夜完成签到 ,获得积分10
38秒前
li完成签到 ,获得积分10
38秒前
小马甲应助佐佐采纳,获得10
42秒前
ZYN完成签到,获得积分10
43秒前
杏仁小饼干完成签到,获得积分10
44秒前
小孙孙完成签到,获得积分10
46秒前
47秒前
jinxingyue完成签到,获得积分10
50秒前
Yanki完成签到,获得积分10
52秒前
52秒前
52秒前
54秒前
55秒前
hahah完成签到,获得积分10
56秒前
jinxingyue发布了新的文献求助10
57秒前
小孙孙发布了新的文献求助10
58秒前
高分求助中
Production Logging: Theoretical and Interpretive Elements 2000
Very-high-order BVD Schemes Using β-variable THINC Method 1200
中国荞麦品种志 1000
BIOLOGY OF NON-CHORDATES 1000
Autoregulatory progressive resistance exercise: linear versus a velocity-based flexible model 550
The Collected Works of Jeremy Bentham: Rights, Representation, and Reform: Nonsense upon Stilts and Other Writings on the French Revolution 320
Discourse, Identities and Genres in Corporate Communication 300
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 细胞生物学 免疫学 冶金
热门帖子
关注 科研通微信公众号,转发送积分 3359852
求助须知:如何正确求助?哪些是违规求助? 2982410
关于积分的说明 8703731
捐赠科研通 2664107
什么是DOI,文献DOI怎么找? 1458854
科研通“疑难数据库(出版商)”最低求助积分说明 675293
邀请新用户注册赠送积分活动 666410