An explainable language model for antibody specificity prediction using curated influenza hemagglutinin antibodies

血凝素(流感) 抗体 表位 序列(生物学) 计算生物学 病毒学 生物 免疫学 遗传学
作者
Yiquan Wang,Huibin Lv,Ruipeng Lei,Yuen-Hei Yeung,Ivana R. Shen,Danbi Choi,Qi Wen Teo,Timothy J.C. Tan,Akshita B. Gopal,Xin Chen,Claire Graham,Nicholas C. Wu
标识
DOI:10.1101/2023.09.11.557288
摘要

Despite decades of antibody research, it remains challenging to predict the specificity of an antibody solely based on its sequence. Two major obstacles are the lack of appropriate models and inaccessibility of datasets for model training. In this study, we curated a dataset of >5,000 influenza hemagglutinin (HA) antibodies by mining research publications and patents, which revealed many distinct sequence features between antibodies to HA head and stem domains. We then leveraged this dataset to develop a lightweight memory B cell language model (mBLM) for sequence-based antibody specificity prediction. Model explainability analysis showed that mBLM captured key sequence motifs of HA stem antibodies. Additionally, by applying mBLM to HA antibodies with unknown epitopes, we discovered and experimentally validated many HA stem antibodies. Overall, this study not only advances our molecular understanding of antibody response to influenza virus, but also provides an invaluable resource for applying deep learning to antibody research.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
酷波er应助薛定谔的猫采纳,获得10
刚刚
科研通AI2S应助zyjllz采纳,获得10
3秒前
自横发布了新的文献求助10
4秒前
7秒前
9秒前
张秋雨发布了新的文献求助10
9秒前
10秒前
852应助恶恶么v采纳,获得10
10秒前
orange发布了新的文献求助10
12秒前
12秒前
xj完成签到 ,获得积分10
13秒前
JY发布了新的文献求助10
14秒前
研友_VZG7GZ应助yiding采纳,获得10
15秒前
15秒前
充电宝应助军军问问张采纳,获得10
18秒前
刘梦杰应助香蕉子骞采纳,获得20
19秒前
19秒前
20秒前
21秒前
22秒前
飘逸的麦片关注了科研通微信公众号
23秒前
感动代荷发布了新的文献求助10
23秒前
Junehe完成签到,获得积分10
25秒前
JamesPei应助武状元采纳,获得10
26秒前
梦琪完成签到,获得积分10
26秒前
26秒前
ClarkLee发布了新的文献求助30
27秒前
聪明的泡面完成签到 ,获得积分10
28秒前
28秒前
enen发布了新的文献求助10
29秒前
orange完成签到,获得积分10
29秒前
29秒前
小蘑菇应助陆小果采纳,获得10
30秒前
32秒前
梦琪发布了新的文献求助10
33秒前
机智的从霜完成签到 ,获得积分10
36秒前
科研通AI2S应助隔壁的镇长采纳,获得10
37秒前
Bryn_Wang完成签到,获得积分10
37秒前
38秒前
38秒前
高分求助中
Evolution 10000
Sustainability in Tides Chemistry 2800
юрские динозавры восточного забайкалья 800
English Wealden Fossils 700
A new species of Coccus (Homoptera: Coccoidea) from Malawi 500
A new species of Velataspis (Hemiptera Coccoidea Diaspididae) from tea in Assam 500
Diagnostic immunohistochemistry : theranostic and genomic applications 6th Edition 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3155908
求助须知:如何正确求助?哪些是违规求助? 2807136
关于积分的说明 7871997
捐赠科研通 2465497
什么是DOI,文献DOI怎么找? 1312260
科研通“疑难数据库(出版商)”最低求助积分说明 629958
版权声明 601905