Fine-tuning of conditional Transformers improves in silico enzyme prediction and generation

生物信息学 计算生物学 变压器 计算机科学 化学 工程类 生物 电压 生物化学 电气工程 基因
作者
Marco Nicolini,Emanuele Saitto,Ruben Emilio Jimenez Franco,Emanuele Cavalleri,Aldo Javier Galeano Alfonso,Dario Malchiodi,Alberto Paccanaro,Peter N. Robinson,Elena Casiraghi,Giorgio Valentini
出处
期刊:Computational and structural biotechnology journal [Elsevier BV]
卷期号:27: 1318-1334
标识
DOI:10.1016/j.csbj.2025.03.037
摘要

We introduce Finenzyme, a Protein Language Model (PLM) that employs a multifaceted learning strategy based on transfer learning from a decoder-based Transformer, conditional learning using specific functional keywords, and fine-tuning for the in silico modeling of enzymes. Our experiments show that Finenzyme significantly enhances generalist PLMs like ProGen for the in silico prediction and generation of enzymes belonging to specific Enzyme Commission (EC) categories. Our in silico experiments demonstrate that Finenzyme generated sequences can diverge from natural ones, while retaining similar predicted tertiary structure, predicted functions and the active sites of their natural counterparts. We show that embedded representations of the generated sequences obtained from the embeddings computed by both Finenzyme and ESMFold closely resemble those of natural ones, thus making them suitable for downstream tasks, including e.g. EC classification. Clustering analysis based on the primary and predicted tertiary structure of sequences reveals that the generated enzymes form clusters that largely overlap with those of natural enzymes. These overall in silico validation experiments indicate that Finenzyme effectively captures the structural and functional properties of target enzymes, and can in perspective support targeted enzyme engineering tasks.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
搜集达人应助啦啦啦啦采纳,获得10
1秒前
orixero应助太阳啊采纳,获得10
2秒前
宇老师发布了新的文献求助10
5秒前
5秒前
田安平完成签到,获得积分10
6秒前
fffzy完成签到,获得积分10
7秒前
小小发布了新的文献求助10
7秒前
Ryan完成签到,获得积分10
7秒前
8秒前
wahaha完成签到,获得积分10
8秒前
太阳啊完成签到,获得积分10
9秒前
9秒前
方远锋完成签到,获得积分10
9秒前
燕子应助虚心广山采纳,获得10
9秒前
10秒前
10秒前
11秒前
宇老师完成签到,获得积分10
11秒前
黑椒HJ完成签到,获得积分10
11秒前
典雅白羊完成签到,获得积分10
11秒前
12秒前
sunshine发布了新的文献求助10
12秒前
13秒前
13秒前
wahaha发布了新的文献求助10
13秒前
Walden完成签到,获得积分10
14秒前
14秒前
王肄博发布了新的文献求助10
15秒前
15秒前
香蕉子骞完成签到 ,获得积分10
16秒前
16秒前
16秒前
17秒前
17秒前
Reborn应助guangyu采纳,获得10
19秒前
maomao完成签到,获得积分10
20秒前
打打应助Stevenlijiajun采纳,获得10
20秒前
20秒前
上官若男应助Stevenlijiajun采纳,获得10
20秒前
在水一方应助Stevenlijiajun采纳,获得10
20秒前
高分求助中
【此为提示信息,请勿应助】请按要求发布求助,避免被关 20000
Production Logging: Theoretical and Interpretive Elements 3000
CRC Handbook of Chemistry and Physics 104th edition 1000
Density Functional Theory: A Practical Introduction, 2nd Edition 840
J'AI COMBATTU POUR MAO // ANNA WANG 660
Izeltabart tapatansine - AdisInsight 600
Gay and Lesbian Asia 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3755384
求助须知:如何正确求助?哪些是违规求助? 3298445
关于积分的说明 10105664
捐赠科研通 3013093
什么是DOI,文献DOI怎么找? 1654979
邀请新用户注册赠送积分活动 789331
科研通“疑难数据库(出版商)”最低求助积分说明 753273