PreHom-PCLM: protein remote homology detection by combing motifs and protein cubic language model

计算机科学 判别式 同源建模 同源(生物学) 持久同源性 计算生物学 结构母题 人工智能 序列母题 蛋白质结构 模式识别(心理学) 生物 遗传学 算法 基因 生物化学
作者
Jiangyi Shao,Qi Zhang,Ke Yan,Yihe Pang
出处
期刊:Briefings in Bioinformatics [Oxford University Press]
卷期号:24 (6)
标识
DOI:10.1093/bib/bbad347
摘要

Abstract Protein remote homology detection is essential for structure prediction, function prediction, disease mechanism understanding, etc. The remote homology relationship depends on multiple protein properties, such as structural information and local sequence patterns. Previous studies have shown the challenges for predicting remote homology relationship by protein features at sequence level (e.g. position-specific score matrix). Protein motifs have been used in structure and function analysis due to their unique sequence patterns and implied structural information. Therefore, designing a usable architecture to fuse multiple protein properties based on motifs is urgently needed to improve protein remote homology detection performance. To make full use of the characteristics of motifs, we employed the language model called the protein cubic language model (PCLM). It combines multiple properties by constructing a motif-based neural network. Based on the PCLM, we proposed a predictor called PreHom-PCLM by extracting and fusing multiple motif features for protein remote homology detection. PreHom-PCLM outperforms the other state-of-the-art methods on the test set and independent test set. Experimental results further prove the effectiveness of multiple features fused by PreHom-PCLM for remote homology detection. Furthermore, the protein features derived from the PreHom-PCLM show strong discriminative power for proteins from different structural classes in the high-dimensional space. Availability and Implementation: http://bliulab.net/PreHom-PCLM.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
胖大海发布了新的文献求助30
刚刚
lalala发布了新的文献求助10
刚刚
坦率白萱完成签到,获得积分10
刚刚
十号信封完成签到,获得积分10
刚刚
有点懒发布了新的文献求助30
1秒前
1秒前
哈哈哈发布了新的文献求助10
2秒前
zhiqing完成签到,获得积分10
2秒前
大模型应助糖果罐子采纳,获得10
2秒前
轮回1奇点发布了新的文献求助10
2秒前
橙子完成签到,获得积分20
2秒前
旧梦完成签到,获得积分20
3秒前
天天快乐应助跳跃的土豆采纳,获得10
3秒前
3秒前
英姑应助Eric采纳,获得10
4秒前
粟粟发布了新的文献求助10
4秒前
4秒前
浮生发布了新的文献求助100
4秒前
4秒前
5秒前
HX发布了新的文献求助10
5秒前
cuckoo完成签到,获得积分10
5秒前
5秒前
坦率的邑发布了新的文献求助10
5秒前
6秒前
香蕉觅云应助rocky采纳,获得10
6秒前
李奕林完成签到 ,获得积分10
6秒前
思源应助彩色的惜寒采纳,获得10
6秒前
wxy完成签到,获得积分10
6秒前
7秒前
7秒前
哈哈哈哈哈完成签到,获得积分10
7秒前
研友_LJaXX8发布了新的文献求助10
7秒前
7秒前
幻想完成签到,获得积分10
8秒前
02完成签到,获得积分10
8秒前
草莓熊完成签到,获得积分10
8秒前
8秒前
小马甲应助tt采纳,获得10
8秒前
9秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Introduction to Helicopter and Tiltrotor Flight Simulation, Second Edition 2500
卤化钙钛矿人工突触的研究 2000
Malcolm Fraser : a biography 700
Signals, Systems, and Signal Processing 610
Software that combines deep learning,3D reconstruction and CFD to analyze the state of carotid arteries from ultrasound imaging 600
Bounds for Statistical Estimation in Semiparametric Models 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6500214
求助须知:如何正确求助?哪些是违规求助? 8295449
关于积分的说明 17703019
捐赠科研通 5596783
什么是DOI,文献DOI怎么找? 2918239
邀请新用户注册赠送积分活动 1895340
关于科研通互助平台的介绍 1756222