PairK: Pairwise k‐mer alignment for quantifying protein motif conservation in disordered regions

主题(音乐) 成对比较 结构母题 保守序列 计算生物学 生物 化学 进化生物学 物理 遗传学 肽序列 计算机科学 生物化学 人工智能 基因 声学
作者
Jackson C. Halpin,Amy E. Keating
出处
期刊:Protein Science [Wiley]
卷期号:34 (1)
标识
DOI:10.1002/pro.70004
摘要

Abstract Protein–protein interactions are often mediated by a modular peptide recognition domain binding to a short linear motif (SLiM) in the disordered region of another protein. To understand the features of SLiMs that are important for binding and to identify motif instances that are important for biological function, it is useful to examine the evolutionary conservation of motifs across homologous proteins. However, the intrinsically disordered regions (IDRs) in which SLiMs reside evolve rapidly. Consequently, multiple sequence alignment (MSA) of IDRs often misaligns SLiMs and underestimates their conservation. We present PairK (pairwise k‐mer alignment), an MSA‐free method to align and quantify the relative local conservation of subsequences within an IDR. Lacking a ground truth for conservation, we tested PairK on the task of distinguishing biologically important motif instances from background motifs, under the assumption that biologically important motifs are more conserved. The method outperforms both standard MSA‐based conservation scores and a modern LLM‐based conservation score predictor. PairK can quantify conservation over wider phylogenetic distances than MSAs, indicating that some SLiMs are more conserved than MSA‐based metrics imply. PairK is available as an open‐source python package at https://github.com/jacksonh1/pairk . It is designed to be easily adapted for use with other SLiM tools and for diverse applications.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
mi发布了新的文献求助10
刚刚
1秒前
顺利毕业完成签到 ,获得积分10
1秒前
GGZ发布了新的文献求助10
2秒前
笑笑发布了新的文献求助10
2秒前
轻松致远完成签到 ,获得积分10
2秒前
2秒前
现实的曼荷给现实的曼荷的求助进行了留言
2秒前
沈随便完成签到,获得积分10
3秒前
3秒前
3秒前
风中的海雪完成签到,获得积分10
4秒前
CucRuotThua完成签到,获得积分10
4秒前
QQ完成签到,获得积分10
4秒前
这个论文非写不可完成签到,获得积分10
4秒前
5秒前
ZZZpp发布了新的文献求助10
5秒前
5秒前
易伊澤发布了新的文献求助10
5秒前
饱满小兔子完成签到,获得积分10
6秒前
6秒前
共享精神应助phz采纳,获得10
7秒前
喵了个咪完成签到 ,获得积分10
7秒前
科研通AI5应助俭朴夜雪采纳,获得10
7秒前
7秒前
頑皮燕姿完成签到,获得积分10
7秒前
7秒前
丁德乐可发布了新的文献求助10
8秒前
Minkslion完成签到,获得积分10
8秒前
於松完成签到,获得积分10
8秒前
8秒前
yyyy发布了新的文献求助10
9秒前
稳重无剑完成签到,获得积分10
10秒前
wuha完成签到,获得积分10
10秒前
10秒前
欢喜从霜完成签到,获得积分10
11秒前
Orange应助LiShin采纳,获得10
11秒前
11秒前
欣慰友梅完成签到,获得积分10
11秒前
高分求助中
Continuum Thermodynamics and Material Modelling 3000
Production Logging: Theoretical and Interpretive Elements 2700
Social media impact on athlete mental health: #RealityCheck 1020
Ensartinib (Ensacove) for Non-Small Cell Lung Cancer 1000
Unseen Mendieta: The Unpublished Works of Ana Mendieta 1000
Bacterial collagenases and their clinical applications 800
El viaje de una vida: Memorias de María Lecea 800
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 量子力学 光电子学 冶金
热门帖子
关注 科研通微信公众号,转发送积分 3527723
求助须知:如何正确求助?哪些是违规求助? 3107826
关于积分的说明 9286663
捐赠科研通 2805577
什么是DOI,文献DOI怎么找? 1539998
邀请新用户注册赠送积分活动 716878
科研通“疑难数据库(出版商)”最低求助积分说明 709762