Optimized representations and maximal information in proteins

序列(生物学) 计算机科学 折叠(DSP实现) 结构线形 回路建模 蛋白质结构 算法 肽序列 序列比对 生物系统 理论计算机科学 计算生物学 化学 蛋白质结构预测 生物 生物化学 工程类 基因 电气工程
作者
Armando D. Solis,S. Rackovsky
出处
期刊:Proteins [Wiley]
卷期号:38 (2): 149-164 被引量:69
标识
DOI:10.1002/(sici)1097-0134(20000201)38:2<149::aid-prot4>3.0.co;2-#
摘要

In an effort to quantify loss of information in the processing of protein bioinformatic data, we examine how representations of amino acid sequence and backbone conformation affect the quantity of accessible structural information from local sequence. We propose a method to extract the maximum amount of peptide backbone structural information available in local sequence fragments, given a finite structural data set. Using methods of information theory, we develop an unbiased measure of local structural information that gauges changes in structural distributions when different representations of secondary structure and local sequence are used. We find that the manner in which backbone structure is represented affects the amount and quality of structural information that may be extracted from local sequence. Representations based on virtual bonds capture more structural information from local sequence than a three-state assignment scheme (helix/strand/loop). Furthermore, we find that amino acids show significant kinship with respect to the backbone structural information they carry, so that a collapse of the amino acid alphabet can be accomplished without severely affecting the amount of extractable information. This strategy is critical in optimizing the utility of a limited database of experimentally solved protein structures. Finally, we discuss the similarities within and differences between groups of amino acids in their roles in the local folding code and recognize specific amino acids critical in the formation of local structure.

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
科研通AI5应助张立敏采纳,获得10
1秒前
1秒前
2秒前
铁甲小宝完成签到,获得积分10
2秒前
77完成签到,获得积分10
2秒前
SallyLuo完成签到,获得积分10
2秒前
3秒前
fdawn完成签到,获得积分10
3秒前
旺仔糖完成签到,获得积分20
4秒前
上官若男应助闹心采纳,获得10
5秒前
量子星尘发布了新的文献求助150
5秒前
大米发布了新的文献求助30
5秒前
秋风暖暖发布了新的文献求助10
6秒前
爆米花应助萧萧萧采纳,获得10
7秒前
微笑不可完成签到 ,获得积分10
7秒前
带着太阳去旅行完成签到,获得积分20
7秒前
千日粉发布了新的文献求助10
8秒前
8秒前
edtaa完成签到,获得积分10
9秒前
天天开心完成签到,获得积分10
9秒前
漱泉枕石发布了新的文献求助10
9秒前
9秒前
10秒前
11秒前
xu完成签到,获得积分20
11秒前
bob完成签到,获得积分10
14秒前
14秒前
田様应助鲤鱼烙采纳,获得10
15秒前
Sea_U应助Sylvie采纳,获得10
15秒前
张立敏发布了新的文献求助10
16秒前
淼队发布了新的文献求助10
16秒前
共享精神应助千日粉采纳,获得10
17秒前
长情萤发布了新的文献求助10
17秒前
17秒前
WIK发布了新的文献求助20
20秒前
20秒前
KBRS完成签到,获得积分10
20秒前
暮倦完成签到,获得积分20
21秒前
21秒前
量子星尘发布了新的文献求助10
21秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Acute Mountain Sickness 2000
Cowries - A Guide to the Gastropod Family Cypraeidae 1200
Handbook of Milkfat Fractionation Technology and Application, by Kerry E. Kaylegian and Robert C. Lindsay, AOCS Press, 1995 1000
Why Neuroscience Matters in the Classroom 500
The Affinity Designer Manual - Version 2: A Step-by-Step Beginner's Guide 500
Affinity Designer Essentials: A Complete Guide to Vector Art: Your Ultimate Handbook for High-Quality Vector Graphics 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 内科学 生物化学 物理 计算机科学 纳米技术 遗传学 基因 复合材料 化学工程 物理化学 病理 催化作用 免疫学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 5048792
求助须知:如何正确求助?哪些是违规求助? 4277060
关于积分的说明 13332258
捐赠科研通 4091605
什么是DOI,文献DOI怎么找? 2239138
邀请新用户注册赠送积分活动 1246031
关于科研通互助平台的介绍 1174599