亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

sOCP: a framework predicting smORF coding potential based on TIS and in-frame features and effectively applied in the human genome

计算机科学 过度拟合 计算生物学 基因组 生物信息学 人类基因组 人工智能 机器学习 数据挖掘 生物 遗传学 基因 人工神经网络
作者
Zhao Peng,Jiaqiang Li,Yingjun Ma,Cuihong Wan
出处
期刊:Briefings in Bioinformatics [Oxford University Press]
卷期号:25 (3)
标识
DOI:10.1093/bib/bbae147
摘要

Abstract Small open reading frames (smORFs) have been acknowledged to play various roles on essential biological pathways and affect human beings from diabetes to tumorigenesis. Predicting smORFs in silico is quite a prerequisite for processing the omics data. Here, we proposed the smORF-coding-potential-predicting framework, sOCP, which provides functions to construct a model for predicting novel smORFs in some species. The sOCP model constructed in human was based on in-frame features and the nucleotide bias around the start codon, and the small feature subset was proved to be competent enough and avoid overfitting problems for complicated models. It showed more advanced prediction metrics than previous methods and could correlate closely with experimental evidence in a heterogeneous dataset. The model was applied to Rattus norvegicus and exhibited satisfactory performance. We then scanned smORFs with ATG and non-ATG start codons from the human genome and generated a database containing about a million novel smORFs with coding potential. Around 72 000 smORFs are located on the lncRNA regions of the genome. The smORF-encoded peptides may be involved in biological pathways rare for canonical proteins, including glucocorticoid catabolic process and the prokaryotic defense system. Our work provides a model and database for human smORF investigation and a convenient tool for further smORF prediction in other species.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
xiaolizi完成签到,获得积分10
22秒前
派大星爱学习完成签到 ,获得积分10
47秒前
yshj完成签到 ,获得积分10
49秒前
1分钟前
breeze完成签到,获得积分10
1分钟前
1分钟前
情书完成签到 ,获得积分10
1分钟前
sugar发布了新的文献求助10
1分钟前
sugar完成签到,获得积分10
1分钟前
风轻云淡发布了新的文献求助10
1分钟前
伽古拉40k完成签到,获得积分10
1分钟前
科研通AI6.1应助77采纳,获得50
2分钟前
Cope完成签到 ,获得积分10
2分钟前
2分钟前
2分钟前
2分钟前
77发布了新的文献求助50
2分钟前
酷炫的爆米花完成签到,获得积分10
2分钟前
3分钟前
木十四完成签到 ,获得积分10
3分钟前
3分钟前
烟花应助kangwen采纳,获得30
3分钟前
殷勤的涵梅完成签到 ,获得积分10
3分钟前
3分钟前
科目三应助耶耶耶采纳,获得10
4分钟前
haaa完成签到 ,获得积分10
4分钟前
miki完成签到 ,获得积分10
4分钟前
4分钟前
4分钟前
何何发布了新的文献求助30
4分钟前
kangwen发布了新的文献求助30
4分钟前
kangwen完成签到,获得积分10
4分钟前
bkagyin应助何何采纳,获得10
5分钟前
岩松完成签到 ,获得积分10
5分钟前
C_Cppp完成签到 ,获得积分10
5分钟前
慕青应助轻松新之采纳,获得10
5分钟前
6分钟前
轻松新之发布了新的文献求助10
6分钟前
7分钟前
林莹发布了新的文献求助10
7分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Cronologia da história de Macau 1600
Lloyd's Register of Shipping's Approach to the Control of Incidents of Brittle Fracture in Ship Structures 1000
BRITTLE FRACTURE IN WELDED SHIPS 1000
Intentional optical interference with precision weapons (in Russian) Преднамеренные оптические помехи высокоточному оружию 1000
Atlas of Anatomy 5th original digital 2025的PDF高清电子版(非压缩版,大小约400-600兆,能更大就更好了) 1000
Current concept for improving treatment of prostate cancer based on combination of LH-RH agonists with other agents 1000
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 纳米技术 计算机科学 化学工程 生物化学 物理 复合材料 内科学 催化作用 物理化学 光电子学 细胞生物学 基因 电极 遗传学
热门帖子
关注 科研通微信公众号,转发送积分 6182069
求助须知:如何正确求助?哪些是违规求助? 8009356
关于积分的说明 16659056
捐赠科研通 5282690
什么是DOI,文献DOI怎么找? 2816201
邀请新用户注册赠送积分活动 1795987
关于科研通互助平台的介绍 1660704