已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

TransEFVP: A Two-Stage Approach for the Prediction of Human Pathogenic Variants Based on Protein Sequence Embedding Fusion

马修斯相关系数 自编码 编码器 变压器 水准点(测量) 致病性 机器学习 人工神经网络 模式识别(心理学) 生物 支持向量机 人工智能 计算机科学 工程类 微生物学 大地测量学 电压 地理 电气工程 操作系统
作者
Zihao Yan,Fang Ge,Yan Liu,Yumeng Zhang,Fuyi Li,Jiangning Song,Dong‐Jun Yu
出处
期刊:Journal of Chemical Information and Modeling [American Chemical Society]
卷期号:64 (4): 1407-1418 被引量:4
标识
DOI:10.1021/acs.jcim.3c02019
摘要

Studying the effect of single amino acid variations (SAVs) on protein structure and function is integral to advancing our understanding of molecular processes, evolutionary biology, and disease mechanisms. Screening for deleterious variants is one of the crucial issues in precision medicine. Here, we propose a novel computational approach, TransEFVP, based on large-scale protein language model embeddings and a transformer-based neural network to predict disease-associated SAVs. The model adopts a two-stage architecture: the first stage is designed to fuse different feature embeddings through a transformer encoder. In the second stage, a support vector machine model is employed to quantify the pathogenicity of SAVs after dimensionality reduction. The prediction performance of TransEFVP on blind test data achieves a Matthews correlation coefficient of 0.751, an F1-score of 0.846, and an area under the receiver operating characteristic curve of 0.871, higher than the existing state-of-the-art methods. The benchmark results demonstrate that TransEFVP can be explored as an accurate and effective SAV pathogenicity prediction method. The data and codes for TransEFVP are available at https://github.com/yzh9607/TransEFVP/tree/master for academic use.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
wusiting完成签到,获得积分10
刚刚
斯文败类应助哈哈采纳,获得10
1秒前
Thing完成签到,获得积分10
2秒前
bing发布了新的文献求助10
2秒前
2秒前
所所应助wusiting采纳,获得10
5秒前
NexusExplorer应助缥缈夏彤采纳,获得30
6秒前
7秒前
cc发布了新的文献求助10
7秒前
7秒前
8秒前
Lucas应助科研通管家采纳,获得10
9秒前
9秒前
科研通AI2S应助科研通管家采纳,获得10
9秒前
cocolu应助科研通管家采纳,获得10
9秒前
Lucas应助东郭南珍采纳,获得10
11秒前
xuan发布了新的文献求助10
13秒前
涵Allen完成签到 ,获得积分10
14秒前
哈哈发布了新的文献求助10
14秒前
15秒前
张zz完成签到 ,获得积分10
15秒前
16秒前
cc完成签到,获得积分10
16秒前
66发布了新的文献求助10
17秒前
HRIFFIN发布了新的文献求助10
19秒前
嘀嘀菇菇完成签到 ,获得积分10
19秒前
19秒前
kekeji完成签到 ,获得积分10
22秒前
24秒前
24秒前
Mm完成签到,获得积分10
24秒前
贾克斯完成签到,获得积分10
26秒前
蒋田姣完成签到 ,获得积分10
27秒前
东郭南珍发布了新的文献求助10
28秒前
情怀应助Noob_saibot采纳,获得10
29秒前
enheng关注了科研通微信公众号
31秒前
zhenzheng完成签到 ,获得积分10
32秒前
涵Allen完成签到 ,获得积分10
36秒前
38秒前
温暖寻雪发布了新的文献求助10
42秒前
高分求助中
Licensing Deals in Pharmaceuticals 2019-2024 3000
Cognitive Paradigms in Knowledge Organisation 2000
Effect of reactor temperature on FCC yield 2000
Very-high-order BVD Schemes Using β-variable THINC Method 1020
Near Infrared Spectra of Origin-defined and Real-world Textiles (NIR-SORT): A spectroscopic and materials characterization dataset for known provenance and post-consumer fabrics 610
Promoting women's entrepreneurship in developing countries: the case of the world's largest women-owned community-based enterprise 500
Shining Light on the Dark Side of Personality 400
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3307151
求助须知:如何正确求助?哪些是违规求助? 2940941
关于积分的说明 8499619
捐赠科研通 2615154
什么是DOI,文献DOI怎么找? 1428702
科研通“疑难数据库(出版商)”最低求助积分说明 663493
邀请新用户注册赠送积分活动 648355