Deep neural networks identify sequence context features predictive of transcription factor binding

转录因子 计算生物学 序列母题 卷积神经网络 染色质 DNA测序 抄写(语言学) 生物 遗传学 主题(音乐) DNA 计算机科学 DNA结合位点 人工智能 发起人 基因 基因表达 语言学 物理 哲学 声学
作者
An Zheng,Michael Lamkin,Hanqing Zhao,Cynthia Wu,Hao Su,Melissa Gymrek
出处
期刊:Nature Machine Intelligence [Springer Nature]
卷期号:3 (2): 172-180 被引量:82
标识
DOI:10.1038/s42256-020-00282-y
摘要

Transcription factors bind DNA by recognizing specific sequence motifs, which are typically 6–12 bp long. A motif can occur many thousands of times in the human genome, but only a subset of those sites are actually bound. Here we present a machine-learning framework leveraging existing convolutional neural network architectures and model interpretation techniques to identify and interpret sequence context features most important for predicting whether a particular motif instance will be bound. We apply our framework to predict binding at motifs for 38 transcription factors in a lymphoblastoid cell line, score the importance of context sequences at base-pair resolution and characterize context features most predictive of binding. We find that the choice of training data heavily influences classification accuracy and the relative importance of features such as open chromatin. Overall, our framework enables novel insights into features predictive of transcription factor binding and is likely to inform future deep learning applications to interpret non-coding genetic variants. The transcription process of DNA is highly complex and while short DNA sequence motifs recognized by transcription factors are well known, less is known about the context in the DNA sequence that determines whether a transcription factor will actually bind its motif. Zheng and colleagues present a method that uses convolutional neural networks to identify sequence features that help predict whether transcribing proteins can bind to their target sequences in DNA.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
1秒前
跳跃发布了新的文献求助10
2秒前
持卿应助宗磬采纳,获得20
2秒前
2秒前
花生油炒花生米完成签到 ,获得积分10
2秒前
Riki完成签到,获得积分10
4秒前
虚幻白玉发布了新的文献求助10
4秒前
德行天下完成签到,获得积分10
4秒前
Jenny应助lan采纳,获得10
5秒前
fztnh完成签到,获得积分10
5秒前
上官若男应助lyz666采纳,获得10
5秒前
顾念完成签到 ,获得积分10
5秒前
277发布了新的文献求助10
6秒前
小二郎应助GCD采纳,获得10
7秒前
hhhhhh完成签到 ,获得积分10
7秒前
甜味拾荒者完成签到,获得积分10
9秒前
小二郎应助BONBON采纳,获得10
9秒前
10秒前
charllie完成签到 ,获得积分10
10秒前
空禅yew完成签到,获得积分10
11秒前
坚强亦丝应助跳跃采纳,获得10
13秒前
英俊的铭应助cc采纳,获得10
13秒前
huangsan完成签到,获得积分10
13秒前
匹诺曹完成签到,获得积分10
13秒前
14秒前
华仔应助进取拼搏采纳,获得10
14秒前
15秒前
dingdong发布了新的文献求助10
15秒前
you完成签到 ,获得积分10
16秒前
qwf完成签到 ,获得积分10
16秒前
17秒前
万能图书馆应助一一采纳,获得10
17秒前
执着跳跳糖完成签到 ,获得积分10
18秒前
阳yang完成签到,获得积分10
18秒前
牛头人完成签到,获得积分10
18秒前
19秒前
Rrr发布了新的文献求助10
19秒前
20秒前
20秒前
高分求助中
Continuum Thermodynamics and Material Modelling 3000
Production Logging: Theoretical and Interpretive Elements 2700
Social media impact on athlete mental health: #RealityCheck 1020
Ensartinib (Ensacove) for Non-Small Cell Lung Cancer 1000
Unseen Mendieta: The Unpublished Works of Ana Mendieta 1000
Bacterial collagenases and their clinical applications 800
El viaje de una vida: Memorias de María Lecea 800
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 量子力学 光电子学 冶金
热门帖子
关注 科研通微信公众号,转发送积分 3527961
求助须知:如何正确求助?哪些是违规求助? 3108159
关于积分的说明 9287825
捐赠科研通 2805882
什么是DOI,文献DOI怎么找? 1540070
邀请新用户注册赠送积分活动 716926
科研通“疑难数据库(出版商)”最低求助积分说明 709808