登录注册写文章

2021-03-26 一文教会你查找基因的启动子、UTR、TSS等区域以及预测转录因子结合位点

2021-03-26 一文教会你查找基因的启动子、UTR、TSS等区域以及预测转录因子结合位点

来源：https://cloud.tencent.com/developer/article/1189476

基础知识

首先我们了解一些基础知识（注：文中图片皆可点击放大查看！）：

启动子（promoter）：与RNA聚合酶结合并能起始mRNA合成的序列。做生信分析时，一般选择上游1 kb，下游 500 nt，也有选上下游各1 kb的。如果关注核心启动子，可见生信宝典之前发布的Jaspar数据库介绍。获取正链或负链的启动子序列时要注意方向。之前awk的教程中有些提及。

转录起始点（TSS）：转录时，mRNA链第一个核苷酸相对应DNA链上的碱基，通常为一个嘌呤。

UTR（Untranslated Regions)：即非翻译区，是信使RNA（mRNA）分子编码区(CDS)两端的非编码片段。5’-UTR从mRNA起点的甲基化鸟嘌呤核苷酸帽延伸至AUG起始密码子，3’-UTR从编码区末端的终止密码子延伸至多聚A尾巴（Poly-A）的末端。

生信老司机以中心法则为主线讲解组学技术的应用和生信分析心得 - 限时免费中讲述了如何基于高通量数据对这些区域的调节变化进行分析，可配合此文观看。

1. 查找基因的启动子区域-NCBI

1. 打开PubMed：https://www.ncbi.nlm.nih.gov/pubmed

2. 选择Gene，输入IL17A，点击search，结果如下图，点击第一个：

3. 下拉到下图位置，可以看到该基因的以下信息：

点击Tools，选择Sequence Text View：

还可以看到如下序列信息：

4. 以上只是该基因的一些信息，可以用于查找相应的UTR等区域，下面进入正题，寻找promoter区域。还是拉到如下图位置，点击FASTA：

5. 基因位置信息如下图：

6. 一般认为基因上游2 kb区域为该基因的promoter区域，所以将基因上游2 kb序列调出来：

7. 复制上述序列就是基因的启动子序列了。

2. 查找基因的启动子区域-UCSC

1. 打开UCSC：http://www.genome.ucsc.edu/，点击Table Browser：

2. 按照下图所示填好基因相关信息，点击get output：

3.选择genomic：

4. 勾选Promoter/Upstream by选项，并将其改为2000 bases，然后点击get sequence：

5. 得到下面的序列信息，开头直到第一个大写字母前面的所有小写字母序列即为该基因的promoter序列，你可以跟NCBI上得到的序列比对一下，看看是不是一样的呢？

3. 转录因子结合位点的预测

后面的预测步骤是改版前的Jaspar，可见上一篇介绍Jaspar的文章学习在新版Jaspar中怎么预测启动子区域的转录因子结合位点。

打开http://jaspar.genereg.net/（我这边这个网址暂时打不开了，所以我登录了这个网址：http://jaspardev.genereg.net/），输入转录因子NFAT，点击Quick Search：

2. 将promoter序列粘贴进入右下角的框中，选中左侧转录因子，点击SCAN：

3. 得到28条转录因子NFAT与IL17A的结合位点，其中Strand -1没有特殊意义，只需选择Strand 1即可。

4. 好了，转录因子与promoter结合位点已经有了，接下来就是愉快的通过实验验证了！Luciferase、点突变、截短、ChIP等统统拉上来就可以了！

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

查找基因的启动子、UTR、TSS等区域以及预测转录因子结合位点
基础知识首先我们了解一些基础知识（注：文中图片皆可点击放大查看！）：启动子（promoter）：与RNA聚合酶...
weixinsuoxian阅读 24,645评论 1赞 47
2021-03-26 启动子查找和转录因子预测
来源：https://genechem.biomart.cn/news/2903754.htm 启动子查找和转录因...
Koalaemu阅读 21,406评论 2赞 25

原核非已知转录因子结合位点和可能结合的基因预测
已有：知道某原核生物某转录因子的DNA序列目标基因的基因组测序数据另外还有这个转录因子的靶基因的ORF序列 ...
Y大宽阅读 10,383评论 0赞 19
生物基础知识-CDS、ORF、启动子、终止子、转录因子、UTR
刘小泽写于2020.2.8大概回顾一下基础知识一：ORF与CDS ORF：open reading frame（...
刘小泽阅读 153,853评论 7赞 325
4️⃣ 核酸序列特征分析(3):启动子及转录因子结合位点预测和转录终止信号预测
序列比对和序列特征分析总目录启动子Promoter是位于基因5'端上游的DNA序列，调控基因表达。作用方式是通过...
Y大宽阅读 26,157评论 1赞 40

21赞22赞

赞赏

手机看全文