什么是转录因子?
如何寻找转录因子?
转录因子的功能是什么?
如何确定转录因子的结合位点?
提起转录因子,该有一堆问题冒出来。
定义与功能
转录因子(Transcription Factors,TFs),是指能够以特定序列与基因专一性结合,从而保证目的基因以特定的强度在特定的时间与空间表达的蛋白质分子。转录因子通过识别特定的DNA序列来控制染色质和转录,以形成指导基因组表达的复杂系统。许多转录因子充当着主调节因子和选择基因的角色,控制着细胞类型的决定、发育模式和特定途径控制(如免疫反应)的过程。
Lambert S A, Jolma A, Campitelli L F, et al. The Human Transcription Factors[J]. Cell, 2018, 172(4):650-665
转录因子数据库
TF这么重要,那我们怎么寻找转录因子呢?在这里,得提到两个非常重要的研究转录因子的常用数据库:
AnimalTFDB(http://bioinfo.life.hust.edu.cn/AnimalTFDB/#!/)
PlantTFDB(http://planttfdb.cbi.pku.edu.cn/)
显而易见,这两个数据库分别收录了动物和植物的TF,包含转录因子注释和预测等。这里小编着重说一下AnimalTFDB。AnimalTFDB 3.0数据库去年9月份更新,是华中科技大学郭安源教授团队建立并维护的。
数据库收录的信息非常全,涵盖了97个物种、12万的转录因子、8万的转录辅因子(Cofactor)以及这些转录(辅)因子的家族、表达、通路、表型、蛋白互作等等信息。我们可以根据物种信息搜索和下载相应的TFs,也可以直接看每个转录因子的基本信息,如功能结构域、互作网络及表达等。
新版本除了在数据上的扩展外,还提供多种搜索浏览方式(Famliy、Species或自定义搜索)、2个在线预测工具Predict TF和Predict TFBS(分别可以批量预测转录因子和预测DNA序列上的转录因子结合位点)。
转录因子结合位点
上面提到了转录因子结合位点,那是什么呢?转录因子的结合位点(transcription factor binding site,TFBS)是转录因子调节基因表达时,与基因模板链结合的区域,即与转录因子结合的DNA片段,长度通常在5~20 bp范围内。一个转录因子往往同时调控若干个基因,而它在不同基因上的结合位点具有一定的保守性,又不完全相同。
转录因子与特异性DNA结合通常概括为“基序”(motif) ,是指给定TF优先的相关短序列组的模型,其可用于扫描较长序列(例如,启动子)以鉴定潜在的结合位点。确定DNA结合的motif通常是详细阐释转录因子功能的第一步,鉴定潜在的结合位点为进一步分析提供了途径。关键点来了,小编又给大家安利了。JASPAR是收集有关转录因子与DNA结合位点模体的最全面的公开的数据库,该数据库众所包含的数据都经过严格的筛选,有确切的实验依据。
那怎么用呢?最左边一列是工具栏;中间显示的图片是数据库中收录的六大类生物,可点击查看每个大类中收集的数据总量;最右侧是用户使用导航,第一次使用的用户可以点击按提示操作。
简单示范一下如何预测TFBS:
(1)选择物种:小编这里选择vertebrata——Homo sapiens
(2)在Scan序列输入框里输入我们想要查找的启动子区域序列或增强子区域序列或其它关注的区域,注意需要输入FASTA格式。在左侧列表中勾选待预测结合的转录因子,或者你感兴趣的转录因子都勾选上。
(注:可以设置scan的参数:Relative profile score threshold,该值越大,表示该转录因子与输入序列结合的可能性越大)。
(3)点击SCAN即出现结果展示,点击csv保存结果。
好了,一个简单操作到这里就愉快地介绍完了。