TBtools:基因家族分析简单流程

写在前面:非常感谢CJ开发出如此强大的TBtools工具。作者(CJchen-0410)在B站上有新手教程,大家可以给大神点个关注。


本文以《Genome-wide identification and phylogenetic analysis of rice FTIP gene

family》为例,介绍TBtools基因家族分析的流程。

本文内容
1、从结构域出发鉴定基因家族成员
2、顺式作用元件分析
3、保守结构域分析
4、多物种共线性分析

准备工作

本文主要介绍TBtools的用法,复现文章中作者用到TBtools的地方。

1、工具

(1) TBtools 1.09852 (下载地址:https://github.com/CJ-Chen/TBtools/releases)

(2) MEGA

(3) Pfam

(4) PlantCARE

2、数据集下载

(1) EnsemblPlants


1、从结构域出发鉴定基因家族成员

(1) 从 Pfam下载所有的结构域的hmm格式文件

image

Pfam-A 是 人工标注的结构域,Pfam-B 是预测的结构域

(2)EnsemblPlants 下载水稻的所有蛋白序列(pep),基因序列(fa),全基因组序列(fa),全基因组注释(gff3) ( 我用的是MSU的水稻数据,MSU 和 NCBI 的基因注释差别不大)

image
基因组序列
注释文件
蛋白序列
基因序列

其他物种的相关序列也可以在这下载。

(3)文献作者是利用C2结构域和PRT-C结构域查找OsFTIPs基因家族成员,在Pfam上找到两个相关结构域的登录号PF00168,PF08372。新建个文本

image

(4) 利用TBtools的hmm search 工具 查找

image

这里其实是做了个 hmmer 软件的接口 。往常要用hmmer来找结构域需要在Pfam 上 下载 结构域的模型 ,而且hmmer 这个软件 win版本不太友好,这里是给出了个优化方案,TBtools内置了部分 hmmer 使其直接调用。

(4)输出结果

结果

每个结构域都会有两部分 分数 ,分别是序列得分和结构域得分,可以通过结果太多可以用E-value 筛选。我用excel筛选了下,找个交集,共找到13个,和文献中一致。

image

(5) 得到目标基因的蛋白序列、基因序列、启动子序列、注释文件

利用TBtools的 Fasta Extract 工具提取蛋白序列、基因序列

要注意蛋白和mRNA序列的ID是有版本号的,如 LOC_Os06g41090.1 的.1。 提取蛋白序列需要标版本号,提取DNA序列则需要把版本号去掉。总之就是输入的目标ID要和fasta文件中的ID对应。

image
结果

利用GXF Selector 筛选目标基因的注释文件

image

利用Gtf/Gff3 Sequences Extract 提取启动子

输入上步目标基因的注释文件和基因组序列文件,选择参数。输入注释文件后需要按下初始化,不然start是灰的。如果需要 基因组所有基因 的启动子 可以输入 全基因组的注释文件。

image
结果

(6) 可视化

TBtools 画的是矢量图,可以改颜色 样式 ,比较方便。具体操作如下,结果就不一一展示了。

基因在染色体上的位置
基因结构

同时,TBtools也支持NCBI、MEME的预测结果

基于Pfam结果的motif可视化
Pfam预测

当然还有更加酷炫的进化树、基因结构、motif分析的三合一图,请出门向左(https://my.oschina.net/u/4579431/blog/4834581)。

2、顺式作用元件预测

文献中作者是用PlantCARE进行预测的。拿出提取到的启动子序列扔上去等邮件就好了,一般在半个小时左右。

PlantCARE预测

邮件中的tab文件是所有结果的汇总。得到的启动子序列往往比较多,需要手动筛选下,主要保留响应元件。需要整理成TBtools能识别的格式和一个序列长度的文件。

整理后的数据格式
启动子长度文件
image

3、保守结构域分析

TBtools上可以直接运行MEME。

image

可视化 用到输出的 xml 文件

image

作者还写过一个更全的版本,出门右转(https://www.jianshu.com/p/b8ffd0fd1cbf)

4、多物种共线性分析

(1)需要两个物种的基因组序列(fa)和基因组注释文件(gff3) 这里用水稻和拟南芥为例。原理就是blast。这一步运行时长主要还是和基因组大小和电脑线程数有关,条件允许的情况下可以多开几个线程。

image
结果文件

(2)运行过程中可能会弹出警告,但没事儿。这主要是注释文件的问题

(3)可视化 主要用到结果中的gff文件、ctl文件、collinearity文件

灰色的是基因组比对上的地方,红色的是比对上的目标基因(没比对上就没有。还可以放多个物种的比对结果。也可以物种内共线性比对,查看是否发生基因复制事件(https://www.meiwen.com.cn/subject/ljltbctx.html),思路和方法也是差不多的

image
结果

TBtools 不止能做基因家族分析,随着TBtools这个社区的壮大,已经有了很多教程,也有很多作者贡献了十分有用的插件,小的方面可以完成批量重命名、热图、维恩图、火山图、Logo、气泡图,大的方面能够完成转录组分析和注释,WGCNA等工作。同时也感谢这些作者降低了生信分析的门槛,更好的帮助科研工作(凑结果)。作者也写了很多的教程 可以关注公众号:生信药丸。

参考文献:

Genome-wide identification and phylogenetic analysis of rice FTIP gene family

愚见 | 解读文稿 BMC Plant Biology 本氏烟类成束蛋白阿拉伯半乳聚糖基因家族分析

TBtools: An Integrative Toolkit Developed for Interactive Analyses of Big Biological Data

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,904评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,581评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,527评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,463评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,546评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,572评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,582评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,330评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,776评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,087评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,257评论 1 344
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,923评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,571评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,192评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,436评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,145评论 2 366
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,127评论 2 352

推荐阅读更多精彩内容