<meta charset="utf-8">
TBtools 是一个集合了超多生信处理的小工具,非常方便,而且是无命令行的操作,入门门槛极低。开发者是华南农业大学陈程杰博士,TBtools文章地址:https://www.biorxiv.org/content/early/2018/03/27/289660
,使用参考页面https://www.yuque.com/cjchen/hirv8i
最近要使用本地blast来寻找组内基因组的相似序列,所以准备使用tbtools来试试。
1.blast使用
1.1 数据库构建
参考网页https://zhuanlan.zhihu.com/p/418163788
首先打开软件界面,选择BLAST→BLAST GUI Wrapper→Blast Zone 会出现如下界面
然后在这个界面先构建一个本地的数据库,作为blast的数据库。
可以点击config按钮来设置数据库的存放位置。
点击图中的加号就可以添加本地的数据来构建数据库了。
点击确定之后一段时间完成数据库构建
如果要添加更多的数据库操作类似,删除数据库的话直接选中数据库然后选择 “-”就行了。
1.2 使用序列进行BLAST
直接将需要BLAST的序列粘贴到input文本框中,选择好输出文件的格式、文件名和位置点击start就可以开始了(超短序列需要选择short mode)。
查看结果
结束之后,点击右下角的 Visulize 或TextView进行查看,Visulize有几种模式查看,点击之后在左上角出现图标选项,下拉选择之后再关掉就会出现显示的界面。
如选择Aligmemt Shorer会出现如下的结果
选择Dot Plot会出现如下结果:
选择Pileup Graph会出现如下结果
而使用TextView则会显示文本信息如下:
(Frame = -1则表示是反向序列)
这样就能看到BLAST所有结果的信息。
2. 根据Blast结果提取对应序列
提取对应序列需要使用tbtools中的Fasta Extract功能。
点击Sequence→Fasta tools→Fasta Extract (Recommended)进人Fasta Extract界面
从界面上来看,分为 6 大块,其中绝大多数是可选项(即可以不做调整)。
- Fasta 序列文件输入文本框,用户可以直接拖拽硬盘中的 Fasta 文件并放置到文本框中,路径会自动获取;也可以点击跟随文本框的摁钮“...”,在弹出文件选择框中选取对应文件即可
- Initialize 摁钮,在设置 Fasta 序列文件后,可以看到 Start 摁钮仍然不可点击。需要用户点击 Initialize 摁钮,创建 Fasta 序列索引文件(如前期已有,则会软件会自动复用,节省计算时间)
- 输出文件设置文本框,用户同样可以拖拽放置文件或者文件夹,程序会自动获取输出文件夹,用户需要补全一个输出文件名;当然也可以直接点击跟随文本框的摁钮,在弹出的问价选择框中设置对应输出文件即可
- 待提取序列信息设置框,参考界面说明,接受三种类型的提取模式:
● 基于 ID 的完整序列记录提取,如输入 Unigene_1 ... 等完整序列 ID,每行一个,即可提取完整序列记录
● 基于 序列坐标信息,进行序列区间截取,如提取染色体 Chr1 上第 10000 个碱基到 20000 个碱基的一段序列,那么输入如下。如果需要提取反向互补序列,使起始坐标大于终止坐标即可。
# 注意,制表符[\t]分隔,而非空白[Space]分隔(试了下现在用空格好像也可以了)
Chr1 10000 20000
# 提取反向互补序列,则翻转碱基坐标
Chr1 20000 10000
提取坐标信息的功能,重命名区间,如我们需要提取 Peak 或者 Promoter 序列信息,并指定输出时序列名字
peak_1 Chr1 10000 10200
promoter_ATG8 Chr2 20300 22300