circos软件在展示基因组信息方面具有十分重要的作用。关于该软件的使用可以在网上找到很多教程,但关于如何准备运行circos所需要的文件则没有软件可以实现。因此,特意开发了For circos软件。首先是核型文件:
输入文件可以从genome模块获取
其次是links文件,该文件的作用是展示基因组上的连线,功能实现如下 :
位置1放入格式化的gff文件,位置2放入共线性的collinearity文件(该文件可以在Alignment/hmm模块生成)。位置3是保存与命名。然后点击按钮。
第三个是基因密度文件,如下:
在位置①放入格式化的gff文件,位置②是规定多少bp统计一次,默认的是100000bp,如果还需其他长度的统计单位则直接输入就好。接下来就是保存与命名(位置③)。点击按钮即可执行功能。
第四,SNP位点标注。如下:
与基因密度统计类似,不过在位置1这里,放入的是经过格式化的SNP文件而不是 gff文件,之后设定统计单位(位置2),保存(位置3),点击按钮执行。
接下来是数量分布。
所谓数量分布,既可在染色体上展示热图同时也可以展示GC含量等指标。在位置1放入的是GFF文件,在位置2放入数量文件,其基本格式为基因名称加tab加对应数量。同学们可以在excel中进行统计,保存文件时将其保存为以制表符格式另存即可。位置3便是保存位置。
最后是文本展示
该功能主要是在circos图上标注相应的基因ID。位置1放入gff文件,位置2是基因ID(一个ID,一行),保存(位置3)执行即可。