简介
这篇简文主要介绍一下recos软件的安装,以及该软件可以绘制什么样的基因组共线性图。与circos类似,它可以将基因组之间的共线性和基因组的相关特性展示到图中,不同的是circos是通过圆形展示,而recos是通过矩形。
同源物种或相同物种的不同基因组进行共线性分析常用软件为MUMmer和MCScanX,这两个软件一个是基于基因组序列的比对获取同源区段(block),一个是基于基因的比对获取同源区段(blcok)。当然还有其他可以进行共线性分析的工具,但是最终结果就是A基因组的那一区段和B基因组的那一区段是共线性或同源的。
基于基因组之间的共线性或者比较可以分析得到他们之间的结构差异SV,例如有PAV、INV、INSERTION、DELETION和TRANSLOCATION等。在文章中,我们通常希望用一张图直观的展示他们之间的差异,此时recos可以完成绘图工作。
除了展示基因组共线性结果外,它还可以将基因组特性信息添加到图中,例如每1Mb范围内的GC含量、repeat比例、基因密度和N碱基比例等。该软件可以支持line、hist、heatmap、tile四种几何图形绘制,满足不同的绘图需求。
软件安装
第一步:在自己的系统上安装Singularity,可以参考 https://docs.sylabs.io/guides/latest/user-guide/quick_start.html;
第二步:从github下载相关软件,如果安装git,可以之间输入,git clone https://github.com/zhk2017/recos.git 进行下载,或者可以通过进入链接 https://github.com/zhk2017/recos 进行下载,完成后为exe目录下recos添加可执行权限cd exe && chmod 755 recos;
第三步:下载基础镜像,用于提供软件运行环境, https://pan.baidu.com/s/1e54jrCk62SSvFcr8o7tMoA ,提取码:q2e5;
第四步:下载的基础镜像名称为recos.sif,将其保存到img目录下面,img目录位于第二步下载的软件下面;
另外,为了方便大家使用,在完成第一步后,直接通过百度网盘下载压缩包,里面包含了代码和基础镜像,这样就可以省掉后续步骤,压缩包链接:https://pan.baidu.com/s/1peHuLwwacAs2iychdXrupA?pwd=1tz5 ,提取码:1tz5
软件运行
按照软件安装步骤完成软件安装后,在第二步下载的软件中有一个recos_wrapper.pl,直接运行这个脚本就可以看到运行时所需的参数,其中-c后面为配置文件,-o后面为输出文件名称,软件只生成SVG格式图片,并自动添加后缀。
在第二步下载的软件中的tutorials目录下面提供了5个运行实例,帮助用户快速上手和了解软件功能,大家可以进入每个example目录,运行run.sh就可以完成图的绘制,里面也给出了输入文件和配置文件的例子,可以快速了解文件格式。
配置详解
在软件的-c参数后面跟着配置文件,里面可以设置很多图形参数完成对图形的定制化,基因组共线性文件以及基因组特性文件都是在这个配置文件中给定。
···javascript
[canvas] #用于定义整个画布的大小、图形方向、图形元素所在的位置和大小等
width = 2000 #画布宽度,像素
height = 1200 #画布高度,像素
direction = vertical #图形元素的方向,水平或垂直
axis_ratio = 0.05 #坐标轴占画布的大小,0.05表示占总大小的5%,举例:如果direction为水平,表示占高度的5%
name_ratio = 0.05 #染色体名称占画布的大小
margin = 10,10,10,10 #画布四周留白的大小,像素
inner_ratio = 0.15,0.2,0.3,0.2,0.15 #每个染色体对占一个区域,里面分为5部分,详见后面对参数的说明
[axis]
canvas_position = left #坐标轴在画布中的位置,举例:如果direction为水平,则只能是上或下
ticks_minor = 1Mb #坐标轴中较短刻度的步长
ticks_major = 5Mb #坐标轴较长刻度的步长
ticks_minor_len = -5 #较短刻度的长度,像素,负值可以调整方向
ticks_major_len = -10 #较长刻度的长度,像素,负值可以调整方向
axis_line = 0.7 #以坐标轴区域为参考,坐标轴主线在里面的位置,举例:0.5表示居中
axis_color = rgb(0,0,0) #坐标轴颜色
axis_label = 0.2 #以坐标轴区域为参考,刻度标签名称所在位置
axis_label_size = 12 #刻度标签名称的大小,像素
axis_label_color = rgb(0,255,255) #刻度标签名称的颜色
axis_width = 1 #坐标轴线条宽度
axis_opacity = 1 #坐标轴线条透明度
label_unit = Mb #刻度标签名称的单位
[chromosome]
canvas_position = bottom #展示染色体比较的绘图元素在画布中的位置
chromosome_list = /data/example/ref_query.list #定义染色体比较关系、条带颜色、染色体长度、透明度、比较ID等
chroms = 1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20 #比较ID的列表在chromosome_list定义,指定展示顺序
name_position = center #染色体名称标签的位置
round=15 #设置染色体条带两端为圆形,越大弧度越大,默认为0,表示直角
[ref_out1] #定义参考基因组外侧要展示的图形元素
file =/data/PAV/ref.bed
type = hist #以直方图展示
pos0 = 0 #起始位置,最小为0
pos1 = 1 #终止位置,最大为1,可以是小数
low_color = rgb(0,0,0) #低位色
color = rgb(0, 0, 255) #颜色
high_color =rgb(0, 0, 255) #高位色
min = 100 #绘图时的最小值
max = 5000 ##绘图时的最大值
[ref_in1] #定义参考基因组条带内部要展示的图形元素
file = /data/example/gly.gc.bed
type = heatmap #以热图展示
pos0 = 0
pos1 = 1
low_color = rgb(255,255,255)
color = rgb(0, 0, 255)
high_color =rgb(255, 0, 0)
min = 0.3
max = 0.5
[qry_in1] #定义查询基因组条带内部要展示的图形元素
file =/data/PAV/query.bed
type = hist
pos0 = 0
pos1 = 1
low_color = rgb(0,0,0)
color = rgb(255, 0, 0)
high_color =rgb(255, 0, 0)
min = 100
max = 5000
[link1] #定义染色体对的共线性关系,文件内部可以设置共线性块的颜色,来区分是否时SV,以及其类型
coord = /data/coords.txt
···
绘图实例展示
下面给出软件可以绘制图片的例子,这些实例在下载的软件tutorials/example目录下面,后面还会出一篇简文详细介绍输入文件的格式要求和对这5个实例的详解介绍。
实例1,一个最简单的例子,只绘制了共线性的染色体条带,并给两个基因组的染色体不同的填充色:
实例2,添加了共线性关系,并用蓝色标记了一个SV:
实例3,修改了条带填充色或透明度,还对参考和查询基因组添加了几个特性信息,使用hist和tile不同的几何元素绘制在染色体条带内部,丰富了图形表达的含义:
实例4,ref位于同源染色体的上方,qry在下方,下图在ref的染色体条带内部用heatmap(红白)添加了一个基因组特性信息,在ref染色体的上方(外部)使用hist(蓝色)添加了另外的基因组特性信息;而qry只在内部用橙色的hist添加了一个基因组特性信息;
实例5,通过配置文件中的pos0和pos1在ref的染色体条带内部的不同位置添加了两个特性(蓝色的hist和红色的heatmap),如果指定相同的位置,那么不同的几何元素会展示在相同位置: