recos基因组及共线性可视化

简介

这篇简文主要介绍一下recos软件的安装,以及该软件可以绘制什么样的基因组共线性图。与circos类似,它可以将基因组之间的共线性和基因组的相关特性展示到图中,不同的是circos是通过圆形展示,而recos是通过矩形。

同源物种或相同物种的不同基因组进行共线性分析常用软件为MUMmer和MCScanX,这两个软件一个是基于基因组序列的比对获取同源区段(block),一个是基于基因的比对获取同源区段(blcok)。当然还有其他可以进行共线性分析的工具,但是最终结果就是A基因组的那一区段和B基因组的那一区段是共线性或同源的。

基于基因组之间的共线性或者比较可以分析得到他们之间的结构差异SV,例如有PAV、INV、INSERTION、DELETION和TRANSLOCATION等。在文章中,我们通常希望用一张图直观的展示他们之间的差异,此时recos可以完成绘图工作。

除了展示基因组共线性结果外,它还可以将基因组特性信息添加到图中,例如每1Mb范围内的GC含量、repeat比例、基因密度和N碱基比例等。该软件可以支持line、hist、heatmap、tile四种几何图形绘制,满足不同的绘图需求。


软件安装

第一步:在自己的系统上安装Singularity,可以参考 https://docs.sylabs.io/guides/latest/user-guide/quick_start.html

第二步:从github下载相关软件,如果安装git,可以之间输入,git clone https://github.com/zhk2017/recos.git 进行下载,或者可以通过进入链接 https://github.com/zhk2017/recos 进行下载,完成后为exe目录下recos添加可执行权限cd exe && chmod 755 recos;

第三步:下载基础镜像,用于提供软件运行环境, https://pan.baidu.com/s/1e54jrCk62SSvFcr8o7tMoA ,提取码:q2e5;

第四步:下载的基础镜像名称为recos.sif,将其保存到img目录下面,img目录位于第二步下载的软件下面;

另外,为了方便大家使用,在完成第一步后,直接通过百度网盘下载压缩包,里面包含了代码和基础镜像,这样就可以省掉后续步骤,压缩包链接:https://pan.baidu.com/s/1peHuLwwacAs2iychdXrupA?pwd=1tz5 ,提取码:1tz5


软件运行

按照软件安装步骤完成软件安装后,在第二步下载的软件中有一个recos_wrapper.pl,直接运行这个脚本就可以看到运行时所需的参数,其中-c后面为配置文件,-o后面为输出文件名称,软件只生成SVG格式图片,并自动添加后缀。

软件参数

在第二步下载的软件中的tutorials目录下面提供了5个运行实例,帮助用户快速上手和了解软件功能,大家可以进入每个example目录,运行run.sh就可以完成图的绘制,里面也给出了输入文件和配置文件的例子,可以快速了解文件格式。


配置详解

在软件的-c参数后面跟着配置文件,里面可以设置很多图形参数完成对图形的定制化,基因组共线性文件以及基因组特性文件都是在这个配置文件中给定。

···javascript

[canvas]   #用于定义整个画布的大小、图形方向、图形元素所在的位置和大小等

width = 2000  #画布宽度,像素

height = 1200  #画布高度,像素

direction = vertical  #图形元素的方向,水平或垂直

axis_ratio = 0.05  #坐标轴占画布的大小,0.05表示占总大小的5%,举例:如果direction为水平,表示占高度的5%

name_ratio = 0.05  #染色体名称占画布的大小

margin = 10,10,10,10  #画布四周留白的大小,像素

inner_ratio = 0.15,0.2,0.3,0.2,0.15 #每个染色体对占一个区域,里面分为5部分,详见后面对参数的说明

[axis]

canvas_position = left  #坐标轴在画布中的位置,举例:如果direction为水平,则只能是上或下

ticks_minor = 1Mb  #坐标轴中较短刻度的步长

ticks_major = 5Mb  #坐标轴较长刻度的步长

ticks_minor_len = -5  #较短刻度的长度,像素,负值可以调整方向

ticks_major_len = -10 #较长刻度的长度,像素,负值可以调整方向

axis_line = 0.7  #以坐标轴区域为参考,坐标轴主线在里面的位置,举例:0.5表示居中

axis_color = rgb(0,0,0)  #坐标轴颜色

axis_label = 0.2  #以坐标轴区域为参考,刻度标签名称所在位置

axis_label_size = 12  #刻度标签名称的大小,像素

axis_label_color = rgb(0,255,255)  #刻度标签名称的颜色

axis_width = 1  #坐标轴线条宽度

axis_opacity = 1 #坐标轴线条透明度

label_unit = Mb  #刻度标签名称的单位

[chromosome]

canvas_position = bottom  #展示染色体比较的绘图元素在画布中的位置

chromosome_list = /data/example/ref_query.list  #定义染色体比较关系、条带颜色、染色体长度、透明度、比较ID等

chroms = 1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20 #比较ID的列表在chromosome_list定义,指定展示顺序

name_position = center  #染色体名称标签的位置

round=15 #设置染色体条带两端为圆形,越大弧度越大,默认为0,表示直角

[ref_out1]  #定义参考基因组外侧要展示的图形元素

file =/data/PAV/ref.bed

type = hist  #以直方图展示

pos0 = 0  #起始位置,最小为0

pos1 = 1  #终止位置,最大为1,可以是小数

low_color = rgb(0,0,0) #低位色

color = rgb(0, 0, 255)  #颜色

high_color =rgb(0, 0, 255) #高位色

min = 100  #绘图时的最小值

max = 5000  ##绘图时的最大值

[ref_in1]  #定义参考基因组条带内部要展示的图形元素

file = /data/example/gly.gc.bed

type = heatmap  #以热图展示

pos0 = 0

pos1 = 1

low_color = rgb(255,255,255)

color = rgb(0, 0, 255)

high_color =rgb(255, 0, 0)

min = 0.3

max = 0.5

[qry_in1] #定义查询基因组条带内部要展示的图形元素

file =/data/PAV/query.bed

type = hist

pos0 = 0

pos1 = 1

low_color = rgb(0,0,0)

color = rgb(255, 0, 0)

high_color =rgb(255, 0, 0)

min = 100

max = 5000

[link1]  #定义染色体对的共线性关系,文件内部可以设置共线性块的颜色,来区分是否时SV,以及其类型

coord = /data/coords.txt

···


绘图实例展示

下面给出软件可以绘制图片的例子,这些实例在下载的软件tutorials/example目录下面,后面还会出一篇简文详细介绍输入文件的格式要求和对这5个实例的详解介绍。

实例1,一个最简单的例子,只绘制了共线性的染色体条带,并给两个基因组的染色体不同的填充色:

染色体条带

实例2,添加了共线性关系,并用蓝色标记了一个SV:

添加共线性连接线和用颜色标记指定SV

实例3,修改了条带填充色或透明度,还对参考和查询基因组添加了几个特性信息,使用hist和tile不同的几何元素绘制在染色体条带内部,丰富了图形表达的含义:

修改透明度添加几何元素体现基因组特性

实例4,ref位于同源染色体的上方,qry在下方,下图在ref的染色体条带内部用heatmap(红白)添加了一个基因组特性信息,在ref染色体的上方(外部)使用hist(蓝色)添加了另外的基因组特性信息;而qry只在内部用橙色的hist添加了一个基因组特性信息;

分别在条带内部和外部添加基因组特性信息

实例5,通过配置文件中的pos0和pos1在ref的染色体条带内部的不同位置添加了两个特性(蓝色的hist和红色的heatmap),如果指定相同的位置,那么不同的几何元素会展示在相同位置:

染色体条带内部添加多个绘图特性
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,875评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,569评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,475评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,459评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,537评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,563评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,580评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,326评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,773评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,086评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,252评论 1 343
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,921评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,566评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,190评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,435评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,129评论 2 366
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,125评论 2 352

推荐阅读更多精彩内容