HiC矩阵可视化之-HiCPlotter

1. 软件安装


软件是python写的,不需要安装但是需要安装需要的库。


Numpy, Scipy, Matplotlib.


2. 输入文件要求


=====matrix格式的==============

N X N 的对称矩阵格式


如果没有header:设置-fh = 0,因为默认为1,会跳过第一个行  -ff:是跳过最后几行的


======sparse format===========(HiC-Pro默认的输出方式)

这个需要两个文件:


-tri:默认是0,如果是HiC-Pro的要设置为1

-bed:这个是显示bin ID的bed文件,HiC-Pro也会输出的


======5C data(random matrix)=============

我理解的就是矩阵是随机排列的,并没有顺序去排

可以看出,就显示了哪里有interaction,并不是都显示了


-rb:要设置为1,来激活这个格式



=======整个基因组矩阵=================

其实我觉得和1是一样的,就是这个是多个染色体的

-wg:设置成1,来激活这个功能

3. 软件运行

====显示整个染色体的情况===========

对于只有一个染色体的文件:

这是一个N X N的矩阵文件,数值代表关联强度:

python ../HiCPlotter.py -f../data/HiC/Human/hES-nij.chr21.2 -n hES -chr chr21 -r 40000 -o default1 -fh 0

其中:-f:输入的矩阵文件  -n:相当于R里面的main label  -r:分辨率(其实就是bin

size)-o:输出文件的前缀  -fh:和前面一样需要忽略的头文件行数  -chr:显示需要显示的染色体,但是好像必须是chr开头

如果只需要画一部分的话,加上-s -e参数,很好理解,start end

python ../HiCPlotter.py -f../data/HiC/Human/hES-nij.chr21.2 -n hES -chr chr21 -r 40000 -o default12 -fh 0-s 600 -e 900

===============HiCPlotter也可以call TAD并且显示出来====================

通过参数  -ptd:1来激活这一个选项( A boolean whether to plot TADs calledby an algorithm (deprecated) implemented in HiCPlotter (Default value: 0 - setto 1 for activating).

python ../HiCPlotter.py -f../data/HiC/Human/hES-nij.chr21.2 -n hES -chr chr21 -r 40000 -o default13 -fh 0-s 600 -e 900 -ptd 1

TAD的算法相关的一系列参数,暂时还没看懂每个参数调控的什么,需要去读下TAD相关的算法。

下面这个是添了一个: -w:8 (An integer  in bins tocalculate insulation scores  off from thediagonal  (Default value:  5 –  based on the resolution ofmatrix file, bins corresponding to 500-800Kb range is suggested)

下面是添加了参数:-pi:1 (这个是显示Insulation的track)(A boolean whether to plot insulation scores calculated for the given window and tadRange parameters )

也可以把以前的TAD加入进行对比,这个是以前TAD的bed文件:

python HiCPlotter.py -fdata/HiC/Human/hES-nij.chr21.2 -n hES -chr chr21 -r 40000 -o default4 -fh 0 -s600 -e 900 -ptd 1 -pptd 1

主要是通过设置 -pptd为1,这个是用的内置的文件:(less -h 5 data/IMR90_domains_hg19.bed )估计用的别到数据的话需要改代码,或者改文件内容

===============画多个HiC数据在一起================================

多组数据输入 -f 后面以空格隔开

 python ../HiCPlotter.py -f../data/HiC/Human/GSM1081526_TEV_r1_cis.index.chr6.txt_matrix.txt../data/HiC/Human/GSM1081528_HRV_r1_cis.index.chr6.txt_matrix.txt../data/HiC/Human/GSM1081530_CTRL_r1_cis.index.chr6.txt_matrix.txt../data/HiC/Human/GSM1081533_CTCF_r2_cis.index.chr6.txt_matrix

.txt -n WT RAD21-Depleted siControlCTCF-Depleted -chr chr6 -r 40000 -fh 0 -pi 1 -o Rad21.CTCF -s 2800 -e 2950 -hmc5

-hmc:调整颜色( An integer between 0-5

(Greys(0), Reds(1), YellowToBlue(2), YellowToRed(3-default), Hot(4),BlueToRed(5)) for choosing color scale of the heatmap)

python ../HiCPlotter.py -f../data/HiC/Human/GSM1081526_TEV_r1_cis.index.chr6.txt_matrix.txt../data/HiC/Human/GSM1081528_HRV_r1_cis.index.chr6.txt_matrix.txt../data/HiC/Human/GSM1081530_CTRL_r1_cis.index.chr6.txt_matrix.txt../data/HiC/Human/GSM1081533_CTCF_r2_cis.index.chr6.txt_matrix

.txt -n WT RAD21-Depleted siControlCTCF-Depleted -chr chr6 -r 40000 -fh 0 -pi 1 -o Rad21.CTCF  -hmc 5 -sn 0.35

这个是整个chromosome的显示效果


====================含有多个染色体的数据=================================

python ../HiCPlotter.py -f ../data/HiC/Human/GSM1184323-HiCMYZ-Tcell-Rad21WT-R1.mm9.NA.L-1400000-wDiag-noSS-iced.2.matrix-n Tcell_WT -chr Genome -r 1400000 -o Tcell -hmc 5 -fh 4 -pi 1 -wg 1

从数据上可以看出,这个是包含各个染色体的bin数据。

(多条染色体的问题,现在理解它的参数是怎么设置了

-wg: 1

-chr: chrY (If inputformat is triple sparse,  -chr parameterwill be used designate to  the  end chromosome, such as –chr chr11 will plotinteractions starting from chr1 to chr11. Please use –chr chrY for whole genomeinteraction plots. Note: will skip mitochondrial interactions (chrM). )所以在这里 chr是为了确定结束的染色体的


======加入其它track的数据=====================================

在下面这个图中,加入了Chip-seq和RAP-seq的数据,都是以bed形式给出的:

python ../HiCPlotter.py -f../data/HiC/Mouse/mES.chrX -n mES -chr chrX -r 40000 -o RAP -fh 0 -hist../data/HiC/Mouse/GSE46918_pSM33-0hr-Xist_vs_Input.W10000_O7500.bedGraph,../data/HiC/Mouse/GSE46918_pSM33-1hr-Xist_vs_Input.W10000_O7500.bedGraph,../data/HiC/Mouse/GSE46918_pSM33-2hr-Xist_vs_Input.W10000_O7500.bedGraph,../data/HiC/Mouse/GSE46918_pSM33-3hr-Xist_vs_Input.W10000_O7500.bedGraph,../data/HiC/Mouse/GSE46918_pSM33-6hr-Xist_vs_Input.W10000_O7500.bedGraph,../data/HiC/Mouse/wgEncodeLicrHistoneEsb4H3k27me3ME0C57bl6StdSig.chrX.bedGraph-hl Xist_0h,Xist_1h,Xist_2h,Xist_3h,Xist_6h,H3K27me3_0h -pi

 1-ptr 0 -fhist 0,1,1,1,1,0 -hmc 5


注意:-f:后面跟的文件以空格隔开

           -hist:后面跟的文件以逗号隔开

           -fhist:用来描述曲线下面要不要填充


还可以通过-hc来调整曲线下面的颜色


python HiCPlotter.py -fdata/HiC/Human/IMR90-chr10_25kb.RAWobserved_KRnormalizedMatrix.txt -o genes -nIMR90 -chr chr17 -g genes.sorted.bed -r 25000 -s 1800 -e 1850 -histdata/HiC/Human/IMR90.Rad21.bedGraph -hl Rad21 -hm 500 -ext pdf

注意:还可以通过加入 -g来显示基因track的位置

python ../../../HiCPlotter.py -fChr01_WN_500000 Chr01_WT1_500000 Chr01_WT7_500000 -n WN_Chr01 WT1_Chr01WT7_Chr01 -chr chr1 -r 500000 -hist Chr01_WN_RNAseq.V2.txt,

WN_k27.txt,WN_k4.txt,WN_faire.txtChr01_WT1_RNAseq.V2.txt,WT1_K27.txt,WT1_K4.txt,WT1_faire.txtChr01_WT7_RNAseq.V2.txt,WT7_K27.txt,WT7_K4.txt,WT7_faire.txt -hlRNA_seq,HKme3K27,HKme3K4,FAIRE-

seq RNA_seq,HKme3K27,HKme3K4,FAIRE-seqRNA-seq,HKme3K27,HKme3K4,FAIRE-seq -o Chr01_all_test3 -fh 0 -pi 1 -ptd 1 -hmc 5

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,080评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,422评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,630评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,554评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,662评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,856评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,014评论 3 408
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,752评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,212评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,541评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,687评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,347评论 4 331
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,973评论 3 315
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,777评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,006评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,406评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,576评论 2 349