1、安装
HiC-Pro的安装可参考github:这里
2、具体使用
其实HIiC-Pro的使用方法简单来讲主要有三个参数:
$ /usr/local/bin/HiC-Pro_2.11.1/bin/HiC-Pro -i path/data -c path/config-hicpro.txt -o path/outfile
-i 输入的是fastq文件所在路径,需要注意的是:文件路径是指fastq文件所在位置的上两层
如:下方图片,-i时,路径只需写到 PATH/data 即可!
-c 为HiC-Pro的config-hicpro.txt 文件所在路径
-o 为输出文件路径
其中,三个参数较麻烦一点的是,-c 中config-hicpro.txt文件的修改,主要修改有以下几点:
1、PAIR1_EXT,此处 '=' 后面所写的的内容是 fastq 文件的名称
PAIR1_EXT = file1_R1 (此处和上方图片相对应)
PAIR2_EXT = file2_R2 (此处和上方图片相对应)
2、BOWTIE2_IDX_PATH 是bowtie2建立的参考基因组索引所在文件路径
BOWTIE2_IDX_PATH = /PATH/Genome/mm10_index
3、REFERENCE_GENOME = mm10_index ,此处 '=' 后面内容应是索引文件名称,否则,在HiC-Pro运行时可能会报错
REFERENCE_GENOME = mm10_index
4、GENOME_SIZE 为染色体大小文件路径(此文件可在下载基因组文件时同时下载)
GENOME_SIZE = /PATH/Genome/mm10_chrom.sizes
5、GENOME_FRAGMENT 为酶切消化片段位点文件路径:
GENOME_FRAGMENT = /PATH/Genome/hindiii_mm10.bed
具体生成方法:可以通过HiC-Pro文件中的'digest_genome.py'文件生成,此处用的是小鼠的mm10参考基因组,建库的酶为hindiii,那么命令行如下:
$ /PATH/HiC-Pro/bin/utils/digest_genome.py -r hindiii -o PATH/mm10_hindiii mm10.fa
6、LIGATION_SITE = AAGCTAGCT 此处填写新的连接位点