HiCExplorer
1、数据比对bowtie2
注意:
1、比对时采用--reorder参数,确保以fastq完全相同的顺序输出sam文件
2、采用部分比对参数,以代替端到端比对。因为HiC是嵌合片段,因此使用部分比对提高比对效率
3、调整比对参数
2、数据的预质控hicQuickQC
第一次评估数据质量(建议设置restriction enzyme和dangling end参数)
3、创建矩阵hicBuildMatrix
#使用例子
$ hicBuildMatrix --samFiles ./M1-1_TKD180602129/bowtie2-local/M1-1_1.sam ./M1-1_TKD180602129/bowtie2-local/M1-1_2.sam -bs 5000 -seq GATC -b ./0new_2020.09.07/M1-1/M1-1.bam -o ./0new_2020.09.07/M1-1/M1-1-matrix.h5 --QCfolder ./0new_2020.09.07/M1-1/M1-1QC
4、hicQC
hicQC可以处理hicbuildmatrix产生的日志文件,将多样本信息整合到一个图表中,并生成一个HTML
$ hicQC --logfiles ./0new_2020.09.07/WT-1/WT-1QC/QC.log ./0new_2020.09.07/WT-2/WT-2QC/QC.log ./0new_2020.09.07/M1-1/M1-1QC/QC.log ./0new_2020.09.07/M1-2/M1-2QC/QC.log ./0new_2020.09.07/M2-1/M2-1QC/QC.log ./0new_2020.09.07/M2-2/M2-2QC/QC.log --labels WT-1 WT-2 M1-1 M1-2 M2-1 M2-2 --outputFolder ./0new_2020.09.07/QC_all_samples
5、hicCorrelate
样本相关性热图(使用原始矩阵,不要使用纠正过的矩阵)
6、hicSumMatrix
$ hicSumMatrices -m ./M1/M1-1-matrix.h5 ./M1/M1-2-matrix.h5 -o ./M1/M1_Sum.h5
7、hiccorrectmatrix
$ hicCorrectMatrix correct -m ./M1/M1_Sum.h5 --filterThreshold -1.5 5 -o ./M1_corrected.h5
INFO:hicexplorer.hicCorrectMatrix:matrix contains 1114921 data points. Sparsity 0.858.
normalisation factor is 0.01114
8、hicplotmatrix
$ hicPlotMatrix -m ./4_hiccorrect/WT_corrected.h5 -out ./5_hicplotmatrix/WT-5k -t WT-5k --region NC_016845.1 --vMin 1 --vMax 100 --dpi 200 --clearMaskedBins --log1p
INFO:hicexplorer.hicPlotMatrix:Cooler or no cooler: False
INFO:hicexplorer.hicPlotMatrix:min: 0.4402606649101524, max: 7520.797218420137
9、hiccomparematrix
$ hicCompareMatrices --matrices matrix.h5 matrix.h5 --outFileName OUTFILENAME --operation log2ratio
10、hicFindTADs
$ hicFindTADs -m ./4_hiccorrect/M1_corrected.h5 --outPrefix ./7_hicfindTADs/M1_corrected_min15000_max50000_step2500_thres0.05_delta0.01_fdr --minDepth 15000 --maxDepth 50000 --step 2500 --thresholdComparisons 0.05 --delta 0.01 --correctForMultipleTesting fdr
11、hicPCA(此步得出的bw文件画图感觉不是很对,可能我参数没调整好。所以我A/B分析用的Cscore)
$ hicPCA -m ./4_hiccorrect/M1_corrected.h5 -o ./8_HicPCA/M1-PCA -noe 1 -f bigwig --chromosomes NC_016845.1 --method dist_norm
12、hicPlotTADs(pyGenomeTrack)
hicPlotTADs --tracks ./9_track/m1-m2-track.ini --region NC_016845.1:1-5000000 -t m1-m2 -o ./9_track/m1-m2.pdf
在第7步校正之前可以先标准化再进行校正,另外HICexplorer还可以画dis_count(类似互作频率与距离的衰减曲线),以及其他的功能