YinYuan-001/muntjac_code (github.com)
Step1 Hic-Pro
将参考基因组改名为ref.fa
文件准备
1. 索引
bowtie2-build ref.fa ref,得到六个bt2⽂件, 放在ref⽂件夹中
2. 酶切位点
/home/anx21/software/HiC-Pro-3.1.0/bin/utils/digest_genome.py -r ^GATC -o ref.bed ref.fa
3. 基因组大小
samtools faidx ref.fa
awk '{print $1 "\t" $2 }' ref.fa.fai > ref.sizes
4. Hic数据改名,放在rawdata/sample1的⽂件夹中
ref_R1.fastq.gz
ref_R2.fastq.gz
最后的文件位置:【GS=ref】
微信截图_20240924161406.png
- 配置文件:
# Please change the variable settings below if necessary
#########################################################################
## Paths and Settings - Do not edit !
#########################################################################
TMP_DIR = tmp
LOGS_DIR = logs
BOWTIE2_OUTPUT_DIR = bowtie_results
MAPC_OUTPUT = hic_results
RAW_DIR = rawdata
#######################################################################
## SYSTEM AND SCHEDULER - Start Editing Here !!
#######################################################################
N_CPU = 100
SORT_RAM = 8000M
LOGFILE = hicpro.log
JOB_NAME = GS ###更改
JOB_MEM = 600gb
JOB_WALLTIME =
JOB_QUEUE =
JOB_MAIL =
#########################################################################
## Data
#########################################################################
PAIR1_EXT = _R1
PAIR2_EXT = _R2
#######################################################################
## Alignment options
#######################################################################
MIN_MAPQ = 10
BOWTIE2_IDX_PATH = /opt/synData2/wangyinjia16/hicpro/GS/ref ###更改
BOWTIE2_GLOBAL_OPTIONS = --very-sensitive -L 30 --score-min L,-0.6,-0.2 --end-to-end --reorder
BOWTIE2_LOCAL_OPTIONS = --very-sensitive -L 20 --score-min L,-0.6,-0.2 --end-to-end --reorder
#######################################################################
## Annotation files
#######################################################################
REFERENCE_GENOME = GS ###更改
GENOME_SIZE = GS.sizes ###更改
#######################################################################
## Allele specific analysis
#######################################################################
ALLELE_SPECIFIC_SNP =
#######################################################################
## Capture Hi-C analysis
#######################################################################
CAPTURE_TARGET =
REPORT_CAPTURE_REPORTER = 1
#######################################################################
## Digestion Hi-C
#######################################################################
GENOME_FRAGMENT = GS.bed ###更改
LIGATION_SITE = GATCGATC ###更改
MIN_FRAG_SIZE =
MAX_FRAG_SIZE =
MIN_INSERT_SIZE =
MAX_INSERT_SIZE =
#######################################################################
## Hi-C processing
#######################################################################
MIN_CIS_DIST =
GET_ALL_INTERACTION_CLASSES = 1
GET_PROCESS_SAM = 0
RM_SINGLETON = 1
RM_MULTI = 1
RM_DUP = 1
#######################################################################
## Contact Maps
#######################################################################
BIN_SIZE = 20000 40000 100000 150000 500000 1000000
MATRIX_FORMAT = upper
#######################################################################
## Normalization
#######################################################################
MAX_ITER = 100
FILTER_LOW_COUNT_PERC = 0.02
FILTER_HIGH_COUNT_PERC = 0
EPS = 0.1
运行HiC-Pro
/home/anx21/software/HiC-Pro-3.1.0/bin/HiC-Pro -i /opt/synData2/wangyinjia16/hicpro/GS/rawdata -o rusult -c config-hicpro.txt
Step2 TAD边界鉴定
~/miniconda3/envs/cworld/bin/python /data/01/user186/script/muntjac_code/Hi-C_analysis/00.construct_matrix/scripts/sparseToDense.py -b sample1_20000_abs.bed sample1_20000.matrix --perchr
####拆分染色体做
mkdir Chr1
python /data/01/user186/script/muntjac_code/Hi-C_analysis/05.TAD_identification_and_comparison/scripts/runchangematrix.insulation.py -i sample1_20000_Chr1_dense.matrix -g GS -c Chr1 -o Chr1 -s 20000
perl -I /data/00/user/user186/perl5/cworld-dekker/lib /data/00/user/user186/perl5/cworld-dekker/scripts/perl/matrix2insulation.pl -i Chr1/GS_Chr1_20000.insulation.matrix -o Chr1 --is 1000000 --ids 240000
Step3 AB区室鉴定
perl /data/01/user186/script/muntjac_code/Hi-C_analysis/03.compartment_identification_and_comparison/scripts/matrix2compartment.pl -i Chr1/GS_Chr1_150000.insulation.matrix -o Chr1 --et
python /data/01/user186/script/muntjac_code/Hi-C_analysis/03.compartment_identification_and_comparison/scripts/matrix2EigenVectors.py -i Chr1.zScore.matrix.gz -r ../../GS.filter.final.geneSymbol.gff3 -v