CUT-Tag概述
所有发生在真核生物 DNA 上的动态过程都发生在染色质中,包括核小体及其修饰、转录因子和染色质相关复合物。各种染色质特征标记了活跃和沉默转录调控元件和染色质区域的位点,这些位点在细胞类型之间不同,并且在发育过程中发生变化。
染色质特征全基因组的图谱传统上是使用染色质免疫共沉淀(ChIP: chromatin immunoprecipitation)进行的,其中染色质是交联和溶解的,对蛋白质的抗体或感兴趣的修饰是用来免疫沉淀结合的 DNA。自从 35 年 前首次描述芯片以来,芯片通常的表现方式几乎没有改变,而且仍然充满了信号噪声和人为因素问题。另一种可供选择的染色质谱分析策略是在原位酶栓( enzyme tethering in situ ),即染色质蛋白或感兴趣的修饰被抗体或融合蛋白靶向。然后,潜在的 DNA 被标记或裂解,在过去的二十年里,一系列的 enzyme-tethering 方法被引入。Cleavage Under Targets & Tagmentation (CUT&Tag) 是一种使用 protein-A-Tn5( pA-Tn5 ) 转座体融合蛋白的连接方法。在 CUT&Tag 中,通透性细胞或细胞核与特定染色质蛋白的抗体孵育,然后负载嵌镶末端接头的 pA-Tn5 被连续地连接到抗体结合位点。通过添加镁离子激活转座体,导致接头整合到附近的 DNA。然后这些基因被扩增,生成测序库。基于 Antibody-tethered Tn5-based 的方法由于 pA-Tn5 系结后严格的样品清洗和接头连接效率高,因此具有很高的灵敏度。相对于 ChIP-seq 而言,改善的信噪比意味着绘制染色质特征所需的 测序量减少了一个数量级,允许样本池 (通常高达 90 个样本) 通过文库的 条形码 barcoded PCR 在 Illumina NGS 测序仪上进行配对末端测序。
CUT&Tag目前的价格比较稳定,如果你有数据分析能力,即可自己购买试剂盒建库,再交由测序公司进行扩增测序,自己再对原始数据进行分析,将会剩下一大笔费用。
CUT-Tag下机数据处理
1.下机数据
CUT-Tag本质上是对转录因子所下拉得DNA序列进行二代测序,因此下机数据和转录组的所类似为fsatq序列。
2.质量控制
此步和转录组一样,对下机数据进行质量控制
mkdir -p ${projPath}/fastqFileQC/${histName}
$projPath/tools/FastQC/fastqc -o ${projPath}/fastqFileQC/${histName} -f fastq ${projPath}/fastq/${histName}_R1.fastq.gz
$projPath/tools/FastQC/fastqc -o ${projPath}/fastqFileQC/${histName} -f fastq ${projPath}/fastq/${histName}_R2.fastq.gz
3.与参考序列进行对比
本次分析的物种是小鼠,因此首先构建了小鼠的索引。
###===构建小鼠索引===###
wget http://hgdownload.cse.ucsc.edu/goldenPath/mm10/bigZips/chromFa.tar.gz
tar -zxvf chromFa.tar.gz
cat *.fa > mm10.fa
bowtie2-build mm10.fa mm10
###===序列对比===###
bowtie2 --end-to-end --very-sensitive --no-mixed --no-discordant --phred33 -I 10 -X 700 -p 1 -x ref/mm10 -1 1.0_Raw/WTC-FH-1_1.fq.gz -2 1.0_Raw/WTC-FH-1_2.fq.gz -S bowtie2/sam/WTC-FH_bowtie2.sam &> bowtie2/bowtie2_summary/WTC-FH_bowtie2.txt
#Tips:这步比较耗时,因此推荐后台运行,连接断开不会影响程序运行。
#后台运行代
nohup bowtie2 --end-to-end --very-sensitive --no-mixed --no-discordant --phred33 -I 10 -X 700 -p 1 -x ref/mm10 -1 1.0_Raw/WTC-FH-1_1.fq.gz -2 1.0_Raw/WTC-FH-1_2.fq.gz -S bowtie2/sam/WTC-FH_bowtie2.sam &> bowtie2/bowtie2_summary/WTC-FH_bowtie2.txt 2>out2.txt 2>&1 &
4.文件转化
## 筛选和保留比对上的双端 reads
samtools view -bS -F 0x04 bowtie2/sam/WTC-ZZQ_bowtie2.sam >bowtie2/bam/WTC-ZZQ_bowtie2.mapped.bam
nohup samtools view -bS -F 0x04 bowtie2/sam/WTC-FH_bowtie2.sam > bowtie2/bam/WTC-FH_bowtie2.mapped.bam 2>bowtie2/bam/bam.output.txt 2>&1 &
## Convert into bed file format
#转化文件格式
bedtools bamtobed -i $projPath/alignment/bam/${histName}_bowtie2.mapped.bam -bedpe >$projPath/alignment/bed/${histName}_bowtie2.bed
## Keep the read pairs that are on the same chromosome and fragment length less than 1000bp.
#保留那些在同一条染色体且片段长度小于 1000bp 的双端 reads
awk '$1==$4 && $6-$2 < 1000 {print $0}' $projPath/alignment/bed/${histName}_bowtie2.bed >$projPath/alignment/bed/${histName}_bowtie2.clean.bed
## Only extract the fragment related columns
#只提取与片段相关的列
cut -f 1,2,6 $projPath/alignment/bed/${histName}_bowtie2.clean.bed | sort -k1,1 -k2,2n -k3,3n >$projPath/alignment/bed/${histName}_bowtie2.fragments.bed
5.生成bigwig文件
生成的bigwig文件可在IGV软件上进行查看,如图所示:
mkdir -p $projPath/alignment/bigwig
samtools sort -o bowtie2/bam/WTC-ZZQ_bowtie2.sorted.bam bowtie2/bam/WTC-ZZQ_bowtie2.mapped.bam
samtools index bowtie2/bam/WTC-ZZQ_bowtie2.sorted.bam
bamCoverage -b bowtie2/bam/WTC-ZZQ_bowtie2.sorted.bam -o bowtie2/bigwig/WTC-ZZQ_raw.bw
因本次实验仅仅是一个预实验,没有设置重复,也没有进行其他的分析,只是初步的看下实验和对照有无差异。如果想进行完整的CUT-Tag分析,可以通过其官网上进行学习(PS:学习任何一种技术,最便捷的方法就是通过其官网进行学习)