ChIP-seq 质量检测

1. Call peaks 并去除blacklists

sample=SRR6322534

## callpeak
input=SRR6322538

gsize=199000000  #  190M
macs2 callpeak -t ./$sample.ff.bam -c ./$input.ff.bam -f BAM -n $sample -g $gsize --keep-dup all

# filter peaks against blacklist
bedtools intersect -a ${sample}_peaks.narrowPeak -b ../ref/blacklist.bed -f 0.25 -v >${sample}_peaks.f.narrowPeak

2. 计算文库复杂度 #注意这里采用的是未过滤的bam files。

image.png
thread=2   #设置线程数目,要设置,后面用到负责会报错。
#打印表头
echo -e "#TotalReads\tDistinctReads\tOneRead\tTwoReads\tNRF=Distinct/Total\tPBC1=OneRead/Distinct\tPBC2=OneRead/TwoReads" >$sample.pbc.metrics.txt 

#计算one reads two reads 的数目 #主要考虑的是坐标起始是否一致,如果一致则是重复
bedtools bamtobed -i $sample.qf.bam | awk 'BEGIN{OFS="\t"}{if($6=="+"){print $1,$2,$6} else{print $1,$3,$6}}' | sort --parallel=$thread | uniq -c | awk 'BEGIN{mt=0;m0=0;m1=0;m2=0} ($1==1){m1=m1+1} ($1==2){m2=m2+1} {m0=m0+1} {mt=mt+$1} END{printf "%d\t%d\t%d\t%d\t%f\t%f\t%f\n",mt,m0,m1,m2,m0/mt,m1/m0,m1/m2}' >> $sample.pbc.metrics.txt

cat $sample.pbc.metrics.txt
#TotalReads DistinctReads   OneRead    TwoReads    NRF=Distinct/Total   PBC1=OneRead/Distinct   PBC2=OneRead/TwoReads
1521604     1492475         1464416         27418         0.980856           0.981200           53.410752
image.png

3. 计算FRIPs

image.png
## FRiP
all_c=$(sed -n 's/^# .* in treatment: \([0-9]\)/\1/p' ${sample}_peaks.xls)       #从peaks.xls文件中计算总的reads counts
peak_c=$(samtools view -L ${sample}_peaks.narrowPeak $sample.ff.bam | wc -l)    #计算bam 文件中落在peaks区域的reads counts
echo -e "#Total reads\tPeaks reads\tFRiP" >$sample.FRiP.metrics.txt   #保存表头
echo -e "${all_c}\t${peak_c}" | awk '{print $1"\t"$2"\t"$2/$1}' >>$sample.FRiP.metrics.txt   #计算FRIPs值 并保村
cat $sample.FRiP.metrics.txt 
#Total reads        Peaks reads       FRiP
1469342              15114          0.0102862

4. 计算cross co-rrelation

image.png

## cross correlation
# this need to install phantompeakqualtools, see https://github.com/kundajelab/phantompeakqualtools

sample=SRR6322534
gsize=199000000

run_spp.R -rf -c=${sample}.ff.bam -p=4 -s=-500:5:500 -savp=${sample}.cc.pdf -out=${sample}.cc.metrics.txt

#展示结果
cat  SRR6322534.cc.metrics.txt 
SRR6322534.ff.bam   1469342 115,130,170 0.197323712213789,0.197220698531932,0.197185630044492   80  0.1973325   500 0.1941522   1.016335    0.9972433   0
image.png

一把来说length of fragment 选择第一个即可

注释

image.png

参考:基因课------表观基因组学之 ChIP-seq 数据分析

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,193评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,306评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,130评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,110评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,118评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,085评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,007评论 3 417
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,844评论 0 273
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,283评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,508评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,667评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,395评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,985评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,630评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,797评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,653评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,553评论 2 352

推荐阅读更多精彩内容