小王的ChIP-seq傻瓜学习教程(纠错更新中)

一套H3K4me3的数据，GSE167940，单端single，无input!!有了！一翻邮件交流发给我了

一套H3K27ac的数据，GSE165809，单端single，有input

H3K4me3

H3K27ac

1、使用SRA-Toolkit转换SRA为fastq并压缩

module load SRA-Toolkit

fastq-dump SRR*(通配符表示对该文件夹下所有SRR开头的文件操作)

#解压这步的高级用法，fastq-dump默认最多6线程。#fasterq-dump -e 30 SRR*

gzip *.fq

#压缩也有高剂用法，多线程软件pigz，#pigz -p 30 *fastq

用的是SRATools

2、Trim_galore质控及去接头

首先判断片段长度

zcat SRR.fastq.gz |head -n 10

大差不差都50

判断首先判断pread类型

less $1 | head -n 1000 | awk '{if(NR%4==0) printf("%s",$0);}' \

| od -A n -t u1 -v \

| awk 'BEGIN{min=100;max=0;} \

{for(i=1;i<=NF;i++) {if($i>max) max=$i; if($i<min) min=$i;}}END \

{if(max<=126 && min<59) print "Phred33"; \

else if(max>73 && min>=64) print "Phred64"; \

else if(min>=59 && min<64 && max>73) print "Solexa64"; \

else print "Unknown score encoding"; \

print "( " min ", " max, ")";}'

均为33

使用TrimGalore质控

trim_galore -q 25 -j 5 --phred33 --length 25 -e 0.1 --stringency 4 -o ./ *gz

#-j 是线程，最大8就可以了，软件用不了,但必须在py3环境下，否则会自动切换单线程

3、Bowtie2比对

需要提前下载参考基因组然后使用命令构建索引，或者直接就下载索引文件index：

用bowtie2官网提供的index

！！！这块还不会得问师兄

服务器上有index直接用

比对的时候发现一个问题，index存放再bowtie2文件夹下，含有六个文件。-x index的路径不但精确到文件夹，还要精确到6个mm10文件，前缀必须是mm10不然会报错（如下图）

或者可以提前定义一下路径 index=/storage2/anlei/reference/index/bowtie2/mm10/mm10

bowtie2 -p 50 -x /storage2/anlei/reference/index/bowtie2/mm10/mm10 --very-sensitive -X 2000 -U SRR13811453_trimmed.fq.gz -S /storage2/anlei/wangwenjing/ChIP-seq/bowtie2/SRR13811453.sam

附上4个文件的比对结果。

4、Samtools对文件sam转bam并排序

#先转格式

samtools sort -O bam -@50 SRR13579713.sam -o SRR13579713.raw.bam

#再排序

samtools sort -@ 50 -n SRR13579713.raw.bam -o SRR13579713.sort.bam

5、sort.bam文件去PCR重复

https://wenku.baidu.com/view/97dfc4227a563c1ec5da50e2524de518964bd3dd.html

#fixmate 以名称排序的定位alignment填入配对的座标，ISIZE（inferred insert size猜测的插入序列大小）对相应的标签（flag)

samtools fixmate -@ 50 -m SRR13579713.sort.bam SRR13579713.sort.fixed.bam

#再排序

samtools sort -@ 50 SRR13579713.sort.fixed.bam -o SRR13579713.position.fixed.bam

samtools markdup -@ 50 -r SRR13579713.position.fixed.bam SRR13579713.rmdup.bam

samtools flagstat SRR13579713.rmdup.bam > SRR13579713.rmdup.alignment.flagstat

samtools stats SRR13579713.rmdup.bam > SRR13579713.rmdup.alignment.stat

#multiqc软件质控

multiqc *stat

结果会生成一个文件夹和一个html文件，就是质控的结果

#对排序后的序列索引，用于快速的随机处理，此处将产生.bai文件

samtools index SRR13579713.rmdup.bam

#bedtools转为bed格式

bedtools bamtobed -i SRR13579713.rmdup.bam > SRR13579713.rmdup.bed

5、使用MACS2进行Call peaks

##必须有input，不然会假阳性的

https://www.jianshu.com/p/d62b42ab0d51

对于不同的对象（TF、组蛋白、ATAC参数都不一样）

https://www.likecs.com/show-204987447.html

#narrow、broad、gapped peaks format的区别与联系

macs2 callpeak -f BED -n "H3K27ac_hCG_4h" --keep-dup all -t SRR13579715.rmdup.bed -c SRR13579716.rmdup.bed -g mm --broad-cutoff 0.1

#################################################################

其实我觉得到这里就结束了，前面call peak之后产出的就是相对于input矫正后的富集peak了。以下什么bam啊bw啊之类的，都是没有input矫正的，也就在IGV看看。

deeptools将bam文件转bw标准化

用去除PCR重复的rmdup.bam，需要有bai文件在参考：https://www.jianshu.com/p/491557586118

bamCoverage --bam SRR13579713.rmdup.bam -o SRR13579713.bw --normalizeUsing CPM --effectiveGenomeSize 2913022398 --binSize 10 -p50

bamCoverage --bam SRR13579715.rmdup.bam -o /storage2/anlei/wangwenjing/ChIP-seq/deeptools/bw/SRR13579715.bw --normalizeUsing CPM --effectiveGenomeSize 2913022398 --binSize 10 -p50

--normalizeUsing师兄说他经常用CPM

-binSize应该是默认10

--effectiveGenomeSize：可比对基因组区域的大小（bp），可以从这里查http://deeptools.readthedocs.io/en/latest/content/feature/effectiveGenomeSize.html

--scaleFactor：数值，可以是由spike-in推算的校正因子

--numberOfProcessors, -p ：使用的线程数

最后编辑于：2022.10.07 15:43:01

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 218,036评论 6赞 506
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 93,046评论 3赞 395
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 164,411评论 0赞 354
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,622评论 1赞 293
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,661评论 6赞 392
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,521评论 1赞 304
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,288评论 3赞 418
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 39,200评论 0赞 276
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,644评论 1赞 314
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,837评论 3赞 336
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,953评论 1赞 348
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,673评论 5赞 346
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,281评论 3赞 329
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,889评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 33,011评论 1赞 269
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 48,119评论 3赞 370
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,901评论 2赞 355