m6A上游 | 5 MACS2 peak calling

第3篇:用MACS2软件call peaks - 云+社区 - 腾讯云 (tencent.com)

MACS2软件call m6A甲基化peaks - 简书 (jianshu.com)

macs2 - 简书 (jianshu.com)

https://mp.weixin.qq.com/s/61VRtPkuRaHSxWeMxvispA  

MeRIP-seq 数据分析之 callpeak 及 peak 可视化


#######下载(新集群py37)

conda activate py37

pip install MACS2

#####################

conda install -c bioconda macs2

conda install -c bioconda/label/cf201901 macs2


了解相关参数:

1.输入文件参数:

-t: 实验组,IP的数据文件

c: 对照组

f:指定输入文件的格式,默认是自动检测输入数据是什么格式,支持bam,sam,bed

g:有效基因组大小,由于基因组序列的重复性,基因组实际可以mapping的大小小于原始的基因组。这个参数要根据实际物种计算基因组的有效大小。软件里也给出了几个默认的-g 值:hs -- 2.7e9表示人类的基因组有效大小(UCSC human hg18 assembly).

hs: 2.7e9;mm: 1.87e9;ce: 9e7;dm: 1.2e8

2.输出文件参数:

--outdir:输出结果的存储路径 -n:输出文件名的前缀

-B/--bdg:输出bedgraph格式的文件,输出文件以NAME+'_treat_pileup.bdg' for treatment data, NAME+'_control_lambda.bdg' for local lambda values from control显示。

3.peak calling 参数:

-q/--qvalue-p/--pvalue      

q value默认值是0.05,与pvalue不能同时使用。 

q值与峰宽有一定的联系。理想情况下,如果放宽阈值,您将简单地获得更多的峰值,但是使用MACS2放松阈值也会导致更宽的峰值。

--broad                peak有narrow peak和broad peak, 设置时可以call broad peak 的结果文件。

--broad-cutoff     和pvalue、以及qvalue相似

--nolambda:     不要考虑在峰值候选区域的局部偏差/λ

4.Shift 模型参数:

--nomodel     这个参数和extsize、shift是配套使用的,有这个参数才可以设置extsize和shift。

--extsize          当设置了nomodel时,MACS会用--extsize这个参数从5'->3'方向扩展reads修复fragments。比如说你的转录因子结合范围200bp,就设置这个参数是200。

--shift               当设置了--nomodel,MACS用这个参数从5' 端移动剪切,然后用--extsize延伸,如果--shift是负值表示从3'端方向移动。建议ChIP-seq数据集这个值保持默认值为0,对于检测富集剪切位点如DNAsel数据集设置为EXTSIZE的一半。

用法

#####################

awk '{print "macs2 callpeak -c 5.STAR_allignment/"$5"_Input/"$5"_InputAligned.sortedByCoord.out.bam -t 5.STAR_allignment/"$5"_IP/"$5"_IPAligned.sortedByCoord.out.bam -q 0.05 -f BAM -g hs -n 7.Macs2CallPeak/"$5"/"$5"_IP_Input"}' sampleinfo.input | xargs -iCMD -P30 bash -c CMD

################

常规峰值调用的示例:macs2 callpeak -t ChIP.bam -c Control.bam -f BAM -g hs -n test -B -q 0.01

宽峰调用示例:macs2 callpeak -t ChIP.bam -c Control.bam --broad -g hs --broad-cutoff 0.1

#######################

macs2 callpeak -t 116si_p.ip_siWTAP.bam \

           -c 116si_p.input_siWTAP.bam \

           -g hs -q 0.05 -f BAM

#有control数据

fori in *.bamdomacs2 callpeak -f BAM -c control.bam -t$i-n$i-g hs --outdir ../macs2/ --bdg -q 0.05done



基本选项

-t/--treatment FILENAME,IP 样本

这是MACS唯一的REQUIRED参数。文件可以是任何文件--format选项指定的受支持格式。检查 - 格式化详情。如果您有多个对齐文件,则可以指定

他们是-t A B C。 MACS会将所有这些文件汇集在一起。

-c/--control,Input 样本

控件或模拟数据文件。请与-t对应的control

-n/--name 【结果】文件的前缀

实验的名称字符串。 MACS将使用此字符串NAME创建输出文件,如NAME_peaks.xls,NAME_negative_peaks.xls,NAME_peaks.bed,NAME_summits.bed,NAME_model.r等等。所以请避免这些文件名和您的文件名之间的任何冲突现有文件。

--outdir  【输出文件夹】

MACS2会将所有输出文件保存到speficied文件夹中选项。

-f/--format FORMAT

标签文件的格式,可以是“ELAND”,“BED”,“ELANDMULTI”,“ELANDEXPORT”,“ELANDMULTIPET”(用于对端标签),“SAM”,“BAM”,“BOWTIE”,“BAMPE”或“BEDPE”。默认为“AUTO”,这将允许MACS自动决定格式。当您使用“AUTO”时也会使用

结合不同格式的文件。请注意,MACS无法检测到“BAMPE”或“BEDPE”格式带有“AUTO”,你必须隐含指定“BAMPE”和“BEDPE”的格式。

如今,最常见的格式是BED或BAM / SAM。

-g / --gsize,有效基因组大小,可以是数字,也可以是:hs,mm,ce,dm。

这是可映射的基因组大小或有效的基因组大小。定义为可以测序的基因组大小。因为在chromsomes上的重复特征,实际可映射的基因组大小将小于原始大小,约为基因组的90%或70%尺寸。对于UCSC人类hg18,建议使用默认的hs  -  2.7e9。以下是有效基因组的所有预编译参数。

size:

hs:2.7e9

mm:1.87e9

ce:9e7

dm:1.2e8

-q/--qvalue

调用重要区域的qvalue(最小FDR)默认是0.05。对于广泛的标记,您可以尝试0.05作为cutoff。 Q值是使用Benjamini-Hochberg程序从p值计算。

-p/--pvalue

如果指定了-p,则MACS2将使用pvalue代替qvalue。

--broad

设置该参数,MACS将尝试合并广泛的区域, The maximum length of broad region length is 4 times of d from MACS. DEFAULT:False。

-B/--bdg,保留the fragment pileup,control lambda到 bedGraph 文件。

bedGraph files will be stored in current directory named

--fe-cutoff:fold-enrichment。

--keep-dup:保留重复的 tag。

--outdir:文件输出路径。

-n:输出文件名称前缀。

-B:保留the fragment pileup,control lambda到 bedGraph 文件。

--SPMR:normalized pileup tracks across many datasets,可以在样本间进行比较 peaks。

--nomodel:不使用 macs2 建立 shifting model。

--extsize:与--nomodel 一起使用,从 5'->3'延伸 fragment 到指定长度。

--fe-cutoff:fold-enrichment。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,222评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,455评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,720评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,568评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,696评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,879评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,028评论 3 409
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,773评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,220评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,550评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,697评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,360评论 4 332
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,002评论 3 315
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,782评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,010评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,433评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,587评论 2 350

推荐阅读更多精彩内容