Cut&tag数据分析流程 homer工具自定义参考基因组 load custom genome

Cut&tag数据分析流程

1.数据为clean版本,对数据为进行质控

reads 开始时序列内容不一致是 CUT&Tag reads 中常见的现象。 没有通过每个基本的 sequnence 内容不意味着你的数据失败

可能由于是 Tn5 的偏好性

您可能检测到的是 10 bp 的周期性,该周期性在长度分布中显示为锯齿状。如果是这样,这是正常现象,不会影响校准或 Peak calling。无论如何,我们都不建议您修剪 reads,因为我们列出的 bowtie2 参数将提供准确的 mapping 信息而无需修剪

2.用 bowtie2进行比对

参考基因组索引建立 采用华中农大SWO.v3.0.genome.fa  华中农大参考基因组

比对参数 bowtie2 --end-to-end --very-sensitive --no-mixed --no-discordant --phred33 -I 10  比对部分参考文章bowtie2比对


3.比对的sam文件转换成bam文件 samtools工具

命令:$ samtools view -bS abc.sam > abc.bam

sam文件如图


bam文件为二进制文件但运行速度快,方便后续homer进行peakcalling.

4.homer软件进行peakcalling 步骤:

4.1 比对基因组得到bam文件之后,首先用通过makeTagDirectory这个命令,生成一个文件夹,用法如下 详细参考

makeTagDirectory out_dir align.bam

findPeaks out_dir / -style factor -o homer.peak.bed  (https://www.jianshu.com/p/2e0c884d13d0)

#完成peak calling  数据保存在bed文件内 和txt文件内

5.custom motif 分析

通过homer findMotifsGenome.pl 脚本进行基因组 motif预测 代码为 findMotifsGenome.pl peaks.txt ALF.fasta OutputResults/  

homer的findpeaks命令官方详解homer findpeaks


homer 的 de nove motif分析 报告参数解释 motif结果分析

homer软件自带了一些人类 ,小鼠,拟南芥等模式动植物的参考基因组,如果homer没有内置你需要的物种基因组 可以通过loadgenome.pl命令内置.

#将甜橙基因组加入到homer参考数据库  官方文档 loadgenome.pl自定义参考基因组和注释

注释文件格式转换

软件cufflink先将华农甜橙的数据SWO.v3.0.gene.model.gff3 转换成SWO.v3.0.gene.model.gtf格式 方便homer载入注释

gffread SWO.v3.0.gene.model.gff3  -T -o SWO_V3_model.gtf

载入homer参考基因组的命令:

 loadGenome.pl -name SWO_V3_right -org null -fasta SWO.v3.0.genome.fa -gtf ./SWO_v3_gene_model_gff3/SWO_V3_model.gtf

载入homer的甜橙基因组为 SWO_V3_right

载入homer甜橙参考基因组之后 motif预测分析命令为:

findMotifsGenome.pl 92_homer_peak.bed  SWO_V3_right  92_de_nove_motif/  -size 200 -len 6

结果分析报告

In general, when analyzing ChIP-Seq / ChIP-Chip peaks you should expect to see strong enrichment for a motif resembling the site recognized by the DNA binding domain of the factor you are studying.  Enrichment p-values reported by HOMER should be very very significant (i.e. << 1e-50).  If this is not the case, there is a strong possibility that the experiment may have failed in one way or another.  For example, the peaks could be of low quality because the factor is not expressed very high.

homer需要另外关注的一些东西Finding instances of motifs near peaks(http://homer.ucsd.edu/homer/ngs/quantification.html)

找到预测的motif之后将motif回帖到参考基因组有三种方式

方法1:The scanMotifGenomeWide.pl script will take a motif file (may contain multiple motifs) and look for instances across the genome.  The basic command looks like this (output file is sent to stdout):

scanMotifGenomeWide.pl <motif file> <genome> [options]

例:scanMotifGenomeWide.pl /home/xz/biodata_cut_tag/biodata2021-12-23/alignment/92_team/92_de_nove_motif/knownResults/known26.motif  SWO_V3_right  -bed > /home/xz/biodata_cut_tag/biodata2021-12-23/alignment/92_team/92_motif_annote/known_motif26_ASL18_LOBAS2/92_motif26_to_swo3_.bed

scanMotifGenomeWide.pl pu1.motif mm9 -bed > pu1.sites.mm9.bed  参考文档

方法2:1. Run findMotifsGenome.pl with the "-find <motif file>" option.  This will output a tab-delimited text file with each line containing an instance of the motif in the target peaks.  The output is sent to stdout.

For example: findMotifsGenome.pl ERalpha.peaks hg18 MotifOutputDirectory/ -find motif1.motif > outputfile.txt

The output file will contain the columns:

Peak/Region ID

Offset from the center of the region

Sequence of the site

Name of the Motif

Strand

Motif Score (log odds score of the motif matrix, higher scores are better matches)

findMotifsGenome.pl ./92_homer_peak.bed  SWO_V3_right  outdir/ -find ./known39.motif >  motif39_2.txt

findMotifsGenome.pl 92_homer_peak.bed SWO_V3_right -find /home/xz/biodata_cut_tag/biodata2021-12-23/alignment/92_team/92_de_nove_motif/knownResults/known26.motif >  home/xz/biodata_cut_tag/biodata2021-12-23/alignment/92_team/92_motif_annote/known_motif26_ASL18_LOBAS2/motif_26_2.txt

方法3:Run annotatePeaks.pl with the "-m <motif file>" option (see the annotation section for more info).  Chuck prefers doing it this way.  This will output a tab-delimited text file with each line containing a peak/region and a column containing instance of each motif separated by commas to stdout

参考文档

annotatePeaks.pl ERalpha.peaks hg18 -m motif1.motif > outputfile.txt

other:脚本文件 根据txt文件得染色体位置 找序列

#!/bin/bash    #通过samtools 可以用染色体的位置信息找序列 不过也需要先建立samtools索引

#根据92_peak_site_seq.txt 染色体位置找到对应序列

cat 92_peak_site_seq.txt | while read i

do

        chr_num=$(echo ${i}|cut -d ' ' -f 1)

        start_num=$(echo ${i}|cut -d ' ' -f 2)

        end_num=$(echo ${i}|cut -d ' ' -f 3)

        echo "${chr_num}:${start_num}-${end_num}"

        samtools faidx /home/xz/biodata_cut_tag/biodata2021-12-23/SWO_GENOME_REF/SWO.v3.0.genome.fa  ${chr_num}:${start_num}-${end_num} >>seq.txt      #找到序列

done

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,558评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,002评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,036评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,024评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,144评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,255评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,295评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,068评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,478评论 1 305
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,789评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,965评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,649评论 4 336
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,267评论 3 318
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,982评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,223评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,800评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,847评论 2 351

推荐阅读更多精彩内容