安装Homer
mkdir homer && cd homer
wget http://homer.ucsd.edu/homer/configureHomer.pl
#检查依赖软件是否已安装,一般生信服务器上都安装有对应软件
perl configureHomer.pl -check
# 下载安装Homer
perl configureHomer.pl -install
echo "export PATH=$PWD:/bin" >> ~/.bashrc
source ~/.bashrc
查看Homer支持哪些物种
perl configureHomer.pl -list
下载对应的物种的数据源(本次的实验物种是水稻)
perl configureHomer.pl -install rice
perl configureHomer.pl -install rice.IRGSP-1.0
安装其他配套软件
- samtools
- R
R需要安装的依赖包有DESeq2,edgeR
开始分析预测motif
findMotifsGenome.pl <peak/BED file> <genome> <output directory> -size # [options]
HOMER peak文件有至少5列:
Peak ID | 染色体 | 起始位置 | 终止位置 | 链的方向(+/- or 0/1, where 0="+", 1="-") |
---|---|---|---|---|
chr1_peak1 | chr1 | 1213 | 5688 | + |
findMotifsGenome.pl T0h.Homerpeak.txt rice.IRGSP-1.0 T0h
需要注意的点,有可能你的基因的chr的字符串可能和数据库里的不一致,此时你就直接指定你自己的参考基因组文件即可
findMotifsGenome.pl T0h.Homerpeak.txt rice.IRGSP-1.0.genome.fa T0h -p 16
参数说明:
-bg backgroundpeak.bed
#默认是使用基因组作为背景,如果要是有多组之间比较的话,可以使用该参数,指定其他的组的peak bed作为背景
-p 16
指定使用16个cpu运算
输出结果介绍
输出结果在上面指定的第三个参数文件夹T0h
内
homerMotifs.all.motifs 所有的各种长度的motifs
homerMotifs.motifs10 长度为10的motifs
homerMotifs.motifs12
homerMotifs.motifs8
homerResults de novo的motif信息的文件夹
-
homerResults.html de novo 预测的motifs
knownResults 已知的motif信息的文件夹
-
knownResults.html
knownResults.txt
motifFindingParameters.txt 运行Homer的各种参数设定
seq.autonorm.tsv 短核苷酸序列自动矫正情况