软件学习——模体搜索MEME-ChIP

The MEME suite 是一组功能强大的，基于网页的集成工具，可用于研究蛋白质，DNA 和 RNA 中的序列模体。

The MEME Suitehttps://meme-suite.org/meme/可以通过这个网址访问主页

The MEME suite

用 MEME 搜索模体

Step1：工具准备

将用到 MEME 套件下的 MEME-ChIP 工具，由于高通量测序的进步导致大型高质量数据集的快速增长，包括转录因子(TFs)ChIP-seq 实验产生的数据集。尽管有很多现有的工具可以用这类数据集来发现转录因子结合位点，但大多数基于网页的工具无法直接处理此类大型数据集。

The MEME suite

MEME-ChIP

此工具旨在分析 ChIP-seq 的 “峰值区域”，也就是说仅分析峰值周围的短基因组区域，给定一组基因组的区域后它将依次值行以下操作

（i）从头开始寻找模体

（ii）对模体进行富集分析

（iii）模体可视化

（iv）结合亲和力分析

（v）模体识别

Step2:数据准备

上传的区域应为FASTA格式的序列，其长度至少为100 bp，每个序列均以ChIP-seq标签峰为中心。所有序列都会被输入到DREME基序发现算法中，但是由于计算复杂性，最多有 600个序列（从输入中随机选择）被输入到MEME算法中。

上传数据

Step3:设置参数

点击选择上传文件

image

此处可以输入邮箱，模体搜索完成后将会发邮件通知

输入邮箱

此处可以设置目标模体长度

设置目标模体长度

接下来就可以设置一些细节

设置细节

MEME options下可以设置寻找模体的个数等。

STREME options下可通过设置P值，挖掘序列中富集或相对富集的模体。

CentriMo options可以识别一些模体对特定位置的明显偏好，可以查看局部位置的富集程度。

MEME-ChIP还将每个MEME和DREME寻找到的motif与JASPAR CORE数据库中的每个motif进行比较，以识别与每个主题结合的可能转录因子。

Step4:开始寻找motif

将所有参数设置好后点击开始寻找motif

step1

出现此界面即已经开始进行模体搜索了

step2

然后等结果出来后点击HTML output查看结果

step3

接着点击MEME查看详细的motif信息

step4

可以下载对应的motif的logo图和位置频率矩阵

step5

参考文献：

[1] Bailey T L , Johnson J , CE Grant, et al. The MEME Suite[J]. Nucleic Acids Research, 2015, 43(W1):W39-W49.
[2]Machanick, Philip, Bailey, et al. MEME-ChIP: motif analysis of large DNA datasets.[J]. Bioinformatics, 2011.