软件学习——模体搜索MEME-ChIP

The MEME suite 是一组功能强大的,基于网页的集成工具,可用于研究蛋白质,DNA 和 RNA 中的序列模体。

The MEME Suitehttps://meme-suite.org/meme/可以通过这个网址访问主页

The MEME suite

用 MEME 搜索模体

Step1:工具准备

将用到 MEME 套件下的 MEME-ChIP 工具,由于高通量测序的进步导致大型高质量数据集的快速增长,包括转录因子(TFs)ChIP-seq 实验产生的数据集。尽管有很多现有的工具可以用这类数据集来发现转录因子结合位点,但大多数基于网页的工具无法直接处理此类大型数据集。

The MEME suite
MEME-ChIP

此工具旨在分析 ChIP-seq 的 “峰值区域”,也就是说仅分析峰值周围的短基因组区域,给定一组基因组的区域后它将依次值行以下操作

(i)从头开始寻找模体

(ii) 对模体进行富集分析

(iii) 模体可视化

(iv) 结合亲和力分析

(v) 模体识别

Step2:数据准备

上传的区域应为FASTA格式的序列,其长度至少为100 bp,每个序列均以ChIP-seq标签峰为中心。所有序列都会被输入到DREME基序发现算法中,但是由于计算复杂性,最多有 600个序列(从输入中随机选择)被输入到MEME算法中。

上传数据
Step3:设置参数

点击选择上传文件

image

此处可以输入邮箱,模体搜索完成后将会发邮件通知

输入邮箱

此处可以设置目标模体长度

设置目标模体长度

接下来就可以设置一些细节

设置细节

MEME options下可以设置寻找模体的个数等。

STREME options下可通过设置P值,挖掘序列中富集或相对富集的模体。

CentriMo options可以识别一些模体对特定位置的明显偏好,可以查看局部位置的富集程度。

MEME-ChIP还将每个MEME和DREME寻找到的motif与JASPAR CORE数据库中的每个motif进行比较,以识别与每个主题结合的可能转录因子。

Step4:开始寻找motif

将所有参数设置好后点击开始寻找motif

step1

出现此界面即已经开始进行模体搜索了

step2

然后等结果出来后点击HTML output查看结果

step3

接着点击MEME查看详细的motif信息

step4

可以下载对应的motif的logo图 和位置频率矩阵

step5

参考文献:

[1] Bailey T L , Johnson J , CE Grant, et al. The MEME Suite[J]. Nucleic Acids Research, 2015, 43(W1):W39-W49.
[2]Machanick, Philip, Bailey, et al. MEME-ChIP: motif analysis of large DNA datasets.[J]. Bioinformatics, 2011.

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容