GSEA使用笔记

本文转自  http://www.bio-info-trainee.com/1282.html

What is GSEA?

这个有点类似于pathway(GO,KEGG等)的富集分析,区别在于gene set(矫正好的基于文献的数据库)的概念更广泛一点,包括了

how to download GSEA ?

软件下载地址:http://software.broadinstitute.org/gsea/downloads.jsp

教程:http://software.broadinstitute.org/gsea/doc/desktop_tutorial.jsp

需要自己安装好java环境!

what's the input for the GSEA?

说明书上写的输入数据是:GSEA supported data files are simply tab delimited ASCII text files, which have special file extensions that identify them. For example, expression data usually has the extension *.gct, phenotypes *.cls, gene sets *.gmt, and chip annotations *.chip. Click theMore on file formatshelp button to view detailed descriptions of all the data file formats.

并且提供了测试数据:http://software.broadinstitute.org/gsea/datasets.jsp

实际上没那么复杂,一个表达矩阵即可!然后做一个分组说明的cls文件即可。

主要是自己看说明书,做出要求的数据格式:http://www.broadinstitute.org/cancer/software/gsea/wiki/index.php/Data_formats

表达矩阵我这里下载GSE1009数据集做测试吧!

http://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=gse1009

ftp://ftp.ncbi.nlm.nih.gov/geo/series/GSE1nnn/GSE1009/matrix/GSE1009_series_matrix.txt.gz

cls的样本说明文件,就随便搞一搞吧,下面这个是例子:

6 2 1

# good bad

good good good bad bad bad

文件如下,六个样本,根据探针来的表达数据,分组前后各三个一组。



输出的数据非常多,对你选择的gene set数据集里面的每个set都会分析看看是否符合富集的标准,富集就出来一个报告。

点击success就能进入报告主页,里面的链接可以进入任意一个分报告。

最大的特色是提供了大量的数据集:You can browse the MSigDB from theMolecular Signatures Databasepage of the GSEA web site or the Browse MSigDB page of the GSEA application. To browse the MSigDB from the GSEA application:

还自己建立了wiki说明主页:http://www.broadinstitute.org/cancer/software/gsea/wiki/index.php/Main_Page

有些文献是基于GSEA的:

www.ncbi.nlm.nih.gov/pubmed/16199517

http://stke.sciencemag.org/highwire/filestream/4681053/field_highwire_adjunct_files/1/2001966_Slides.zip

http://www.ingentaconnect.com/content/ben/cbio/2007/00000002/00000002/art00003

http://www.nature.com/articles/ng0704-663a

http://bioinformatics.oxfordjournals.org/content/23/23/3251.short

http://link.springer.com/article/10.1007/s00335-011-9359-x

IDENTIFICATION OF HIGH-COPPER-RESPONSIVE TARGET PATHWAYS IN ATP7B KNOCKOUT MOUSE LIVER BYGSEA ON MICROARRAY DATA SETS

COMPARISON OF INVARIANT NKT CELLS WITH CONVENTIONAL T CELLS BY USING GENE SET ENRICHMENT ANALYSIS (GSEA)

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 今天,在车上,大宝突然说了句:妈妈,我想上最好的小学。声音不大,却很坚定。 “好的,宝贝,有这个目标很棒,爸爸妈妈...
    cici66555阅读 851评论 0 0
  • 大多数时候,音乐不会成为我们社交的谈资,毕竟谁会没事聊巴赫、肖邦、李斯特?所以,很多长大了的琴童会在社交中常常觉得...
    sissi的笔记阅读 3,496评论 5 3
  • 『咚。 “刚做咖啡的时候,你教我做什么事都一定用心,打奶的时候一定要用手贴着拉花缸,用手去感受牛奶和奶泡的温度,在...
    绵花不白阅读 1,202评论 0 0