- 数据准备
如果使用在线的Gene sets database,则只需要准备Expression dataset文件(.txt),Expression dataset annotation文件(.cls),如果使用本地的Gene sets database,则需要提前将database文件(.gmt)下载到本地。
Expression dataset文件:即基因表达矩阵,主要包括基因名,样本名,表达值
Expression dataset annotation文件:即用于标注Expression dataset的样本数量,分组信息等注释信息的文件,主要包含3行,第一行为三列,第一列表示样本数量,第二列为分成多少个组,第三列为一个固定的数值1,第二行为分组标识,以#开头,然后是各个分组的组名,第三列为每个样本所属的组,顺序与Expression dataset文件中的样本的顺序相同
Gene sets database文件:即用于进行富集的注释数据库文件,一般是在http://www.gsea-msigdb.org/gsea/downloads.jsp网站下载文件,网站对每个数据库文件都有相应的简单解释介绍,用户可以根据自己的需求进行下载
用户也可以根据自己的需求自己准备database 文件,该文件主要包含两个信息,第一列为通路的名称,第二列为任意字符,第三列至结束列为该通路所包含的基因(至少为1列,也就是说至少包含一个基因)
-
加载数据
打开GSEA –> 点击Load data –> 选择需要加载的文件(使用在线的Gene sets database则只需要加载Gene expression文件和注释的cls文件,如果使用本地的database文件,则需要加载本地的gmt文件) –> 打开文件没有错误则加载完成
-
Run GSEA
在线选择Gene sets database:
使用本地Gene sets database:
Run:
等待计算完成:
输出目录设置:此处可以自行设置结果输出的工作目录
设置输出多少张图:
-
查看结果
打开保存结果的目录,找到index.html文件,打开文件就可以查看自己的GSEA所有结果:
点击Details可以查看每条通路的具体信息,并选择合适自己研究目的条目进行展示:
GSEA分析
©著作权归作者所有,转载或内容合作请联系作者
- 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
- 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
- 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
推荐阅读更多精彩内容
- 常用富集分析包括GO富集、KEGG富集,这两种富集方式都是基于已经通过算法确定差异倍数的差异基因来分析的,而对于一...
- 测序上游分析系列: mRNA-seq转录组二代测序从raw reads到表达矩阵:上中游分析pipelinemiR...