数据库中定义了已知的基因集合:
包括H和C1-C7八个系列(Collection),每个系列内容为:
H: hallmark gene sets (效应)特征基因集合,共50组;
比如细胞凋亡特征基因集:
特征基因集合
以下图片均由3幅图组合而成
C1: positional gene sets
位置基因集合,根据染色体位置,共326个
p1.选择C1后出现的界面;p2.选择对应的染色体位置;p3.具体信息
C1
C2: curated gene sets
(专家)共识基因集合,基于通路、文献等:这部分包括我们熟悉的KEGG信号通路等
C2
C3: motif gene sets
模式基因集合,主要包括microRNA和转录因子靶基因两部分
C3
C4: computational gene sets
计算基因集合,通过挖掘癌症相关芯片数据定义的基因集合
C4
C5: GO gene sets
Gene Ontology(基因本体论),包括BP(生物学过程biological process),CC(细胞原件cellular component)和MF(分子功能molecular function)三部分
C5
C6: oncogenic signatures
癌症特征基因集合,大部分来源于NCBI GEO 未发表芯片数据
C6
C7: immunologic signatures:
免疫相关基因集合。
C7
我们可以看到MSigDB数据收录的信息还是非常全面的,这个数据库可以单独使用和查询,我们可以根据各种条件导出一系列感兴趣的gene set
引用