1、转录组测序
研究对象:特定细胞在某一功能状态下所能转录出来的所有mRNA的总和。
新一代高通量测序技术能够全面快速的获得某一物种特定组织或器官在某一状态下的几乎所有转录本序列信息,从而准确地分析基因表达差异、基因结构变异、筛选分子标记(SNPs或SSR)等生命科学重要问题。
2、筛选差异基因
比如你要分析你的处理组(实验组,Treated)和空白组(对照组,ctr)为什么造成的生物学结果不同(比如影响癌症的发生发展)?那就要分析这两个组里面所涉及基因的差异。那么就要筛选出差异基因进一步分析(R语言实现)
3、富集分析
常见的富集分析方式有KEGG、GO分析
GO:CC--->细胞组分
GO:BP--->生物学过程
GO:MF--->分子功能
情景创设:比如在细胞自噬的生物学过程中,LC3Ⅰ会变成LC3Ⅱ,因此表现为LC3Ⅱ基因的上调,同时P62基因表现为下调,Beclin1基因表现为上调,这个时候就无法将P62和LC3Ⅱ以及Beclin1各自分开来分析他们各自对细胞自噬的作用。由此,GSEA就诞生了。
GSEA(Gene set enrichment analysis, 基因集富集分析)
基本思路:“碰到1个基因就往上”
示例
NES:富集分数
这个图说明:在 KIRP 中,HDAC11 与 EMT 信号通路(第4个)呈负相关等等。
跟随GSEA出来的,还有这样一个表格:
Pathway | NES | q(FDR) |
---|---|---|
-- | -- | -- |
-- | -- | -- |
-- | -- | -- |
p值:分析GSEA的结果是否显著:要求Pvalue<0.05
q值(也就是FDR):是对Pvalue进行标准化之后的指标,要求其<0.25