基础理论
差异基因
- 在不同组织中表达发生明显变化的基因
- 是导致细胞状态发生变化的关键基因
- 是表达谱分析的主要对象
方法
- 倍数变化法
- 假设检验法
实际操作中这两种方法往往同时使用,以提高准确性
- 横坐标为,即按照倍数变化法筛选
- 纵坐标为,即按照假设检验法筛选
倍数变化法
计算出所有基因的表达变化率(fold change,实验组和对照组之间基因表达量相差的倍数)后按一定方法筛选。筛选方案可有以下两种
- 设置倍数变化阈值(一般为2倍,也可以根据实际情况灵活设置)
- 设置差异基因数目比例(5%,即上调幅度最大的2.5%和下调幅度最大的2.5%)
适用条件
实验重复数较少
步骤
- 计算出所有基因的表达变化率(fold change)
- 按照表达变化率排序
- 上调两倍或者下调两倍算作差异表达基因
假设检验法
零假设为基因不是差异表达的,计算每个基因的P值,根据P值筛选
- 常用的标准有0.1、0.05、0.01
- 按0.1的标准筛选,同一疾病,不同实验者得到的差异基因重叠率较高
常用软件
- R
- BioConductor
- 归一化:affy、marray
- 差异分析:limma
- BioConductor
- 其他
- MATLAB: Bioinformatics Toolbox
- ArrayTools