RNA-seq的三个主要步骤
- 建库
- 测序
- 数据分析
1. 建库
step1 分离RNA
step2 打断RNA
测序机器一次最多只能测200-300bp
step3 逆转录成双链cDNA
DNA比RNA更稳定,更易扩增和修饰
step4 加接头
1)让测序机器识别序列片段
2)用不同的接头同时测序不同的样品
step5 PCR扩增
step6 QC
2. 测序
- 原理:序列片段垂直的连接到“flow cell”上,测序仪通过特异性荧光探针连接到碱基,一层一层测序,每测一层拍照识别,识别后洗脱颜色继续测序。
- 质量分数的产生原因:
-
有些荧光探针会失效
-
低多样性的产生(一般发生在测序开始,机器识别序列片段位置的时候)
-
有些荧光探针会失效
-
测序结果
- @ 唯一的序列ID标识符,可选的序列描述内容,以空格分开
- 序列信息
- +后为空或加上@后信息
- 碱基质量字符 可以按一定规则转换为碱基质量得分,进而反映该碱基的错误率。
- 比对参考基因组
-
过滤低质量基因reads
- reads计数
-
标准化reads计数
影响计数的原因:1.reads质量 2.reads浓度
3.数据分析
- PCA画图:1.可视化差异 2.排除异常样本
- 差异表达分析:三大R包