StatQuest-对RNA-seq的介绍

RNA-seq的三个主要步骤

  1. 建库
  2. 测序
  3. 数据分析
1. 建库
workflow

step1 分离RNA
step2 打断RNA

测序机器一次最多只能测200-300bp

step3 逆转录成双链cDNA

DNA比RNA更稳定,更易扩增和修饰

step4 加接头

1)让测序机器识别序列片段
2)用不同的接头同时测序不同的样品

step5 PCR扩增
step6 QC

2. 测序
  • 原理:序列片段垂直的连接到“flow cell”上,测序仪通过特异性荧光探针连接到碱基,一层一层测序,每测一层拍照识别,识别后洗脱颜色继续测序。
  • 质量分数的产生原因:
    1. 有些荧光探针会失效
    2. 低多样性的产生(一般发生在测序开始,机器识别序列片段位置的时候)
  • 测序结果
    • @ 唯一的序列ID标识符,可选的序列描述内容,以空格分开
    • 序列信息
    • +后为空或加上@后信息
    • 碱基质量字符 可以按一定规则转换为碱基质量得分,进而反映该碱基的错误率。
  • 比对参考基因组
  • 过滤低质量基因reads


    正常read

    低质量read
  • reads计数
  • 标准化reads计数


    举例--为什么要标准化

    影响计数的原因:1.reads质量 2.reads浓度

3.数据分析
  • PCA画图:1.可视化差异 2.排除异常样本
  • 差异表达分析:三大R包
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容