技术原理
实验流程
实验流程
分析流程分为以下6部分:
- 原始测序数据的质控
- read比对,排序和去除重复序列
- Indel区域重(“重新”的“重”)比对
- 碱基质量值重校正
- 变异检测
-
变异结果质控和过滤
数据分析流程
流程的具体形式其实是次要的,WGS本质上只是一个技术手段,重要的是,我们要明白自己所要解决的问题是什么,所希望获取的结果是什么,然后再选择合适的技术。
流程的目的是准确检测出每个样本(这里特指人)基因组中的变异集合,也就是人与人之间存在差异的那些DNA序列。我把整个分析过程按照它们实际要完成的功能,将其分成了三个大的模块:
- 原始数据质控
- 数据预处理
- 变异检测
这或许和很多人看到的WGS分析流程,在结构梳理上有些差异(比如GATK的最佳实践),但过程中的各个步骤和所要完成的事情是一模一样的。