一、分类
1.按技术的发展
1.1 第一代测序,又称Sanger测序
2.1 第二代测序(Next-gereration sequencing,NGS)
3.1 第三代测序
2.按测序样本种类
2.1 基因组(核酸序列)
(1)全基因组测序(Whole genome sequencing,WGS)
(2)全外显子测序(Whole exon sequencing,WES)
(3)简化基因组测序(Reduced-Representation Genome Sequencing,RRGS)
2.2 转录组(基因表达)
(1)mRNA-Seq:mRNA测序
(2)lncRNA-Seq:长链非编码RNA测序
(3)sRNA-Seq:小RNA测序
二、第一代测序
1.原理
Sanger双脱氧终止法、毛细管电泳法
2.测序平台
ABI 3730、ABI 3500等
3.优点
读长较长(可达1000 bp),准确率高(可达99.999%),是测序的金标准
4.缺点
通量低、成本高
三、第二代测序
1.原理
边合成边测序法、可逆链终止法、连接测序法、焦磷酸测序法
2.测序平台
Illumina HiSeq:边合成边测序法、可逆链终止法
Life Tech:连接测序法
SOLiD:连接测序法
Roche 454:焦磷酸测序法
3.优点
通量高、成本低、时间短、准确率也较高
4.缺点
读长短(不超过600bp),样本制备繁琐
5.Illumina测序流程
Illumina平台采用边合成边测序(Sequencing by Synthesis,SBS)方法,用不同颜色的荧光标记四种不同的dNTP,当DNA聚合酶合成互补链时,每添加一种dNTP就会释放不同的荧光,计算机捕捉荧光信号并处理,最终获得DNA的序列信息。
5.1 DNA文库构建
将DNA用超声波打断成碎片(300-500bp),用酶补平末端,3'端加一个A碱基,在DNA两端均加上adapter、index(又称为baccodes)、terminal sequence
5.2 生成簇(Cluster)
(1)将构建好的文库上样至flowcell的lane上,使文库紧密地结合在lane表面上的接头
(2)通过桥式PCR,在lane上形成大量的Cluster
5.3 测序
每个Cluster一次添加一个荧光标记的dNTP,每添加一个dNTP读取一次荧光,计算机检验出相应的碱基
5.4 数据分析
(1)数据初步分析:用fastqc软件进行质量分析
(2)数据过滤(针对接头序列和低质量序列):常用Trimmomatic
(3)多样本质控:multiqc
四、第三代测序
1.原理
1.1 实时单分子测序技术
中心思想是边合成边测序,反应控制在一个DNA母板链、一个DNA聚合酶、一个相对封闭的反应空间,不同荧光标记的碱基添加上母板显示不同的荧光
1.2 纳米孔单分子通道技术
这个技术的核心是设计出允许单个碱基通过的蛋白纳米孔通道,每种碱基通过通道时对通道电流和两侧电压产生不同影响。通过检测电信号判断碱基的类型。
2.测序平台
PacBio:实时单分子测序
Oxford Nanopore:纳米孔单分子通道测序
3.优点
读长长(1000-10000 bp),样本制备较简单
4.缺点
准确率较低(错误率可达到15%),是三种测序方法中准确率最低的
五、测序数据格式
1.Fastq格式
一般有4行:
第1行:@+序列ID+描述(可选)
第2行:碱基序列
第3行:+描述信息
第4行:序列质量评价