Day7 基因测序入门

一、分类

1.按技术的发展

1.1 第一代测序,又称Sanger测序
2.1 第二代测序(Next-gereration sequencing,NGS)
3.1 第三代测序

2.按测序样本种类

2.1 基因组(核酸序列)

(1)全基因组测序(Whole genome sequencing,WGS)
(2)全外显子测序(Whole exon sequencing,WES)
(3)简化基因组测序(Reduced-Representation Genome Sequencing,RRGS)

2.2 转录组(基因表达)

(1)mRNA-Seq:mRNA测序
(2)lncRNA-Seq:长链非编码RNA测序
(3)sRNA-Seq:小RNA测序

二、第一代测序

1.原理

Sanger双脱氧终止法、毛细管电泳法

2.测序平台

ABI 3730、ABI 3500等

3.优点

读长较长(可达1000 bp),准确率高(可达99.999%),是测序的金标准

4.缺点

通量低、成本高

三、第二代测序

1.原理

边合成边测序法、可逆链终止法、连接测序法、焦磷酸测序法

2.测序平台

Illumina HiSeq:边合成边测序法、可逆链终止法
Life Tech:连接测序法
SOLiD:连接测序法
Roche 454:焦磷酸测序法

3.优点

通量高、成本低、时间短、准确率也较高

4.缺点

读长短(不超过600bp),样本制备繁琐

5.Illumina测序流程

Illumina平台采用边合成边测序(Sequencing by Synthesis,SBS)方法,用不同颜色的荧光标记四种不同的dNTP,当DNA聚合酶合成互补链时,每添加一种dNTP就会释放不同的荧光,计算机捕捉荧光信号并处理,最终获得DNA的序列信息。

5.1 DNA文库构建

将DNA用超声波打断成碎片(300-500bp),用酶补平末端,3'端加一个A碱基,在DNA两端均加上adapter、index(又称为baccodes)、terminal sequence

5.2 生成簇(Cluster)

(1)将构建好的文库上样至flowcell的lane上,使文库紧密地结合在lane表面上的接头
(2)通过桥式PCR,在lane上形成大量的Cluster

5.3 测序

每个Cluster一次添加一个荧光标记的dNTP,每添加一个dNTP读取一次荧光,计算机检验出相应的碱基

5.4 数据分析

(1)数据初步分析:用fastqc软件进行质量分析
(2)数据过滤(针对接头序列和低质量序列):常用Trimmomatic
(3)多样本质控:multiqc

四、第三代测序

1.原理

1.1 实时单分子测序技术

中心思想是边合成边测序,反应控制在一个DNA母板链、一个DNA聚合酶、一个相对封闭的反应空间,不同荧光标记的碱基添加上母板显示不同的荧光

1.2 纳米孔单分子通道技术

这个技术的核心是设计出允许单个碱基通过的蛋白纳米孔通道,每种碱基通过通道时对通道电流和两侧电压产生不同影响。通过检测电信号判断碱基的类型。

2.测序平台

PacBio:实时单分子测序
Oxford Nanopore:纳米孔单分子通道测序

3.优点

读长长(1000-10000 bp),样本制备较简单

4.缺点

准确率较低(错误率可达到15%),是三种测序方法中准确率最低的

五、测序数据格式

1.Fastq格式

一般有4行:
第1行:@+序列ID+描述(可选)
第2行:碱基序列
第3行:+描述信息
第4行:序列质量评价


Fastq格式,来源于网络,侵删

2.Fasta格式

Fasta格式

3.Genebank格式

Genebank格式

4.EMBL格式

EMBL格式,来源于美格基因

六、总结

基因测序入门
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容