三、建库测序相关:
library construction:文库构建,高通量测序前准备步骤。针对不同的研究目的建库方法不同。通常包括核酸样品检测、片段化、(扩增)、加接头、片段选择、纯化、浓度检测等步骤。
insert size:插入片段大小,决定测序的长度。
adaptor:接头,用于上机测序。建库时引入的接头序列与测序芯片(flow cell)上固定的接头相互识别。
strand specific:链特异性。链特异性建库,可以确定转录本来自正链还是负链。以便更加准确的获得基因的结构以及基因表达信息。并且可以更好的发现新的基因。(研究表明:很多基因组区域具有正负链的转录本,反义转录是真核基因的一个特征,是一种重要的调控方式。对于原核以及低等真核生物的基因组,常常具有重叠基因。)
SE:Single End 单端。测序策略的一种。
PE:Paired End 双端。测序策略的一种。
index:测序的标签,用于测定混合样本,通过每个样本添加的不同标签进行数据区分,鉴别测序样品。
Run:一台测序仪运行一个完整周期所产生的所有数据量。
flow cell:一种含有接头的芯片,测序仪中使用的器材,通常一台测序仪可放 1-2 张;测序时将样品、试剂等注入 flow cell 的通道中,发送测序反应,并可以通过拍照等手段从中捕获测序信号。
lane:flow cel 中的通道;通常 Hiseq2500 flow cell 中有 2 个通道,可产生数据约 150M/lane,Hiseq2000 flow cell 中有 8 个通道,可产生数据约 180M/lane;每个通道中只限制数据量,不限制样品数目。
fragment:实验中样品 total RNA/DNA 随机打断后产生的片段。 sequencing depth:测序深度。测序得到的总碱基数与待测基因组大小的比值。假设一个基因大小为 2M,测序深度为 10X,那么获得的总数据量为 20M。
Illumina/HiSeq MiSeq:Illumina 二代测序仪顶级提供商,Hiseq 与Miseq 为其两款测序仪。Miseq 相比于 Hiseq 每个 run 测序速度更快,序列更长,但数据量较少。