第0章、绪论
03、生物信息学的生物学基础知识
一、遗传定律
遗传学有三大定律:分离定律、自由组合定律、链锁和交换定律。前两大定律由奥地利 科学家孟德尔利用豌豆实验于1865年总结发现,第三定律由美国科学家摩尔根于1911年在研究果蝇遗传规律时发现
分离定律(law of segregation):位于同源染色体上的一对等位基因在减数分裂过程中发生分离,随机进入不同配子中并传递给后代的现象,也称为孟德尔分离定律
自由组合定律(law of independent assortment):位于不同染色体上的两对或多对等位基因在减数分裂时,等位基因发生分离并符合分离定律,不同的等位基因进行自由组合进入配子,并传递给后代,这种现象叫做孟德尔自由组合定律
连锁遗传交换定律(law of linkage and crossing-over):减数分裂过程中,位于同一染色体上的不同基因进入同一配子的现象称为连锁律;位于同一染色体上的不同基因可能会发生一定频率的交换,并导致其分别进入不同的配子的现象称为交换律。两者结合在一起即为位于同一染色体上的不同基因发生连锁或交换的遗传定律
二、DNA的分子结构
DNA的分子组成:组成DNA分子的基本单位是脱氧核苷酸。每个脱氧核苷酸由一分子脱氧核糖、一分子磷酸和一分子含氮碱基组成。碱基分别为腺嘌呤(adenine,A)、鸟嘌呤(guanine,G)、胞嘧啶(cytosine,C)和胸腺嘧啶(thymine,T)。因碱基的不同,可以构成4种不同的脱氧核苷酸
DNA的分子的结构:4种脱氧核苷酸按照一定顺序首尾相接构成脱氧多核苷酸单链,每条脱氧核苷酸单链都有3’端和5’端,相邻的脱氧核苷酸之间通过磷酸二酯键相连接
DNA分子的双螺旋结构模型要点:
DNA由两条碱基互补、反向平行排列的脱氧多核苷酸单链组成。A与T之间由2个氢键相连,C与G之间由3个氢键相连
DNA分子的两条互补链围绕一“主轴”向右盘旋形成双螺旋结构
双螺旋的表面形成两条凹槽,分为大沟和小沟
碱基排列顺序的组合方式是无限的,可以形成多种不同的DNA分子
三、基因结构
原核生物基因结构:一个完整的原核基因结构是从5’端的启动区开始至3’端的终止区结束,依次包括启动区、5’UTR、编码区、3’UTR、终止区
启动区:是转录因子识别结合并启动基因转录的区域,包含-10、-30区等特殊结构域区域
5’UTR:5’端非翻译区,这部分序列会转录为RNA,但是不会被翻译成蛋白质
编码区:翻译为蛋白质,从起始密码子开始至终止密码子结束的区域。原核生物的编码区不包含内含子
3’UTR:3’端非翻译区,这部分序列会转录为RNA,但是不会被翻译成蛋白质
终止区:阻碍RNA聚合酶的移动,并使其从DNA模板链上掉下来
真核生物基因结构:完整的真核生物基因包括增强子、启动区、5’UTR、外显子、内含 子、3’UTR、终止区
增强子:增强基因转录频率的DNA序列,其位置可在5’端、3’端或内含子中。可分为组织细胞特异性增强子及诱导性增强子,组织细胞特异性增强子只在特定细胞的特定蛋白参与下才能发挥作用;诱导性增强子需经过特定条件的诱导才增强基因的表达
启动区:是转录因子识别结合并启动基因转录的区域,真核生物的启动子在-25~-30bp处有一段特定序列,也称为TATA框,在-70到-78bp处还有一段共同序列,称为CAAT框;在-110bp处还有一个GC框
5’UTR:5’端非翻译区
外显子:编码蛋白区域
内含子:基因内部非编码蛋白区域,与外显子间隔存在
3’UTR:3’端非翻译区,该区域可能参与调控基因的表达,如动物的miRNA通过结合3’UTR区来调控基因的表达
终止区:阻碍RNA聚合酶的移动,并使其与DNA模板链解离
四、中心法则
传统的中心法则是指遗传信息从DNA到蛋白质的传递过程。DNA可自我复制,DNA转录为RNA;RNA可逆转录为DNA,RNA可自我复制,也可翻译为蛋白质;蛋白质参与调控DNA的复制、RNA的转录及蛋白质翻译。中心法则的扩充内容包括DNA的甲基化修饰、小RNA分子的调控、蛋白质指导蛋白质的折叠等
五、密码子表
遗传信息的储存单位:信使RNA分子中,每3个相邻的碱基序列构成一个三联体(triplet),每个三联体密码能编码某种氨基酸,所以三联体是遗传信息的具体表现形式,又称为三联体密码(triplet code)、遗传密码(genetic code)或密码子(codon)
遗传密码的特性:通用性、简并性、起始密码子和终止密码子
不同的物种或者亚细胞器,密码子及其编码的氨基酸稍有差异,目前NCBI网站总结了 25种密码子表,各个物种用得最多的还是标准密码子表
六、蛋白质的结构与功能
蛋白质有四级结构。一级结构是其氨基酸序列及组成;二级结构是指蛋白质序列折叠形成的结构,包括α螺旋、β折叠等;三级结构是指蛋白质在二级结构的基础上进一步折叠形成的三维立体结构;四级结构是指有多亚基的蛋白质折叠形成的最终结构
蛋白质的一级结构可通过密码子表预测出来,其二、三、四级结构需要通过软件进一步预测
七、PCR技术
PCR技术:即聚合酶链式反应,是分子生物学领域使用最广泛的技术之一,在引物、模板、DNA聚合酶等的存在条件下,通过循环进行变性、退火、延伸等步骤,进而实现DNA的迅速扩增
PCR技术可以用来进行基因扩增、基因组的gap修补、基因定量等