ORF and CDS

ORF(开放阅读框)最好被视为蛋白质编码区的假设。它是起始密码子和下一个终止​​密码子之间的DNA片段。它不是真核生物中整个蛋白质编码区的假设(由于内含子)。CDS应该是整个编码区域。

这些起始/终止'密码子'都可以在一个实际上不编码任何蛋白质的基因间区域中随机发现 - 因此不是每个ORF都意味着蛋白质。在蛋白质编码基因的实际起始密码子和下一个终止​​密码子之间发现ORF。该终止密码子很可能在内含子中发现,在这种情况下,ORF包括外显子和内含子的一部分。由于内含子大多只是随机序列,因此终止密码子可能偶然发生。如果内含子偶然不包含终止'密码子'(即在与外显子相同的阅读框中3个核苷酸TAA / TAG / TGA)那么ORF将继续直到它遇到终止密码子 - 在下一个内含子中随机,否则在基因结束时真正停止。

如果没有停止的内含子不是 3个核苷酸的倍数,那么它将引入移码,并且下一个停止可能很容易在下一个外显子内发生。如果它是3的倍数,它会将假氨基酸引入ORF,因为它继续通过内含子并进入外显子。这些错误在基因注释中并不罕见,因为内含子检测是复杂的,如果它“通读”,则在将cDNA序列与基因组序列进行比较之前,内含子可能不会被注释。

如果你想看到这些想法的演示,试着从GenBank获得一个含有前导序列5'-UTR,外显子,内含子,3'UTR的基因序列。CDS将被注释为外部区域。取这个基因序列并使用NCBI ORF-Finder,它将概述所有潜在的ORFs。其中一些,但不是全部,将是实际的编码部分。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 蛋白质编码基因至少包含四个组件:TU, MODEL, EXON, CDS TU代表转录单位,是基因的最高顺式元...
    翠湖心影阅读 27,787评论 0 20
  • 氨基酸是蛋白质的基本结构单位,参与合成蛋白质的氨基酸有20种,可作为原料在核糖体工厂通过肽键连接形成多肽链,都有密...
    官敏慧阅读 11,370评论 0 7
  • 生物信息学基础——基因表达过程 2016年11月15日 19:10:55 vickyleexy 阅读数:799遗传...
    wangchuang2017阅读 9,863评论 0 25
  • 金刚经 第一品 法会因由分 如是我闻。一时佛在舍卫国。祗树给孤独园。与大比丘众。千二百五十人俱。尔时世尊。食时。著...
    预见阳光阅读 2,920评论 0 0
  • 文/马吉祥 一生(戎马间) 生的你是乱世的主 狼烟漫过山岗 漫不过你的侠心 短暂的宁静是征伐给你的礼物 一身戎衣 ...
    马吉祥阅读 1,684评论 1 2

友情链接更多精彩内容