生物学英文缩写

EST是Expressed Sequence Tag的缩写,意思是表达序列标签,指从一个随机选择的cDNA 克隆,进行5’端和3’端单一次测序挑选出来获得的短的cDNA 部分序列。代表一个完整基因的一小部分,在数据库中其长度一般从20 到7000bp 不等,平均长度为360 ±120bp。由于cDNA文库的复杂性和测序的随机性,有时多个EST代表同一基因或基因组,将其归类形成EST簇(EST cluster)

SSR(Simple Sequence Repeats)标记是近年来发展起来的一种以特异引物PCR为基础的分子标记技术,也称为微卫星DNA(MicrosatelliteDNA),是一类由几个核苷酸(一般为1~6个)为重复单位组成的长达几十个核苷酸的串联重复序列。每个SSR两侧的序列一般是相对保守的单拷贝序列。

基因组综述序列(GSS)和未完成的高通量基因组序列(HTG)都代表了按功能划分的一类数据,这些都要求用户以及数据库工作人员用不同的方法来处理。

CDS是Coding sequence,蛋白编码序列.ORF是open reading frame,开放阅读框.⑴开放阅读框是不被终止子打断的一段核酸序列,可能包含编码蛋白的碱基序列;不是所有开放阅读框都能被表达出蛋白产物,或者能表达出占有优势.CDS特指cDNA上面可以编码蛋白质那段序列。ORF是指某一段DNA上面有可能编码蛋白质的序列。

UTR(Untranslated Regions):非翻译区。是信使mRNA分子两端的非编码片段。5‘UTR从mRNA起点的甲基化鸟嘌呤核苷酸帽延伸至AUG起始密码子,3’UTR从编码区末端的终止密码子延伸至多聚A尾巴(Poly-A)的末端。

FTASTA:fasta格式是一种基于文本用于表示核酸序列或多肽序列的格式。其中核酸或氨基酸均以单个字母来表示,且允许在序列前添加序列名及注释。该格式已成为生物信息学领域的一项标准。

RPKM是Reads Per Kilobase per Million mapped reads的缩写,代表每百万reads中来自于某基因每千碱基长度的reads数。RPKM是将map到基因的read数除以map到基因组上的所有read数(以million为单位)与RNA的长度(以KB为单位)。

RefSeq数据库,即RefSeq参考序列数据库,美国国家生物信息技术中心(NCBI)提供的具有生物意义上的非冗余的基因和蛋白质序列。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 氨基酸是蛋白质的基本结构单位,参与合成蛋白质的氨基酸有20种,可作为原料在核糖体工厂通过肽键连接形成多肽链,都有密...
    官敏慧阅读 11,358评论 0 7
  • 基因的基本组成 基因是具有功能的DNA序列片段,由编码序列和非编码序列交替构成,我们又称为割裂基因 split g...
    墙壁上的人阅读 5,784评论 0 5
  • 我一直以为人心都是肉长的,有着暖人的温度,可是人到中年,我开始怀疑这个答案,因为我不知道有的人,如果他们还是人的话...
    果爱520阅读 4,693评论 0 0
  • 晨光播洒在狭长崎岖的路上,荆棘托着晶莹的露水沾染着行者的血,沿着路向着前方,向着行者的目的地蔓延。“世界上本没有路...
    诸葛吹云阅读 2,490评论 0 6
  • 《壶口瀑布》 秦晋山间卧巨龙, 声如霹雳震苍穹。 百丈云岚蔽日月, 千里无雨沐彩虹。 《华山溪流》 溪水淙淙石壁溜...
    江阔云低_7011阅读 3,150评论 2 2

友情链接更多精彩内容