RNA-seq名词解释(1)

一、基本概念

RNA-seq即转录组测序技术,就是用高通量测序技术进行测序分析,反映出mRNA,smallRNA,noncodingRNA等或者其中一些的表达水平。RNA测序最经常用于分析差异表达基因(DEG)。

转录组是某个物种或者特定细胞类型产生的所有转录本的集合。转录组研究能够从整体水平研究基因功能以及基因结构,揭示特定生物学过程以及疾病发生过程中的分子机理,已广泛应用于基础研究、临床诊断和药物研发等领域。

二、基本名词解释

gene:具有编码蛋白质或决定某一性状作用的一段核酸序列。

Q20,Q30:Phred 数值大于 20、30 的碱基占总体碱基的百分比,其中
Phred=-10log10(e).

intron:内含子,是真核生物细胞 DNA 中的间插序列。这些序列被
转录在前体 RNA 中,经过剪接被去除,最终不存在于成熟 RNA 分
子中。术语内含子也指编码相应 RNA 内含子的 DNA 中的区域。

exon:外显子,是真核生物基因的一部分,它在剪接(Splicing)后仍会被保存下来,并可在蛋白质生物合成过程中被表达为蛋白质。外显子是最后出现在成熟 RNA 中的基因序列,又称表达序列。既存在于最初的转录产物中,也存在于成熟的 RNA 分子中的核苷酸序列。术语外显子也指编码相应 RNA 外显子的 DNA 中的区域。

intergenic:基因间区,指基因与基因之间的间隔序列,不属于基因结构,不直接决定氨基酸,可能通过转录后调控影响性状的区域。

UTR:Untranslated Regions, 非翻译区域。是信使 RNA(mRNA)分子两端的非编码片段。5'-UTR 从 mRNA 起点的甲基化鸟嘌呤核苷酸帽延伸至 AUG 起始密码子,3'-UTR 从编码区末端的终止密码子延伸至多聚 A 尾巴(Poly-A)的前端。

transcript:转录本,是由一条基因通过转录形成的一种或多种可供编码蛋白质的成熟的 mRNA。一条基因通过内含子的不同剪接可构成不同的转录本。

isoform:同一个基因经可变剪切或内含子选择机制产生不同的转录本,这些不同转录本即称 isoform。 reconstruction:重组,由于不同 DNA 链的断裂和连接而产生 DNA片段的交换和重新组合,从而形成新 DNA 分子。plus strand/minus strand:正链/负链。对于一个基因来说,DNA 的两条链中有一条链作为 RNA 合成时的模板,这条链叫负链,另一条叫正链。

antisense strand/sense strand:无义链/有义链。模板链在双链 DNA中,用来转录 mRNA 的 DNA 链称为模板链(template strand),不用于转录的链则称为非模板链(nontemplate strand)。根据碱基互补配对原则,转录出的 mRNA 链的碱基序列与非模板链的碱基序列一致,惟一不同的是,非模板链中的 T 在 mRNA 链中全部置换成了 U。正是由于非模板链的碱基序列实际上代表了 mRNA 的碱基序列(只不过在 mRNA 中 T 换成了 U),因此非模板链又被称为编码链(coding strand),有义链(sense strand)和克里克链(crick strand),而用来转录mRNA 的 DNA 链被称为非编码链(anticoding strand)或无义(antisense strand)或沃森链(watson strand)。

gene family:基因家族。真核细胞中,许多相关的基因常按功能成套组合,被称为基因家族。它们来源于同一祖先,由一个基因通过基因重复产生两个或更多的拷贝而构成的一组基因,它们在结构和功能上具有明显的相似性,编码相似的蛋白质产物。

gtf/gff:基因结构注释文件。gtf(gene transfer format)指包含基因特
征的注释文件,而 gff(general feature format)是指包含基因组特征
的注释文件。

ORF:open reading frame,开放阅读框或开放读码框。是结构基因的正常核苷酸序列,从起始密码子到终止密码子的阅读框可编码完整的
多肽链,其间不存在使翻译中断的终止密码子。

reference genome/ reference:参考基因组。RNA-seq 有参分析的基础。

small RNA:是长度大约在 18-30bp 的非编码 RNA 分子,包括 micro RNAs、siRNAs 和 pi RNAs,是生命活动重要的调控因子,在基因表达调控、生物个体发育、代谢及疾病的发生等生理过程中起着重要作
用。

ncRNA:non-coding RNA,非编码 RNA。指不编码蛋白质的 RNA。其中包括 rRNA,tRNA,snRNA,snoRNA 和 microRNA 等多种已知功能的 RNA,及未知功能的 RNA。其共同特点是都能从基因组上转录而来,不需要翻译成蛋白即可在 RNA 水平上行使各自的生物学功能。

lncRNA:long noncoding RNA,长链非编码 RNA。长度在 200-100000nt之间,不具有编码蛋白功能的转录本。根据与编码基因的位置关系可分为:Antisense lncRNA (反义长非编码 RNA)、Intronic lncRNA (内含子长非编码 RNA)、Long intergenic noncoding RNA (基因间区长非编码 RNA)、Sense lncRNA(正义长非编码 RNA)、Bidirectional lncRNA(双向长非编码 RNA)。

参考链接:

RNA-seq_百度百科 (baidu.com)

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 221,198评论 6 514
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 94,334评论 3 398
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 167,643评论 0 360
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,495评论 1 296
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,502评论 6 397
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 52,156评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,743评论 3 421
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,659评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 46,200评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,282评论 3 340
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,424评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 36,107评论 5 349
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,789评论 3 333
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,264评论 0 23
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,390评论 1 271
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,798评论 3 376
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,435评论 2 359

推荐阅读更多精彩内容