1 命名规则统一前的miRNA命名情况
最早发现的几个miRNA基因根据其表型分别被作者命名为lin-4(第一个发现的miRNA)、let-7(第二个发现的miRNA)、lsy-6,其它发现的miRNA则进行系统命名。
2 动物miRNA的命名
2003年,以Vector Ambros为首的科学家联合发表了一个miRNA鉴定、注释及命名的规则。miRNA的命名以“miR”为前缀,再加唯一的基因发现顺序的数字(如miR-1,miR-2等);相应的miRNA编码基因用小写字母及斜体表示(如mir-1,mir-2);不同物种中相同或相似的miRNA用相同的名字命名(如果蝇与秀丽线虫的miR-1相差一个碱基,但均命名为miR-1);同一物种相同的miRNA命名相同,加数字后缀区分不同的基因组位点(如果蝇的mir-6-1、miR-6-2表示这两个miRNA基因在基因组不同位置,但均能产生相同的成熟miRNA序列);同一物种中相似的miRNA命名相同,但是给以不同的小写字母后缀进行区分(如果蝇的miR-13a及miR-13b)。
Griffiths-Jones于2004年对miRNAs的命名进行了进一步补充,miRNA的初级转录前体称为pri-miRNAs;发卡结构(hairpin)的直接前体称为pre-miRNAs。对于来自同一pre-miRNA前体的两个miRNA,用类似miR-56及miR-56表示,其中带号的miRNA表达量较低,属隐形表达(后来发现用*代表表达量不准确,此种表示方法也废除,同时废除的还有miR-142-s及miR-142-as这类表示方法),现在统一用miR-142-5p及miR-142-3p的形式表示两个miRNA分别来自同一发卡前体的靠近5’或3’的茎。在miRBase中记录的miRNA如果重新命名,则其之前的名称可在“Previous IDs”项查看。miRNA前体也用斜体表示,要依据上下文判断所指代到底是miRNA基因还是所预测前体(如用mir-16表示其基因及所预测的前体)。
Griffiths-Jones等2006年进一步补充,在表示不同物种的相同或相似的miRNA时,其前面加上3-4个字母的代表物种的前缀表示(如来自人类的hsa-miR-101与来自小鼠的mmu-miR-101)。
以上的命名规则,Griffiths-Jones等2008进行了进一步确认。
另外,由于人类的miR-548基因家族成员目前已知有80个,这样在用字母进行不同家族成员区分的时候单字母(仅有26个)已经不够用,因此人类的miR-548家族成员可以看到有双字母存在的情况,如has-miR-548aa,has-miR-548az-5p。
3 植物miRNA的命名
植物的miRNA基因命名与动物的miRNA命名类似,但也有有明显的区别:
首先植物的miRNA基因命名以物种前缀+MIR(全大写字母,与动物有差异)+数字组成,如ath-MIR166a;
其次,同一植物基因组不同位点产生相同或相似的成熟miRNA均增加一个字母进行区别,不用数字后缀,如ath-miR166a,这种规则会导致相同的成熟miRNA 序列,然而由于其基因在基因组的位点不同,而名称不一样,如ath-miR156a-5p位于2号染色体、ath-miR156d-5p位于5号染色体,但两者序列一致。
第三,植物的miRNA前体序列较长(约200bp),而动物的miRNA前体较短(约100bp),这样导致植物的一个前体序列(pre-miRNA)可产生两个以上不同的miRNA,如拟南芥ath-MIR829基因,在前体的5‘端有一个miRNA(ath-miR829-5p),而在其3’端有两个miRNA,这两个miRNA分别命名为ath-miR829-3p.1、ath-miR829-3p.2。
4 病毒的miRNA命名
病毒的miRNA基因是以其来源的遗传位点命名,如来自Epstein Barr病毒BART位点的miRNA基因命名为ebv-mir-BART1。同一基因产生的多个miRNA则用数字后缀区分,如rlcv-mir-rL1-1基因。
病毒的成熟miRNA序列命名类似动物成熟miRNA命名,如rlcv-mir-rL1-1基因产生的两个miRNA分别命名为rlcv-miR-rL1-1-5p、rlcv-miR-rL1-1-3p。
参考链接miRNA的命名规则