近期,上海元莘生物合作客户在“Frontiers in Genetics”(IF 4.599)发表一篇“Comparative Analysis of the Chloroplast Genome for Aconitum Species: Genome Structure and Phylogenetic Relationships”的文章。本研究为乌头属植物的系统发育和物种鉴定提供了潜在的分子标记和基因组资源,也为乌头属植物的分类鉴定提供了重要的参考和依据毛茛科的物种鉴定与系统发育。
研究背景
乌头是毛茛科的一个重要药用类群,在中国的白族、彝族和其他民族中被用作常规药物。全球约有350种乌头属植物,中国约有170种。在形态学上对该种进行鉴定是一个挑战,缺乏分子生物学信息阻碍了该属种质的鉴定和合理利用。因此,有必要增加乌头属植物的分子数据。本文利用Illumina测序技术获得了云南十种乌头属药用植物叶绿体基因组的完整序列,并与同科、同属的其他植物进行了比较。
实验材料
总共42样本,其中10个样本此次测序获得,32个样本从NCBI genbank数据库中下载。
研究结果
1. 十种乌头属植物完整叶绿体基因组的基本特征
10个乌头属研究物种基因组大小范围为155475 bp (A. stylosum)到155,921 bp (A. vilmorinianum)。LSC长度范围为86,098 bp(A. stylosum)到86,524 bp (A. vilmorinianum), SSC 长度范围为16,903 bp (A. stylosum)到16,983 bp (A. nagarum), IRs 长度范围为52,218 bp (A. duclouxii)到52,476 bp (A. ouvrardianum).10个基因组GC含量为38.1%,IR区域(43%)的GC含量高于单拷贝区域(LSC:36.2%和SSC:32.6%),A和T的使用频率明显高于G和C。
2. 偏好性分析
最常见的氨基酸是Leu(亮氨酸),在10个乌头属植物中出现频率为A. ouvrardianum(2701次)~ A. stylosum 和A. nagarum( 2732次);频率最低的氨基酸是Cys(半胱氨酸),在10个乌头属植物中出现频率为A.ouvrardianum &A.ramulosum &A.delavayi (302次)~ A.vilmorinianum(307次)。
3. SSR分析
42个乌头属植物叶绿体基因组中的总SSR位点范围从A.volubile的48个到A.coreanum和A.reclinatum的79个。研究人员分析了10个乌头属物种中不同类型重复序列的重复单位,发现A/T(占每个物种总SSR的96.67%-100%)和AT/TA(100%)主导重复序列类型单核苷酸和二核苷酸SSR。重复的三核苷酸SSR主要由A/T碱基组合(AAT/ATT,71.43%–85.71%)组成(补充表S5)。这些结果与先前的报道一致,即CP-SSR通常由短的poly-A或poly-T重复序列组成,并且在许多植物中很少含有串联的G或C重复序列。
4. 长重复序列分析
在42个物种中,重复序列的长度范围分为5种类型(30-39,40-49,50-59,60-69,≥70 bp),30–39 bp重复次数最多,60–69 bp的重复序列最少。A.piepunense具有最多的长重复序列,包括18个正向,19个回文,35个反向重复序列和5个补体重复序列;A.monanthum是最少的,包括六个正向和11个回文重复。
5. IR边界变化分析
对42种乌头属植物叶绿体基因组序列的IR边界分析表明,叶绿体基因组的四个边界、结构以及红外区域之间的连接非常保守;LSC/IR和SSC/IR边界分布基因包括rps19、rpl22、rpl2、ycf1、ndhF、trnH和psbA。大多数乌头属植物叶绿体基因组中的rps19基因在IRb区有一个3 bp的突起。由于ycf1基因跨越SSC/IRa边界,在IRb区产生了一个假基因ψycf1如A. ouvrardianum, A. delavayi, and A. ramulosum。A. Duclouxii物种ndhF基因IRa区域跨越SSC/IRa边界延伸至30bp,其他乌头物种在SSC区域均具有不同长度的ndhF基因。这些结果表明A. Duclouxii发生了一些变异。42种乌头属植物叶绿体基因组中的rpl22、trnH和psbA基因均位于LSC区,rpl2基因均位于IRa区,这些基因在物种间的长度基本不变,可作为乌头属叶绿体基因组的一个共同特征用于物种鉴定。
6. 基因组比较分析
42种乌头属植物的叶绿体基因组序列相似,表明乌头属植物叶绿体基因组高度保守。乌头叶绿体基因组的IR区比LSC和SSC区更为保守,编码区比非编码区更为保守,基因间间隔区的变异程度大于基因区。基因间隔区trnK-UUU-trnQ-UUG、trnS-GCU-trnG-UCC、atpH-atpI、petN-psbM、rps18-rpl20、rpl16-rps3、trnL-CAA-trnL-CAA、ndhB-trnL-CAA变异最大;蛋白质编码基因区最保守,只有ycf1和ycf2变异最大;四个rRNA基因(rrn4.5、rrn5、rrn16和rrn23)是最保守的。这些高度可变的基因和基因间隔子可作为42种乌头属植物系统发育和种群遗传学研究的分子标记。
7. 核苷酸多态性分析
整个叶绿体基因组中高度可变位点的识别可作为物种鉴定和系统发育研究的分子标记。从叶绿体基因组序列中筛选出七个高变异热点,包括四个基因间隔区和三个蛋白质编码基因区:LSC:trnK UUU trnQ UGG、psbD、ndhJ ndhK、clpP和psbH petB;SSC:ycf1和trnA UGC trnI GAU。
8. 系统发育分析
两个系统发育树的聚类结果是一致的,均分成Subgen Aconitum和Subgen. ParAconitum两大支,这有力地支持了乌头属主要由亚种组成。Aconitum and Subgen. ParAconitum支持度百分百;A. stapfianum, A. weixiense, A. vilmorinianum, and A. episcopale四个物种聚集在了一起,A、 stapfianum和A.epicopale表现出姐妹关系;A. delavayi, A. ramulosum, 和A. ouvrardianum聚集在了一起,A.delavayi和A.ramulosum表现出姐妹关系。然而,在基于PCGs的系统发育树中A. stylosum, A. stapfianum, A. weixiense, A. vilmorinianum, 和A. episcopale 聚集在了一起。
结论
①本研究报告了10种乌头属植物的CP基因组范围为155475 bp(A. stylosum)到155921 bp(A. vilmoinianum),CP基因组的结构和组成高度相似。
②CP基因组基因从129个(A.vilmoinianum)到132个(A.ramulosum),包括83-85个蛋白质编码基因、37个tRNA基因、8个rRNA基因和2个假基因。
③31个密码子的RSCU值大于1,31个密码子的RSCU值小于1,两个密码子的RSCU值为1,高频密码子优先以A/T碱基结尾。
④在42种乌头属植物的叶绿体基因组中鉴定出48-79个SSR和17-77个长重复序列。IRs的变化比LSC和SSC更为保守。四个高度可变的基因间隔区(trnK-UUU-trnQ-UGG、ndhJ-ndhK、psbH-petB和trnA-UGC-trnI-GAU)和三个基因区域(psbD、clpP和ycf1)可作为乌头属物种鉴定和遗传多样性研究的适当DNA条形码。
⑤在10种乌头物种中,A. nagarum 与A. duclouxii关系最为密切,A. stapfianum 与A. episcopale关系最为密切,A. delavayi 与A. ramulosum关系最为密切。本研究丰富了乌头属植物叶绿体基因组资源,为乌头属植物的分子标记、物种鉴定和系统发育研究提供了科学依据。
参考文献:
Xia C, Wang M, Guan Y, et al. Comparative Analysis of the Chloroplast Genome for Aconitum Species: Genome Structure and Phylogenetic Relationships[J]. Frontiers in genetics, 2022, 13.