物种鉴定笔记 | EUKARYOME:用于鉴定所有真核生物的 rRNA 基因参考数据库

基于核标记的微生物和大生物分子鉴定彻底改变了我们对它们的分类学、系统发育和生态学的理解。如今,对全球生态系统中真核生物多样性的研究严重依赖于核核糖体 RNA (rRNA) 标记。今年6月《Database》杂志发表了一个新的参考数据库:EUKARYOME,包含所有真核生物(包括后生动物(动物)、原生动物、真菌和植物)的核核糖体 18S rRNA、内部转录间隔(ITS)和 28S rRNA 标记。


与其他带注释的参考序列数据库相比,该数据库的主要优点是它不限于某些分类群,它包括所有rRNA标记。EUKARYOME还提供了许多来自(宏)基因组和(宏)条形码的参考长读长序列,这是一种独特的特征,可用于三代长读长高通量测序数据的分类鉴定和嵌合体控制。

参考数据集可以从项目主页以多种格式获取:

👉 http://www.eukaryome.org.


EUKARYOME概述

EUKARYOME 数据库包括来自多个参考序列数据库的序列数据,并独特地利用长reads对来自 eDNA 的参考序列进行分类定位。ITS标记中的属级信息改善了SSU和LSU的识别,特别是在rRNA基因分类分辨率低的情况下,或者在特定分类群未对这些基因进行测序的情况下(例如许多真菌群)。此外,开发团队使用可靠的rRNA基因更高级别的系统发育定位来解决ITS数据子集中从目到界级别的不确定性


read来源的相对贡献


EUKARYOME 仅采用林奈等级,包括种、属、科、目、类、门和界。EUKARYOME 参考数据库根据核 rRNA SSU(150,442 个reads)、ITS(1,111,297 个reads)和 LSU(100,197 个reads)标记分别和组合(28,684 个 SSU-ITS-LSU reads)涵盖了所有陆生和水生真核生物类群。当前版本的数据库共包含 1,244,454 个条目。


其主要优势在于:

它不局限于某些分类群,而且包括所有 rRNA 标记;

EUKARYOME 为 SSU、ITS 和 LSU 子集分别或合并编译了注释清晰、非冗余、高质量的reads,用于高精度分类参考和嵌合体识别;

EUKARYOME 还提供大量参考长reads序列,这一独特功能可用于三代长读长高通量测序数据的分类鉴定和嵌合体控制。


此外,EUKARYOME 以电子表格格式保存,以便快速搜索,并可使用 MS Excel 和其他电子表格程序或文本编辑编程语言的常规选项更新个别数据字段。


其他数据库和资源推荐

EUKARYOME 还设置了"Other databases and resources"板块,整理了其他可用于真核生物研究的数据库及软件。

数据库

与上述数据库相比,EUKARYOME 使用的超长reads横跨 SSU、ITS 和 LSU 区域,这对于利用超长reads过滤嵌合体和改进鉴定至关重要。

软件


其他资源


参考文献

Leho Tedersoo, Mahdieh S Hosseyni Moghaddam, Vladimir Mikryukov, Ali Hakimzadeh, Mohammad Bahram, R Henrik Nilsson, Iryna Yatsiuk, Stefan Geisen, Arne Schwelm, Kasia Piwosz, Marko Prous, Sirje Sildever, Dominika Chmolowska, Sonja Rueckert, Pavel Skaloud, Peeter Laas, Marco Tines, Jae-Ho Jung, Ji Hye Choi, Saad Alkahtani, Sten Anslan, EUKARYOME: the rRNA gene reference database for identification of all eukaryotes, Database, Volume 2024, 2024, baae043, https://doi.org/10.1093/database/baae043

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容