gcPathogen概述

近期发布的gcPathogen是一个整合了人类相关病原微生物的综合类网站。该网站有几个有特点:

  1. 该网站内的病原微生物来自一些权威官方。比如WHO、中国疾控中心、美国疾控中心等。
  2. 该网站数据库中的微生物综合信息(meta information)和基因组经过人工的二次审核,质量较高。
  3. 该网站提供了与微生物meta information 可交互的可视化界面,能够更加直观的查看病原微生物在不同时间、不同地区、不同宿主之间的分布情况,以及与之相关的传染病,并提供了这些信息相关的论文依据。同时提供了基因组序列的下载。
  4. 该网站还提供病原微生物相关的毒力基因、MEG可移动遗传元件、耐药基因信息。而且能够将其以query index去展示在不同维度(地区、物种、宿主,时间)下的分布以及ARGs和MEG之间的相关关系。
  5. 该网站还提供一些较为常用微生物在线分析流程,比如:注释、鉴定、MLST、gcMLST等。

当然,就我目前的使用体验而言,也认为其可能存在着一些缺陷:

  1. 在线分析流程速度过慢,应该不是我上传基因组大小的问题(仅2.3M)。
  2. 注意!仅仅包含与人类病原(human pathogens)相关的数据,对于其余非致病的微生物,是不包含在内的。当然,我也不见得它已经包含了所有的human pathogens。因此,若是想仅凭该网站得到比较权威的结论,实现“one - stop”的体验,应当还是要有谨慎的态度。

文章发表时间:18 October 2023
原文链接:gcPathogen: a comprehensive genomic resource of human pathogens for public health
Usage guide:https://nmdc.cn/gcpathogen/static/html/User%20Manual%20for%20Global%20Catalogue%20of%20Pathogens.pdf

文章目前的引用情况(截至20231030

Highlights:

  • Facilitate rapid and accurate pathogen analysis, epidemiological exploration and monitoring of antibiotic resistance features and virulence factors.

  • Pathogen inventory of human pathogens from reputable source. Data(sequence assemblies) of this inventory were retrieved from NCBI.

  • The database in gcPathogen underwent rigorous QC

    1. Sequence assemblies > 0.95 completeness and < 0.05 contamination with checkM
    2. Same speices:ANI value > 0.95 with reference seq from NCBI's Refseq by FastANI
    3. metadata information were manually categorized
      可以看到,database还是具有一个相当高的质量。
  • 数据库包含:

    1. 497 个细菌物种 == 986 044 个株系 == 1 164 974 组装基因组
    2. 265 个真菌物种 == 4319 个株系 == 4794 组装基因组
    3. 222 个病毒物种 == 13 687 个毒株 == 89 965 组装基因组
    4. 159 个寄生虫物种 == 986 044 个株系 == 646 组装基因组
  • Multiple online tools for rapid genomic analyses.
    1.‘pathogen identification’ tools:16S,ANI
    2.‘genomic annotation pipeline’ :gcType database
    3.‘MLST’ pipeline determines STs:MLST,PubMLST
    4.‘cgMLST’ pipeline:chewBBACA

流程概要.jpg

Overview database information

简单使用

你可以检索某一类病原,比如:这里我以“Salmonella enterica”为例。当然你也可以按“Genome”、“ARGs”、“VFs”为query index进行检索。

不同的检索类目

在以Taxa检索的情况下,你又可以按照“总览”、“序列类型”、“抗性基因”、“毒力基因”、“可移动遗传元件”、“相关paper”进行展开.
Result of *Salmonella enterica* search
Salmonella enterica的Overview下,大概罗列了的Taxonomy ID、Complete taxonomic lineage、Reference Genome、Data Volume、Strains、Host、Related diseases、ARGs、VFs等信息。

Sequencing information and Epidemiological information

Temporal and Spatial Distribution Map of Pathogen

Genome List

Salmonella enterica下的基因组列表,你可以一次性将所有的基因组全部下载下来,也可以下载某几个assembly genome。

在Sequencing typing (菌株分型)中,是将Salmonella enterica依据不同的分型展示,展示的信息也是先当丰富的。
Sequencing typing
其中的“Knowledge Graph”挺有意思的,它罗列了Salmonella enterica下相关的论文研究。
Knowledge Graph

其余的就不细致地展开说明了。需要提一点的就是gcPathogen虽然整合了一些在线分析流程,但实际使用感觉分析地有点慢,虽然它给了我三十个线程。


Tools

补充说明:

抗生素抗性基因(ARG) 的移动遗传元件(MGE):
  1. Antibiotic resistance genes can be transferred from the environment to human pathogens through transformation, leading to resistance dissemination in microbial ecosystems, between different pathogen populations, and even across species。细菌中携带ARGs的质粒、整合子以及转座子等可在菌株间发生水平基因转移,菌株死亡后携带ARGs的DNA在环境中长期存在。
  2. MGEs play a crucial role in bacterial horizontal transfer, enabling the acquisition of antibiotic resistance and virulence traits and facilitating adaptive evolution .是一种可以在基因组中移动并从一个物种或复制子转移到另一个物种或复制子的遗传物质。 MGE 存在于所有生物体中.包括:转座子、质粒、噬菌体原件、Ⅱ型内含子。
    Resistance to different drug classes in 20 countries with the largest pathogen samples from 2000 to 2021. Pathogenic mobile genetic element frequencies and associated antibiotic resistance gene amounts in different years, countries and hosts are also shown.
MGEs的时空分布(有一说一,这个图画的真不错!)
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 220,295评论 6 512
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,928评论 3 396
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 166,682评论 0 357
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,209评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,237评论 6 397
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,965评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,586评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,487评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 46,016评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,136评论 3 340
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,271评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,948评论 5 347
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,619评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,139评论 0 23
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,252评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,598评论 3 375
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,267评论 2 358

推荐阅读更多精彩内容