食源性疾病是全球范围内重要的食品安全问题,早期发现和查明病因是防控食源性疾病的重要保证。食源性致病菌的全基因组测序离不开生物信息学分析, 包括菌种的鉴定、血清型分析、ST型分析,耐药和毒力基因分析等。如何使用这些生物信息分析工具将大量短的基因组碎片整合以及将大量来源不同 的基因组数据进行有效比对也是目前数据分析面临的巨大挑战。
随着新一代基因组测序技术的发展,基于全基因组测序(WGS)的分子分型技术在食源性疾病聚集性病例识别和暴发溯源调查中已显示出极大的应用价值和发展潜力,在国家重点研发计划“食品安全关键技术研发”重点专项的支持下,国家食品安全风险评估中心与中国农业大学和北京中科助腾科技有限公司合作,以国家食源性疾病分子溯源网络(TraNet)为基础,首次建成了基于WGS分型技术的新型食源性疾病分子溯源网络,是我国首个实现国家、省、市三级实际应用的分子溯源网络。
而WGS技术的推广和使用需要解决庞大基因组数据的传输、储存、快速计算和精准比对,需要成熟易用的生物信息学分析流程和标准化解释系统。针对上述问题,研究团队开发了基于阿里云OSS的WGS三级架构WGS原始测序数据交付中心,实现了原始数据的实时、快速上报及安全传输。在此基础上,建立了基于WGS原始及拼接后数据的全基因组特征基因图谱识别算法,通过以上两种分析方式的相互校正,显著提高了全基因组特征基因分析的准确性,同时建立了分辨力高、重复性好的全基因组多位点序列分型(wgMLST)和核心基因组多位点序列分型(cgMLST)标准化方法,结合流行病学信息,构建了溯源分析知识库,实现了不同实验室间WGS数据的快速分析、比对与共享。
研究团队还进一步研究并整合NCBI、CARD、ResFinder、VFDB等公共数据库中的特征基因数据,开发了常见食源性致病菌毒力因子、耐药基因、血清分子分型、等自动化分析功能模块,有助于各级实验室开展食源性微生物遗传与变异特征、致病和耐药机制及菌株进化等方面的基础研究。该平台通过便捷的图形界面操作和可视化报告结果展示,为科研人员提供强大的数据管理与分析工具,为传染病防治、食品安全事故处理、第三方的检测检验等工作提供可靠支撑。