批量测序实验(单组学和多组学)对于探索广泛的生物学问题至关重要。为了促进交互式、探索性任务以及共享易于访问的信息,《Briefings in Bioinformatics》发表了一个集成了最先进方法的工具包:bulkAnalyseR,可以处理不同的模式数据(转录、表观、时空等),促进顺式,反式和定制调控网络的强大集成和比较。
bulkAnalyseR是什么?
bulkAnalyseR 提供了一个可访问、灵活的端到端框架,用于分析批量测序数据集,而无需依赖先前的编程专业知识。它用两行代码生成一个可共享的 Shiny 应用程序;所有生成的图表和表格都可以单独下载,并且可以轻松复制用于生成输出的底层代码。
与其他公开工具相比,bulkAnalyseR是唯一一款提供多种分析的产品,同时还允许通过交互式参数调整对每个组件进行灵活定制。
bulkAnalyseR的功能及应用示例
bulkAnalyseR使用表达式矩阵作为起点,交互式panels分析并展示了质量检查、差异表达分析(带有噪声检测)和生物学解释(富集分析、表达模式的识别,然后是调节相互作用的推理和比较)。
1)输入和预处理:bulkAnalyseR的输入是表达式矩阵和元数据表。接下来,generateHinyApp检查输入和表达式矩阵的兼容性(默认情况下为去噪、标准化),并创建一个Shiny应用程序。
2)DE的交互式可视化:单组学实例包含几个选项卡,包括QC选项卡、DE选项卡和富集选项卡等。
3)基因调控网络的可视化:通过使用GENIE3推断调控互动网络(GRN选项卡),数据探索继续进行。
bulkAnalyseR在数据输入方面是通用的。该流程可以涵盖各种治疗组、组织类型、时间点和空间信息等多种情况。上图用时空组数据集展示了其灵活性:图 A-F 中,开发团队对比了在可变数量的时间点上获得的输出的解释,并说明了 bulkAnalyseR 管道总结模式的能力;图G-I将 bulkAnalyseR 管道应用于来自 10x Visium 数据集的五个不同皮质层的几个点。与之前的案例研究类似,通过空间捕获转录组变化和模式,使用户能够查询感兴趣的基因并通过层和区域可视化表达。
还可以使用bulkAnalyseR处理其他可以在表达矩阵中汇总的测序数据集,开发团队还在表观、microRNA数据集上进行了测试。
bulkAnalyseR还允许集成多种模式来推断调节相互作用(即顺式、反式和用户定义)。“顺式相互作用”需要两个输入,包括位于基因组学附近元素的焦点和非焦点模式用于增强焦点GRN 。对于“反式交互”,两个输入进行完整/早期集成,即具有相同列/条件的两个表达式矩阵被连接起来。GRN是在组合表达式矩阵上推断出来的;节点根据元素的原始来源进行着色。用户还可以嵌入自己的定制交互,以表格形式提供。
bulkAnalyseR 的目的是增强单组学和多组学数据的交互式访问;此外,与社区共享稳定的分析实例的能力可能简化研究小组之间的沟通,并产生超出数据集最初目的的新假设。此外,端到端方法中所有步骤的无缝集成,从早期的质量控制检查到可发布的数据,有助于在分析的整个生命周期中进行数据挖掘。
更重要的是,bulkAnalyseR提供了集成多种模式和数据集的灵活性,并通过标准富集分析、多组学集成和更多可定制的流程整合外部数据库。这为更复杂的问题提供了一个有价值/可靠的起点,为更好地理解观察到的表达差异背后的原因铺平了道路。
bulkAnalyseR算法可在CRAN和GitHub上开放访问:
👉 https://github.com/Core-Bioinformatics/bulkAnalyseR
或
👉 https://cran.r-project.org/web/packages/bulkAnalyseR/
首发公号国家基因库大数据平台
参考文献
Ilias Moutsopoulos, Eleanor C Williams, Irina I Mohorianu, bulkAnalyseR: an accessible, interactive pipeline for analysing and sharing bulk multi-modal sequencing data, Briefings in Bioinformatics, 2022;, bbac591, https://doi.org/10.1093/bib/bbac591