前言
Immugent最近读到了一篇非常炸裂的文献,篇名为:High dimensional co-expression networks enable discovery of transcriptomic drivers in complex biological systems,虽然目前挂在了预印刊bioRxiv平台上,但是Immugent相信这篇文章很可能已经在CNS级别的杂志上在审稿了。
Immugent之所以这样说,一方面是因为这项研究出自著名的Vivek Swarup团队,另一方面它真的满足了我们对单细胞数据进行WGCNA的所有想象。而且该团队在2021年的时候就提出了scWGCNA的理念,相应文章发表在Nature Genetics杂志上。更重要的是这篇文章联合生物学故事,整篇文章做的相当完美了,那下面就让我们一睹为快吧!
按照生信宝库“送饭送到嘴里”的一贯做法,本期推文主要是通过hdWGCNA包相应的文章在整体上了解它的功能框架,后续会推出系列代码实操的推文来介绍它的使用。
主要内容
经典的生物信息学方法,如差异基因表达分析,对于发现在特定疾病或感兴趣的病症中发生改变的个体基因是有用的,但它们不能提供有关这些基因在特定途径或调控机制中的更广泛背景的信息。因此WGCNA(Weighted gene co-expression network analysis)的提出,为我们提供了一个综合分析各种基因和通路之间调控网络的功能框架。
但是传统的WGCNA分析只能在bulk数据上使用,而单细胞层面的WGCNA分析需要将其转化成类似bulk数据的形式才能实现,而这个过程会丢掉很多信息。此外,单细胞数据和bulk数据因为测序深度不同,它们之间的特征也有很多差异,因此照搬肯定是行不通的。
hdWGCNA的提出为我们解决了这个难题,而且是完全基于单细胞数据,包含空间转录组数据。其流程基于给定一个基因表达数据集作为输入,共表达网络分析通常包括以下分析步骤:计算输入特征的两两相关性,用软实力阈值加权相关性(β),计算特征之间的拓扑重叠,并通过动态树切算法进行无监督聚类。
单细胞数据中固有的稀疏性和噪声可能导致虚假的基因-基因相关性,从而使共表达网络分析复杂化。此外,单细胞或空间转录组数据的相关结构在不同的亚群(细胞类型、细胞状态、解剖区域)中差异很大。scRNA-seq数据中的典型hdWGCNA工作流程通过将高度相似的细胞折叠成“metacell”来减少稀疏性,同时保留细胞异质性,并允许模块化设计在特定细胞群中执行单独的网络分析,从而考虑到这些因素。
紧接着第二张图,作者也决不含糊直接上王炸,展示如何用hdWGCNA来分析空间转录组数据。在这里,作者利用来自10x Genomics的Visium转录组数据集,通过使用hdWGCNA来识别小鼠大脑中的空间共表达网络模块。
同一基因的不同转录本(Isoform)常常参与不同的生物过程,传统的单细胞转录组学分析在基因水平上捕获信息,因此错过了在同工异构体水平上发生的许多生物多样性和调节机制。新兴的长读测序方法使我们能够在同种异构体分辨率上分析细胞转录组,从而为利用共表达网络分析来模拟同种异构体之间的关系提供了新的机会。因此,作者接下来就介绍了如何使用hdWGCNA,对出生后第7天(P7)小鼠海马放射状胶质谱系细胞进行了同型共表达网络分析。
因为目前单细胞组学仍然价格昂贵。而目前bulk数据资源很丰富。因此,作者最后还不忘介绍如何使用hdWGCNA,将大量RNA-seq共表达模块投射到单细胞数据集中。
文章内容很多,Immugent只是介绍了一部分,感兴趣的小伙伴可以直接看原文来补充学习剩下的部分。
展望
总的来说,hdWGCNA是一个分析单细胞转录组学数据(包含转录组和空间)中共表达网络的综合功能框架。hdWGCNA为网络推理、基因模块识别、功能基因富集分析、网络再现性统计测试和数据可视化提供内置功能。除了传统的单细胞RNAseq外,hdWGCNA还能够使用长读单细胞数据进行同型水平的网络分析。
在这项研究中,作者利用来自自闭症谱系障碍和阿尔茨海默病大脑样本的公开单细胞数据集展示了hdWGCNA,在特定细胞群体中确定了与疾病相关的共表达网络模块。hdWGCNA与Seurat直接兼容,作者通过分析包含近100万个细胞的数据集来证明hdWGCNA的可扩展性。
好啦,本期分享到这里就结束了。下期推文开始,Immugent将通过代码实操的方式介绍如何使用hdWGCNA分析单细胞组学数据。
[参考文献]
High dimensional co-expression networks enable discovery of transcriptomic drivers in complex biological systems Samuel Morabito, Fairlie Reese, Negin Rahimzadeh, Emily Miyoshi, Vivek Swarup bioRxiv 2022.09.22.509094; doi: https://doi.org/10.1101/2022.09.22.509094