SCEVAN
A fast variational algorithm to detect the clonal copy number substructure of tumors from single-cell data
A fast variational algorithm to detect the clonal copy number substructure of tumors from single-cell data | bioRxiv
癌症单细胞的恶性肿瘤细胞判定新方法-SCEVAN (qq.com)
肿瘤是癌细胞的复杂组织,周围环绕着异质的细胞微环境,它们相互作用。单细胞测序使得肿瘤内的单细胞具有分子角色塑造。然而,细胞注释ーー将细胞类型或细胞状态分配给每个测序的细胞ーー是一个挑战,特别是在单细胞或空间测序实验中鉴定肿瘤细胞。在这里,我们提出 ikarus,一个机器学习管道,旨在区分单细胞水平的肿瘤细胞和正常细胞。我们在多个单细胞数据集上测试了 ikarus,结果显示它在多个实验环境下达到了很高的灵敏度和特异度。
PS:图中明显表明还有其他的前人的工作,我就懒得读了
Delineating copy number and clonal substructure in human tumors from single-cell transcriptomes
CopyKAT [1] (Copynumber Karyotyping of Tumors) 全称为非整倍体肿瘤拷贝数核型分析,基于贝叶斯分割方法,可量化单细胞数据的基因组拷贝数图谱,鉴定肿瘤微环境中的正常细胞和肿瘤细胞,并区分克隆亚结构。预测肿瘤/正常细胞状态的基本原理是非整倍体在人类癌症中很常见 (90%)。具有广泛全基因组拷贝数畸变(非整倍体)的细胞被认为是肿瘤细胞,而基质正常细胞和免疫细胞通常具有二倍体或接近二倍体的拷贝数分布。
CopyKAT 相较于 InferCNV 是不需要正常细胞的,可以自动寻找二倍体细胞作为正常细胞。不过原理都是通过单细胞转录组数据来推断细胞的染色体倍数,进而推断是正常细胞还是肿瘤细胞。
Identification of non-cancer cells from cancer transcriptomic data - PMC (nih.gov)
细胞类型特异性参考表达谱矩阵也可以从 scRNA-seq 数据中推导出来(图3C)。然后,基于反卷积的定量方法可以使用这些矩阵从大量肿瘤转录组数据中估计不同细胞群的丰度。例如,EPIC [50]使用了来自黑素瘤 scRNA-seq 数据集表达谱的参考矩阵[71]。这种方法后来扩展到另外两个 scRNA-seq 数据集(正常血液[29]和卵巢癌[78]) ,以建立五个参考表达谱矩阵[78]。每个矩阵都是通过不同的策略获得的,这些策略用于在基因表达数据集和细胞类型之间和之内平均单细胞。然后,将 CIBERSORT 应用于每个参考矩阵[48]和来自独立来源的参考标记物基因[48,71,78]。通过对细胞类型和数据集中的表达进行平均,获得了模拟和实际批量 RNA-seq 数据上十种退褶合和两种基质的类型的最佳癌细胞结果[78]。这突出了退褶合方法对参考轮廓矩阵质量的强烈依赖性。CIBERSORT 的最新版本,CIBERSORTx [79] ,允许使用从单细胞或大量表达数据获得的参考签名,从而解释了这一相依性。CIBERSORTx 还使用 nu 支持向量回归来估计细胞类型比例。然而,在退褶合之前,它对参考特征和大量 RNA-seq 数据之间的平台特异性变化进行标准化和批量校正。
InferCNV
这个我就不写了
A single-cell and spatially resolved atlas of human breast cancers | Nature Genetics
研究团队开发了一种与scRNA-seq兼容、可进行内在分子亚型分型的方法—SCSubtype(图2a)。SCSubtype能够正确识别恶性细,特异性比批量和scRNA-seq更高。
为了研究MutaSeq是否能够区分白血病、白血病前和残留的健康克隆,研究人员从4名基因型和表型存在异质性的AML患者中获取了单细胞转录组数据,并基于此去鉴定核基因组突变以及线粒体突变,以便探索线粒体突变是否可以与核内基因组突变一起用于改进克隆层级聚类。
结果表明,与基因组突变不同,来自线粒体突变的克隆鉴定大多不受基因表达水平或文库质量的影响,并且线粒体基因处于高表达水平,因此基于较低的测序深度就可鉴定。更重要的是,这些基于线粒体突变鉴定的克隆结构随后也被靶向单细胞基因组测序所验证。因此,上述方法能够鉴定白血病、前白血病和健康的克隆,并且如果存在线粒体体细胞变异,可以更加准确地将单个细胞分配给相应克隆。
Single-cell gene fusion detection by scFusion | Nature Communications
基因融合在肿瘤的发生、发展过程中起着重要作用。虽然融合检测迄今为止一直从批量样品,全长单细胞 RNA 测序(scRNA-seq)提供了在单细胞水平检测基因融合的可能性。然而,scRNA-seq 数据具有很高的噪声水平,并且包含各种技术伪影,这些伪影可能导致伪造的融合发现。在这里,我们提出了一个计算工具,scFusion,基于 scRNA-seq 的基因融合检测。我们使用模拟和五个真实的 scRNA-seq 数据集来评估 scFusion 的性能,发现 scFusion 能够高效、灵敏地检测融合,并且具有较低的错误发现率。在 T 细胞数据集中,scFusion 检测粘膜相关不变性 T 细胞中的不变性 TCR 基因重组,许多为大量数据开发的方法未能检测到; 在多发性骨髓瘤数据集中,scFusion 检测已知的复发性融合 IgH-WHSC1,该融合 IgH-WHSC1与 WHSC1癌基因的过度表达有关。我们的研究结果表明,scFusion 可用于研究基因融合的细胞异质性及其在单细胞水平上的转录影响。