单细胞互作分析-cellphonedb

前言:

大家好,今天我们一起学习一下如何利用CellphoneDB对单细胞分析结果进行互作分析,当前CellphoneDB的最新版本是4.0.0,可以对单细胞中不同细胞群水平上的互作基因对进行评估。我们在这里利用该版本进行实操。

软件安装:

# 创建、切换环境,
conda create -n cellphonedb python=3.8  #python3.8支持CellphoneDB 4.0。
source activate cellphonedb
# 安装需要软件
pip install cellphonedb -i https://pypi.tuna.tsinghua.edu.cn/simple
# 检查版本信息
>>> import cellphonedb
>>> cellphonedb.version
'4.0.0'

输入数据说明:

我们在Cellphonedb分析过程中,需要用到官方提供的数据库,可以自行下载:

Wget https://github.com/ventolab/cellphonedb-data          # 当前支持人和小鼠。
# 定义数据库路径
cellphonedbpath = "/data/xxx/cellphonedb/cellphonedb.zip" 
outdir = "/data/xxx/cellphonedb_out/"                      # 设置输出文件路径:

输入数据我们可以去下载cellphonedb官方示例,这篇文章我们使用的数据是自己准备的,准备示例如下:

pbmc = readRDS(raw.rds)
write.table(as.matrix(pbmc@assays$RNA@data),'cellphonedb_count.txt', sep='\t', quote=F)
meta_data <- cbind(rownames(pbmc@meta.data), pbmc@meta.data[,'cell_type', drop=F]) 
meta_data <- as.matrix(meta_data)
meta_data[is.na(meta_data)] = "Unkown" # 细胞类型为NA的转换成 "Unkown" 字符串
write.table(meta_data,'cellphonedb_meta.txt', sep='\t', quote=F, row.names=F)

如果项目类型为空间转录组,我们需要额外准备微环境文件:

# 官方给出来的数据结构,第一列是细胞类型,第二列是空间微环境。
cell_type   microenviroment
epi_Ciliated    Proliferative
epi_Pre-ciliated    Proliferative
epi_SOX9_LGR5   Proliferative
epi_SOX9_prolif Proliferative
epi_SOX9    Proliferative
FibroblasteS    Proliferative
Lymphoid    Proliferative
Myeloid Proliferative
FibroblastC7    Proliferative

软件说明:

Cellphonedb提供了三种计算模式,分别对应不同的分析需求。

  • 模式一:cpdb_analysis_method

CellphoneDB在此模式下不进行统计分析,单纯输出细胞群水平下受配体对的平均值。既然是均值,当然是需要保证在一种细胞类型中,有多个细胞同时表达该基因才可以进行均值计算,有多少细胞表达该基因,就是由阈值参数进行规定了。否则,该配受体对是会被cellphonedb进行过滤掉的。

from cellphonedb.src.core.methods import cpdb_analysis_method

means, deconvoluted = cpdb_analysis_method.call(
    cpdb_file_path = cellphonedbpath,
    meta_file_path = "/data/xxx/cellphonedb/cellphonedb_meta.csv",
    counts_file_path = "/data/xxx/cellphonedb/cellphonedb_count.csv", #也可以输入h5文件。
    counts_data = 'hgnc_symbol',
    output_path = outdir )

文件输出:

simple_analysis_deconvoluted_result.txt

simple_analysis_means_result.txt

  • 模式二:statistical_analysis

CellphoneDB在此模式下进行统计分析,用于评估数据集中可能发生的所有相互作用的显著性。CellphoneDB 使用 empirical shuffling 来计算配体-受体对在相应细胞类型中的显著性P值。简单而言,它通过随机排列所有细胞的簇标记来估计相互作用簇中平均配体和受体表达的平均值的零分布。然后根据与实际均值一样高或更高的比例计算其P值。

from cellphonedb.src.core.methods import cpdb_statistical_analysis_method

deconvoluted, means, pvalues, significant_means = cpdb_statistical_analysis_method.call(
    cpdb_file_path = cellphonedbpath,
    meta_file_path = "/data/xxx/cellphonedb/cellphonedb_meta.csv",
    counts_file_path = "/data/xxx/cellphonedb/cellphonedb_count.csv",
    counts_data = 'hgnc_symbol',
    output_path = outdir )

文件输出:

statistical_analysis_deconvoluted.txt

statistical_analysis_means.txt

statistical_analysis_pvalues.txt

statistical_analysis_significant_means.txt

  • 模式三:degs_analysis

CellphoneDB在此模式下允许用户提供一个输入文件(DEGlist2.txt:第一列细胞类型,第二列基因名),cellphonedb将选择相互作用对中的所有基因在相应的细胞类型中由超过 20%的细胞表达(阈值=0.2),并且至少一个基因-细胞类型对在所提供的 DEG.tsv 文件中。

# DEGlist2.txt 格式要求
Macrophage      TSPAN6
Macrophage      DPM1
Macrophage      SCYL3
Macrophage      C1orf112
from cellphonedb.src.core.methods import cpdb_degs_analysis_method

deconvoluted, means, relevant_interactions, significant_means = cpdb_degs_analysis_method.call(
         cpdb_file_path = cellphonedbpath,
         meta_file_path = "/data1/ZY/cellphonedb/cellphonedb_meta.csv",
         counts_file_path = "/data1/ZY/cellphonedb/cellphonedb_count.csv",
         degs_file_path = "/data1/ZY/cellphonedb/DEGlist2.txt",
         counts_data = 'hgnc_symbol',
         threshold = 0.2,
         output_path = outdir)

degs_analysis_deconvoluted_result.txt

degs_analysis_means_result.txt

degs_analysis_relevant_interactions_result.txt

degs_analysis_significant_means.txt

数据可视化

CellphoneDB 官网推荐两种可视化方案,分别为:ktplotstplotspy (python),本推文我们以 python 包 ktplotspy 为例进行演示:

import os
import anndata as ad
import pandas as pd
import ktplotspy as kpy
import matplotlib.pyplot as plt

adata = pd.read_csv("/data/xxx/cellphonedb/cellphonedb_meta.csv")
xdata = pd.read_csv("/data/xxx/cellphonedb/cellphonedb_count.csv")

# 生成anndata对象
andata = ad.AnnData(xdata.T,obs=adata)
# andata = ad.read_h5ad("test.h5ad") # andata也可以直接读取h5文件。

# 以下三个文件均为以上cellphonedb的输出文件。
means = pd.read_csv("/data/xxx/cellphonedb/statistical_analysis_means_04_07_2023_02:52:43.txt", sep="\t")
pvals = pd.read_csv("/data/xxx/cellphonedb/statistical_analysis_pvalues_04_07_2023_02:52:43.txt", sep="\t")
decon = pd.read_csv("/data/xxx/cellphonedb/statistical_analysis_deconvoluted_04_07_2023_02:52:43.txt", sep="\t")
  • 绘制热图。通过显著受配体体对情况比较不同的细胞群之间的相关性。
kpy.plot_cpdb_heatmap(
adata=andata,
pvals=pvals,
celltype_key="celltype",
figsize=(5, 5),
symmetrical=True,
title="Sum of significant interactions") 
plt.savefig("plot_cpdb_heatmap.pdf")
plot_cpdb_heatmap.png
  • 点图绘制,可以进行基因和细胞的选择。
g = kpy.plot_cpdb(
   adata=andata,
   cell_type1="Monocyte",
   cell_type2=".",      # all cell-types
   means=means,
   pvals=pvals,
   celltype_key="celltype",
   genes=["MTMR7","SLC7A2","ARF5","SARM1","POLDIP2","PLXND1","AK2","CD38","FKBP4","KDM1A","RBM6","CAMKK1","RECQL","VPS50","HSPB6","ARHGAP33","NDUFAB1","PDK4","SLC22A16","ZMYND10","ARX","SLC25A13","ST7","CDC27","SLC4A1","CALCR","HCCS","DVL2","PRSS22","UPF1","SKAP2","SLC25A5","MCUB","POLR2J","DHX33","MEOX1","THSD7A","LIG3","RPAP3","ACSM3","REXO5","CIAPIN1","SPPL2B","FAM214B","COPZ2","PRKAR2B","MSL3","CREBBP","TSPOAP1","MPO","GCFC2","WDR54","CROT","ABCB4","KMT2E","RHBDD2","IBTK","ZNF195"],#, "DPM1"],
   figsize=(10, 2),
   title="interacting interactions!",
   # gene_family="chemokines", 支持筛选基因家族。
   # highlight_size=1, 绘制全部的受配体。
)
g.save(filename = 'plot_cpdb.pdf', height=5, width=5, units = 'in', dpi=1000) 
# 该图源码中使用的plotnine进行绘制,返回对象后,使用save方法进行图片保存。

plot_cpdb.png
  • 弦图绘制 展示不同细胞群之间的配体受体对。
circle = kpy.plot_cpdb_chord(
   adata=andata,
   cell_type1="Monocyte",
   cell_type2=".",
   means=means,
   pvals=pvals,
   deconvoluted=decon,
   celltype_key="celltype",
   #genes=["VPS50","HSPB6","ARHGAP33","NDUFAB1","PDK4","SLC22A16"],
   figsize=(6, 6),
   '''
    face_col_dict={ # 定义环的颜色。
       "B cell": "red",
       "NK cell": "blue",
       "CD4T cell": "black",
       "pDC": "brown",
       "Neutrophil": "grey",
       "Mast cell": "orange",
       "NKT cell": "pink",
       "CD8T cell": "cyan",
   },
   edge_cmap 定义边颜色
   '''
)
circle.save(file_name = 'plot_cpdb_chord',format='pdf', dpi=300)
# 该图返回的是Gcircle对象,save方法的参数有所改变,请注意。
plot_cpdb_chord.png
  • 补充seurat对象保存h5的方法
library(SeuratDisk)
library(Seurat)
SaveH5Seurat(seurat.obj,filename="test.h5seurat", overwrite = TRUE)
Convert("test.h5seurat", dest = "h5ad", overwrite = TRUE)   
©著作权归作者所有,转载或内容合作请联系作者
禁止转载,如需转载请通过简信或评论联系作者。
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,242评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,769评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,484评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,133评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,007评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,080评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,496评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,190评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,464评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,549评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,330评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,205评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,567评论 3 298
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,889评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,160评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,475评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,650评论 2 335

推荐阅读更多精彩内容