前言:在构建ceRNA 网络时,需要计算lncRNA 与 蛋白编码gene (pc gene) 间的表达相关性,一般采用皮尔逊相关系数。具体如何做呢?
- 首先获得lncRNA 的表达矩阵
假设有5个lncRNA,在100个样本中的表达量矩阵:
> head(lncRNA)
lncRNA1 lncRNA2 lncRNA3 lncRNA4 lncRNA5
sam1 7.80 5.81 6.40 6.11 4.87
sam2 1.47 1.75 2.49 2.20 2.02
sam3 0.00 0.00 1.28 0.00 0.00
sam4 0.00 0.00 1.74 0.00 0.00
sam5 1.83 0.99 0.72 0.69 0.50
sam6 0.00 4.04 0.00 0.00 0.00
> dim(lncRNA)
[1] 100 5
2.获得mRNA的表达矩阵
4个基因在100个样本的表达量矩阵:
> head(gene)
gene 1 gene 2 gene 3 gene 4
sam1 7.66 7.19 7.30 6.98
sam2 1.34 0.29 1.77 1.61
sam3 0.00 0.00 0.00 0.00
sam4 0.14 0.41 0.56 0.77
sam5 0.50 0.48 0.73 0.27
sam6 0.00 0.00 0.00 0.00
> dim(gene)
[1] 100 4
3.计算lncRNA 与gene 的表达相关性
使用cor()函数进行皮尔森相关系数计算,就是这么简单:
> cor_matrix <- cor(lncRNA,gene,metho="pearson")
> cor_matrix
gene 1 gene 2 gene 3 gene 4
lncRNA1 0.116393943 0.082464228 0.070419800 0.08509885
lncRNA2 -0.001455028 -0.004848818 0.008653588 -0.01047322
lncRNA3 0.027655655 0.019760497 0.029196236 0.00464662
lncRNA4 -0.016414621 -0.024633893 -0.012498862 -0.03835430
lncRNA5 -0.018116788 -0.018668500 -0.013198682 -0.03287980
> pheatmap(cor_matrix)