下载安装R包前先运行下面的代码
options(BioC_mirror="http://mirrors.tuna.tsinghua.edu.cn/bioconductor/") options("repos" = c(CRAN="http://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
来自CRAN的包
install.packages("包")

此外,还安装了“Seurat” (
install.packages("Seurat"))
来自bioconductor的包
先安装“BiocManager”包
install.packages("BiocManager")
再调用BiocManager包
library(BiocManager)
再安装其他的包
BiocManager::install("包")

注意尽管保存了workspace,再次打开时也要先运行开头的那两行代码,才能下载安装“包”。网络也会影响R包的安装,一次不成功就再来一次
探索Rstudio
在脚本编辑器里面编辑代码,选中要运行的部分点run才会运行
在命令行,先给x赋值,然后输入x会返回赋的值,而输入x()表示x是一个包或者命令,有括号和没有括号的区别
首先新建一个project:file→new project,然后选择文件夹位置
getwd()就可以看到工作目录
先把数据放到工作目录下,再读入数据
x<-read.csv("gene_exp.txt",header = T,sep = "\t",row.names = 1)
读入工作目录下的gene_exp.txt文件,标题行是真的,row.names = 1:行的名字是第一列,txt文件的分隔是“\t”,csv文件的分隔是"," 将读入的这个txt文件赋值为x。

这里的view,v是大写的,尽量选它弹出来的。双击environment中的对象也可以在脚本编辑器中打开文件
在工作目录下的文件夹也可以打开,把路径写清楚就好,其他内容是一样c<-read.csv("R_basic/data/R_basic/gene_exp.txt",header = T,sep = "\t",row.names = 1)
对读入的数据每行求和
head(apply(x, 1, sum))
对读入的数据每列求和
head(apply(x, 2, sum))

接着求这个x的相关系数,跟概念中的求xy的相关不一样。
sample_cor<-cor(x)

可以看到已经求出了相关系数,但是还不够简洁明了,上图。
调用pheatmap
library(pheatmap)pheatmap(sample_cor)
pheatmap(sample_cor,cluster_rows = F,cluster_cols = F)
两个的图是一样的,区别在于:有没有额外的线,这个线代表什么呢?
对另外一组数据做同样的处理得到的结果


疑问① 横纵的标识不再是sample,而是原来数据的列名,而前面的数据就变成了sample1,2,3。所以在做相关分析的时候要注意列名
关于疑问①,是求出的相关系数,行和列都是sample,而在后面那个数据中行和列都是之前的列名。所以做相关要注意列名。

疑问② pheatmap(y1,cluster_rows = F,cluster_cols = F)这里的cluster_rows = F, cluster_clos = F是什么意思呢?
pheatmap(y1,cluster_rows = F,cluster_cols = T)

pheatmap(y1,cluster_rows = T,cluster_cols = F)
当clos为T时,线在列上,当rows为T时,线在行上。
疑问②解决,