单细胞测序一

  • 本章开始记录自学单细胞分析,根据b站别人的投稿视频学习的,感谢up!(需要可以去搜索生信单细胞,播放量最高的两个视频)

1. 下载单细胞数据

  • GEO数据库里边搜索单细胞的数据,一般需要文件后缀是MTX的数据(里边有三个文件是必须要的)

  • 注意很多数据不是单细胞的要好好看一下
    搜索GEO
  • 一般是下载这个RAW文件
    RAW文件
  • 在这里我们直接搜索GSE106273下载数据

    image.png
    image.png

  • 简单理解:barcodes是细胞标记类似样本号;genes是gene ID;matrix为表达量(最后一列)


    文件解压

2. Seurat4.0系列教程1:标准流程

  • 读取方法一
  • 把三个压缩文件改名成这样
    image.png
library(dplyr)
library(mindr)
library(tidyverse)
setwd(dir = "D:/桌面/Rwork/single_cell/GSE10627/hg19/")
rm(list = is())
pbmc.data <- Read10X(data.dir = "D:/桌面/Rwork/single_cell/GSE10627/hg19/") #注意压缩包要改名
pbmc <- CreateSeuratObject(counts = pbmc.data, project = "pbmc", min.cells = 3, min.features = 200)
#过滤检测少于200个基因的细胞(min.features = 200)和少于3个细胞检测出的基因(min.cells = 3)

  • 读取方法二
    直接读取解压缩后的文件
BiocManager::install("multtest")
library(multtest)
if(!require(Seurat))install.packages("Seurat")
if(!require(dplyr))install.packages("dplyr")
if(!require(mindr))install.packages("mindr")
if(!require(mindr))install.packages("tidyverse")
library(Seurat)
library(dplyr)
library(mindr)
library(tidyverse)
#####自动读取cellranger(LINUX)输出的feature barcode matric
rm(list = ls())
pbmc.data <- Read10X(data.dir = "filtered_gene_bc_matrices/hg19/") 
#自动读取10X的数据,是一些tsv与mtx文件
pbmc <- CreateSeuratObject(counts = pbmc.data, project = "biomamba")
# pbmc <- CreateSeuratObject(counts = pbmc.data, project = "pbmc3k", min.cells = 3, min.features = 200)
#过滤检测少于200个基因的细胞(min.features = 200)和少于3个细胞检测出的基因(min.cells = 3)
  • 读取方法三(readtable读取就行)
library(Seurat)
library(dplyr)
library(mindr)
library(tidyverse)
setwd(dir = "D:/桌面/Rwork/single_cell/GSE84465")
a <- read.table("GSE84465_GBM_All_data.csv.gz")

head(rownames(a))
tail(rownames(a),10)#查看最后10个行名是啥
a=a[1:(nrow(a)-5),]#后5行行名异常 删掉
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容