1. 下载cellranger
, 这里下载的是6.0最新版本
$ wget -O cellranger-6.0.1.tar.gz "https://cf.10xgenomics.com/releases/cell-exp/cellranger-6.0.1.tar.gz?Expires=1618687264&Policy=eyJTdGF0ZW1lbnQiOlt7IlJlc291cmNlIjoiaHR0cHM6Ly9jZi4xMHhnZW5vbWljcy5jb20vcmVsZWFzZXMvY2VsbC1leHAvY2VsbHJhbmdlci02LjAuMS50YXIuZ3oiLCJDb25kaXRpb24iOnsiRGF0ZUxlc3NUaGFuIjp7IkFXUzpFcG9jaFRpbWUiOjE2MTg2ODcyNjR9fX1dfQ__&Signature=Gp1U4ar6QlhQfqXiCEjMQFQ9o0GH-~WoMJmVYO1V-aSvmLGoYYjg~rbwBvoLtVSEGiYFahjj6TM3mFWEWjoLF7Z0vlsxLpHb0gvEMnH1YhUAxC3NBaLquRyXNhVETkY2Nk98z6nnC5j1RnvWq8CqRH1DU3Dbz8jV6iQTl4dQkLlYxWfOUgwy~2Dkzc6z6VrPw6kj0xllei9Rq8Pn6SkHI9k8ulGO3ys8sMQknw-9RLzENqQpEdy86fs1ehLaxR3DZDu97In-WrcR2QjBjEvLnOTOMTuU4-0E9WoUYBmsMTD9jr0w1vbh1agMx0LdMRzDP4X~1lcD~1hGwRK9Zx-ohg__&Key-Pair-Id=APKAI7S6A5RYOXBWRPDA"
2. 下载cellranger专用的参考基因组, 10x官网提供了小鼠和人的参考基因组信息, 包括gtf, fa等
$ wget https://cf.10xgenomics.com/supp/cell-exp/refdata-gex-mm10-2020-A.tar.gz
3. 下载单细胞SRA数据, 使用sratoolkit
中的prefetch
$ prefetch SRR12318312.sra
$ prefetch SRR12318316.sra
4. 转换为fastq, 使用sra-tools
中的fastq-dump
$ fastq-dump --split-files --origfmt --gzip SRR12318312.sra
$ fastq-dump --split-files --origfmt --gzip SRR12318316.sra
这里只输出了两个文件, 但是看别的教程都是三个文件, 包含barcode, umi和reads, 最后跑的时候也没报错
5. 将输出的fastq文件改名为cellranger的格式
$ mv SRR12318312_1.fastq.gz SRR12318312_S1_L001_R1_001.fastq.gz
$ mv SRR12318312_2.fastq.gz SRR12318312_S1_L001_R2_001.fastq.gz
$ mv SRR12318316_1.fastq.gz SRR12318316_S1_L002_R1_001.fastq.gz
$ mv SRR12318316_2.fastq.gz SRR12318316_S1_L002_R2_001.fastq.gz
6. 运行cellranger count
命令获取表达矩阵
- id: 代表输出文件目录, 会自动创建
- sample: 输入fastq文件的前缀
- fastqs: 输入文件的路径
- transcriptome: 参考基因组的路径
- localmem: 内存限制(GB), 适用于本地程序
- localcores: 线程数, 适用于本地程序
$ cellranger count --id=stemCells --sample=SRR12318312,SRR12318316 --fastqs . --transcriptome=/path/to/refdata-gex-mm10-2020-A --localmem 10 --localcores 8