使用
cellranger提供了五个分析模块用于分析单细胞转录组相关产品
1.cellranger mkfastq:
调用bcl2fastq软件将illumina测序仪得到的BCL( raw base call )格式文件拆分为fastq文件。工作流如图所示:
一次上机测序两个不同的文库,执行一次cellranger mkfastq
一次上机测序两个不同的文库,<font color=red>分别</font>执行一次cellranger mkfastq
。
使用方法
$ cellranger mkfastq --id=tiny-bcl \
--run=/path/to/tiny_bcl \
--csv=cellranger-tiny-bcl-simple-1.2.0.csv
参数说明
Parameter | Function |
---|---|
--run |
必选;BCL文件所在目录 |
--id |
可选;mkfastq将会生成相应目录,不接受绝对路径 |
--samplesheet --sample-sheet
|
可选. 样本名字、index等信息; [Data] Lane,Sample_ID,index,index2 1,test_sample,TGGTCCCAAG,ACGCCAGAGG |
--csv --simple-csv
|
可选,类似上面参数 |
... | ... |
--output-dir |
指定FASTQ输出目录 |
--localcores |
运行的最大CPU数 |
--localmem |
运行的最大内存数 |
2.cellranger count:
分析cellranger mkfastq
或者其他方式得到fastq格式的文件。这个模块包括比对、过滤、barcoding计数以及UMI计数。可以生成barcode-UMI信息,进行聚类及基因表达分析。不过我们通常用到表达信息,使用其他方式进行聚类及其他单细胞相关分析。
在分析count
之前需要先下载参考基因组:
$ wget "https://cf.10xgenomics.com/supp/cell-exp/refdata-gex-GRCh38-2020-A.tar.gz" #人
$ wget "https://cf.10xgenomics.com/supp/cell-exp/refdata-gex-mm10-2020-A.tar.gz" #鼠
或者参照教程使用cellranger mkref
自己构建参考基因组
$ cellranger count --id=sample345 \
--transcriptome=/opt/refdata-gex-GRCh38-2020-A \
--fastqs=/home/jdoe/runs/HAWT7ADXX/outs/fastq_path \
--sample=mysample \
--localcores=8 \
--localmem=64
输出结果包括以下信息:
Outputs:
- Run summary HTML: /outdir/outs/web_summary.html
- Run summary CSV: /opt/sample345/outs/metrics_summary.csv
- BAM: /opt/sample345/outs/possorted_genome_bam.bam
- BAM index: /opt/sample345/outs/possorted_genome_bam.bam.bai
- Filtered feature-barcode matrices MEX: /opt/sample345/outs/filtered_feature_bc_matrix
- Filtered feature-barcode matrices HDF5: /opt/sample345/outs/filtered_feature_bc_matrix.h5
......
count
分析完成之后可以使用浏览器打开web_summary.html文件查看报告,网页版报告主要包括以下几个方面的内容:
Summary包括鉴定到的细胞数、reads数中值、基因数中值、比对率、饱和度等基本信息
Gene Expression View包括T-SNE降维结果、初步的聚类及每个cluster的高表达基因。
<font color="red">建议结果部分我们重点关注Summary,来判断文库构建及测序是否合格。</font>
3.cellranger multi:
用于分析细胞混合或者固定RNA数据,和count
类似,multi
也包括比对、过滤、barcoding计数以及UMI计数。可以生成barcode-UMI信息,进行聚类及基因表达分析等。