记录10x Visium HD 空转数据的定量过程,使用工具是10x官方发布的spaceranger软件
原理见官网,这里只记录操作层面的流程
数据准备:
fq文件
1749544342867.png
组织图像信息
组织切片的图像文件(TIFF格式),我这里用的是普通的明场HE图像,荧光图像也行
CytAssist捕获的图像(TIFF格式),看起来和上面的组织切片基本一样,但是多了一个“边框”,文件名多为CAVG开头
软件准备:spaceranger下载
wget -O spaceranger-3.1.3.tar.gz "https://cf.10xgenomics.com/releases/spatial-exp/spaceranger-3.1.3.tar.gz?Expires=1749583889&Key-Pair-Id=APKAI7S6A5RYOXBWRPDA&Signature=eNqaXiP1tuS1Qa0dYe8afLzrMVTWtsyaOIihhhNfA6jXaXx69-4g89IwiU55dC8qZfO9e~l27yU4IGAXetjO7KK~Auc42FeKT2sUJBs4HpyJct9KpnGTZISWISkmF7bP5M2VOpF1Wx065NYduFWvuozLQQoVvtg6BhlC53gqURgjKjUB59GbbFxiQl1kTa5vkjTBRaT6sDMpxRPba4B9QP7jkVh-m-xyVuBIprJwV69y5onAs89aGAnYsq3HaRtUHFPa2AYQ-oitB2OIDqLaXpvjF~aSV4JrGp5pzOHhH92HHAIWAWl6XLRvt31IYyW9LdQvHcSb7sUMAtEsC6QMsg__"
wget "https://cf.10xgenomics.com/supp/spatial-exp/refdata-gex-GRCh38-2020-A.tar.gz"
export PATH=~/biosoft/spaceranger-3.1.3:$PATH
进入Software Overview - 10x Genomics网站,Space Ranger,下载合适的版本
参考基因组准备
人类hg38:
wget "https://cf.10xgenomics.com/supp/spatial-exp/refdata-gex-GRCh38-2020-A.tar.gz"
Download Space Ranger - 10x Genomics
probe-set准备
根据自己的测序选择,人类数据比较多的是这个:
wget "https://cf.10xgenomics.com/supp/spatial-exp/probeset/Visium_Human_Transcriptome_Probe_Set_v2.0_GRCh38-2020-A.csv"
Download Space Ranger - 10x Genomics
运行spaceranger
上述步骤准备好之后,可以运行spaceranger进行定量
1749546390428.png
slide和area分别如图,从CytAssist图像的文件名中可以获得
spaceranger count --id sample_id \ ##输出文件的名字
--sample sample_id \ ##为fq文件"_S1"之前的字段
--transcriptome /Database/hg38/refdata-gex-GRCh38-2020-A \ ##上面下载好的ref
--fastqs fastq_folder \ ##fq文件所在的文件夹
--slidefile H1-xxxxxx.vlf \ ##见下方描述,为官网下载的vlf文件,在无法联网的时候需要下载该文件,能联网的时候不用指定
--slide H1-xxxxxx \ ##组织切片的标识符,多用于匹配空间Barcode数据
--area A1 \ ####组织切片的区域标识符
--probe-set /Database/Visium_Human_Transcriptome_Probe_Set_v2.0_GRCh38-2020-A.csv \ ##probe-set文件
--cytaimage CAVGxxxxxxxxxxxxxxxxxxxxx.tif \ ##CytAssist图像的路径
--image sample.tif \ ###组织切片的tif格式文件路径
--create-bam true \ ##后续的高阶分析可能用到bam文件
--localcores 16 ##线程数
我们用的是集群,有些节点无法联网,如果不指定--slidefile参数,只有--slide和--area会一直报错
1749545934265.png
--slidefile这里用到的文件需要提前下载,用slide号在10x官网下载,为vlf格式
1749545997777.png
完结