空间转录组10X Visium HD上游-spaceranger

记录10x Visium HD 空转数据的定量过程,使用工具是10x官方发布的spaceranger软件
原理见官网,这里只记录操作层面的流程

数据准备:

fq文件

1749544342867.png

组织图像信息

组织切片的图像文件(TIFF格式),我这里用的是普通的明场HE图像,荧光图像也行
CytAssist捕获的图像(TIFF格式),看起来和上面的组织切片基本一样,但是多了一个“边框”,文件名多为CAVG开头

软件准备:spaceranger下载

wget -O spaceranger-3.1.3.tar.gz "https://cf.10xgenomics.com/releases/spatial-exp/spaceranger-3.1.3.tar.gz?Expires=1749583889&Key-Pair-Id=APKAI7S6A5RYOXBWRPDA&Signature=eNqaXiP1tuS1Qa0dYe8afLzrMVTWtsyaOIihhhNfA6jXaXx69-4g89IwiU55dC8qZfO9e~l27yU4IGAXetjO7KK~Auc42FeKT2sUJBs4HpyJct9KpnGTZISWISkmF7bP5M2VOpF1Wx065NYduFWvuozLQQoVvtg6BhlC53gqURgjKjUB59GbbFxiQl1kTa5vkjTBRaT6sDMpxRPba4B9QP7jkVh-m-xyVuBIprJwV69y5onAs89aGAnYsq3HaRtUHFPa2AYQ-oitB2OIDqLaXpvjF~aSV4JrGp5pzOHhH92HHAIWAWl6XLRvt31IYyW9LdQvHcSb7sUMAtEsC6QMsg__"
wget "https://cf.10xgenomics.com/supp/spatial-exp/refdata-gex-GRCh38-2020-A.tar.gz"
export PATH=~/biosoft/spaceranger-3.1.3:$PATH   

进入Software Overview - 10x Genomics网站,Space Ranger,下载合适的版本

参考基因组准备

人类hg38:

wget "https://cf.10xgenomics.com/supp/spatial-exp/refdata-gex-GRCh38-2020-A.tar.gz"

Download Space Ranger - 10x Genomics

probe-set准备

根据自己的测序选择,人类数据比较多的是这个:

wget "https://cf.10xgenomics.com/supp/spatial-exp/probeset/Visium_Human_Transcriptome_Probe_Set_v2.0_GRCh38-2020-A.csv"

Download Space Ranger - 10x Genomics

运行spaceranger

上述步骤准备好之后,可以运行spaceranger进行定量


1749546390428.png

slide和area分别如图,从CytAssist图像的文件名中可以获得

spaceranger count --id sample_id \  ##输出文件的名字
 --sample sample_id \ ##为fq文件"_S1"之前的字段
 --transcriptome /Database/hg38/refdata-gex-GRCh38-2020-A  \ ##上面下载好的ref
 --fastqs  fastq_folder \ ##fq文件所在的文件夹
 --slidefile H1-xxxxxx.vlf  \ ##见下方描述,为官网下载的vlf文件,在无法联网的时候需要下载该文件,能联网的时候不用指定
 --slide  H1-xxxxxx \ ##组织切片的标识符,多用于匹配空间Barcode数据
 --area A1 \  ####组织切片的区域标识符
 --probe-set  /Database/Visium_Human_Transcriptome_Probe_Set_v2.0_GRCh38-2020-A.csv \ ##probe-set文件
 --cytaimage  CAVGxxxxxxxxxxxxxxxxxxxxx.tif  \ ##CytAssist图像的路径
 --image  sample.tif \  ###组织切片的tif格式文件路径
 --create-bam true \ ##后续的高阶分析可能用到bam文件
 --localcores 16  ##线程数

我们用的是集群,有些节点无法联网,如果不指定--slidefile参数,只有--slide和--area会一直报错


1749545934265.png

--slidefile这里用到的文件需要提前下载,用slide号在10x官网下载,为vlf格式


1749545997777.png

完结

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容