CeleScope分析单细胞转录组数据

1. 文件配置(mapfile+run.sh)

1.1 配置mapfile

#rna_fastq_ID    rna_datapath    rna_sample_name
LC211013006X1    /fastqs/rna_dir    sample1
LC211013006X2    /fastqs/rna_dir    sample1
LC211013007X1    /fastqs/rna_dir    sample2
# 第一列 rna_fastq_ID:对应fastq文件的名称前缀
# 第二列 rna_datapath:对应fastq文件的路径
# 第三列 rna_sample_name:对应质控报告的名称
# example:这里的sample1对应两个文库数据(LC211013006X1+LC211013006X2),如此记录可以完成整合分析

fastq文件示例:

  • 生成name为 “sample1”的质控报告:LC211013006X1、LC211013006X2对应 “sample1” 的测序数据
  • 生成name为“sample2”的质控报告:LC211013007X1 对应 “sample2” 的测序数据


    fastq文件

1.2 编辑运行脚本run.sh

multi_rna \
--mapfile ./mapfile\
--genomeDir ./ensembl_99\ #参考基因组的路径
--outdir .\ #输出到当前文件夹
--thread 8 #配置线程数
--starMem 30\ #配置star所需内存
--mod shell\ #这里通过shell脚本的方式运行
--gzip #生成的clean_reads为 fq.gz 形式

2. 生成“命令文件”

(1)激活celescope的环境conda activate celescope
(2)运行run.sh sh run.sh
很快运行完成,主要生成一个shell文件夹,其中会有一个以sample1命名的shell脚本
sample1.sh的每行指令:对应每一步分析(质控报告的每一部分数据)

sample1.sh对应指控报告

3. 投递“命令文件”

sh sample1.sh
最终生成如下一系列数据和最终的html质控报告

分析结果

postscripts:github详细的指导链接点击这里

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容