10x genomics RNAseq数据分析实战

10x数据类型:

10x数据类型

每个样本测出3个fastq,通过I1,R1,R2来区别,
下载安装cellranger,
下载所需要的reference,

(一)跑cellranger count

/home/XXX/software/biosoftware/cellranger-2.2.0/cellranger count \
--id=ID24 \
--fastqs=/path/data/20180810_10x/10x/   \
--sample=WBJPE18018647-1_HMVMKCCXY_L6_WBJPE18018647_20180729_P,WBJPE18018647-2_HMVMKCCXY_L6_WBJPE18018647_20180729_P,WBJPE18018647-3_HMVMKCCXY_L6_WBJPE18018647_20180729_P,WBJPE18018647-4_HMVMKCCXY_L6_WBJPE18018647_20180729_P,WBJPE18018648-1_HMVMKCCXY_L7_WBJPE18018648_20180729_P,WBJPE18018648-2_HMVMKCCXY_L7_WBJPE18018648_20180729_P,WBJPE18018648-3_HMVMKCCXY_L7_WBJPE18018648_20180729_P,WBJPE18018648-4_HMVMKCCXY_L7_WBJPE18018648_20180729_P  \
--transcriptome=/home/XXX/database/refdata-cellranger-GRCh38-1.2.0

8个样本,数据量约132G,耗时38小时,线程20个,内存128G。
最后得到的结果在outs目录下

Outputs:
- Run summary HTML:                      /path/data/20180810_10x/work/L006/outs/web_summary.html
- Run summary CSV:                       /path/data/20180810_10x/work/L006/outs/metrics_summary.csv
- BAM:                                   /path/data/20180810_10x/work/L006/outs/possorted_genome_bam.bam
- BAM index:                             /path/data/20180810_10x/work/L006/outs/possorted_genome_bam.bam.bai
- Filtered gene-barcode matrices MEX:    /path/data/20180810_10x/work/L006/outs/filtered_gene_bc_matrices
- Filtered gene-barcode matrices HDF5:   /path/data/20180810_10x/work/L006/outs/filtered_gene_bc_matrices_h5.h5
- Unfiltered gene-barcode matrices MEX:  /path/data/20180810_10x/work/L006/outs/raw_gene_bc_matrices
- Unfiltered gene-barcode matrices HDF5: /path/data/20180810_10x/work/L006/outs/raw_gene_bc_matrices_h5.h5
- Secondary analysis output CSV:         /path/data/20180810_10x/work/L006/outs/analysis
- Per-molecule read information:         /path/data/20180810_10x/work/L006/outs/molecule_info.h5
- Loupe Cell Browser file:               /path/data/20180810_10x/work/L006/outs/cloupe.cloupe

2018-08-29 03:45:03 [perform] Serializing pipestance performance data.
Waiting 6 seconds for UI to do final refresh.
Pipestance completed successfully!

(二)用dropEst软件跑10x 数据

1,创建目录及配置文件

mkdir -p 01_dropTag 02_alignment 03_dropEst
sh pipeline.sh \
/home/XXX/software/biosoftware/dropEst/build  \ # dropest软件路径
/path/work/02.dropEst/10x.test.xml \ # 配置文件
/path/work/02.dropEst/star \ # star的索引路径
/home/XXX/database/refdata-cellranger-GRCh38-1.2.0/genes/genes.gtf  # gtf文件路径

配置文件xml如下:

<config>
    <!-- droptag -->
    <TagsSearch>
        <protocol>10x</protocol>
        <BarcodesSearch>
            <barcode1_length>8</barcode1_length>
            <barcode2_length>16</barcode2_length>
            <umi_length>10</umi_length>
            <r1_rc_length>0</r1_rc_length>
        </BarcodesSearch>

        <Processing>
            <min_align_length>10</min_align_length>
            <reads_per_out_file>10000000</reads_per_out_file>
            <poly_a_tail>AAAAAAAA</poly_a_tail>
        </Processing>
    </TagsSearch>

    <!-- dropest -->
    <Estimation>
        <Merge>
            <barcodes_file>/home/XXX/software/biosoftware/dropEst/data/barcodes/10x_aug_2016_split</barcodes_file>
            <barcodes_type>const</barcodes_type>
            <min_merge_fraction>0.2</min_merge_fraction>
            <max_cb_merge_edit_distance>2</max_cb_merge_edit_distance>
            <max_umi_merge_edit_distance>1</max_umi_merge_edit_distance>
            <min_genes_after_merge>100</min_genes_after_merge>
            <min_genes_before_merge>20</min_genes_before_merge>
        </Merge>

        <PreciseMerge>
            <max_merge_prob>1e-5</max_merge_prob>
            <max_real_merge_prob>1e-7</max_real_merge_prob>
        </PreciseMerge>
    </Estimation>
</config>

这里的pipeline.sh如下:

$ cat pipeline.sh
if [ "$#" -ne 4 ]; then
    echo "usage: $0 dropest_directory config_file star_index_folder gtf_with_genes"
    echo "example: $0 ~/dropEst/build ~/dropEst/configs/indrop_v3.xml ~/star/mm10/index/ ~/star/mm10/genes.gtf"
    exit 1
fi

dropest_dir=$1
config_file=$2
star_index=$3
gtf_file=$4
cd 01_dropTag
$dropest_dir/droptag -c $config_file -r 0 -p 20 -S -s -n sample1 -l sample1 /path/work/02.dropEst/data/WBJPE18018647-1_HMVMKCCXY_L6_WBJPE18018647_20180729_P_S1_L006_I1_001.fastq.gz /path/work/02.dropEst/data/WBJPE18018647-1_HMVMKCCXY_L6_WBJPE18018647_20180729_P_S1_L006_R1_001.fastq.gz /path/work/02.dropEst/data/WBJPE18018647-1_HMVMKCCXY_L6_WBJPE18018647_20180729_P_S1_L006_R2_001.fastq.gz
$dropest_dir/droptag -c $config_file -r 0 -p 20 -S -s -n sample2 -l sample2 /path/work/02.dropEst/data/WBJPE18018647-2_HMVMKCCXY_L6_WBJPE18018647_20180729_P_S2_L006_I1_001.fastq.gz /path/work/02.dropEst/data/WBJPE18018647-2_HMVMKCCXY_L6_WBJPE18018647_20180729_P_S2_L006_R1_001.fastq.gz /path/work/02.dropEst/data/WBJPE18018647-2_HMVMKCCXY_L6_WBJPE18018647_20180729_P_S2_L006_R2_001.fastq.gz
$dropest_dir/droptag -c $config_file -r 0 -p 20 -S -s -n sample3 -l sample3 /path/work/02.dropEst/data/WBJPE18018647-3_HMVMKCCXY_L6_WBJPE18018647_20180729_P_S3_L006_I1_001.fastq.gz /path/work/02.dropEst/data/WBJPE18018647-3_HMVMKCCXY_L6_WBJPE18018647_20180729_P_S3_L006_R1_001.fastq.gz /path/work/02.dropEst/data/WBJPE18018647-3_HMVMKCCXY_L6_WBJPE18018647_20180729_P_S3_L006_R2_001.fastq.gz
$dropest_dir/droptag -c $config_file -r 0 -p 20 -S -s -n sample4 -l sample4 /path/work/02.dropEst/data/WBJPE18018647-4_HMVMKCCXY_L6_WBJPE18018647_20180729_P_S4_L006_I1_001.fastq.gz /path/work/02.dropEst/data/WBJPE18018647-4_HMVMKCCXY_L6_WBJPE18018647_20180729_P_S4_L006_R1_001.fastq.gz /path/work/02.dropEst/data/WBJPE18018647-4_HMVMKCCXY_L6_WBJPE18018647_20180729_P_S4_L006_R2_001.fastq.gz
$dropest_dir/droptag -c $config_file -r 0 -p 20 -S -s -n sample5 -l sample5 /path/work/02.dropEst/data/WBJPE18018648-1_HMVMKCCXY_L7_WBJPE18018648_20180729_P_S5_L007_I1_001.fastq.gz /path/work/02.dropEst/data/WBJPE18018648-1_HMVMKCCXY_L7_WBJPE18018648_20180729_P_S5_L007_R1_001.fastq.gz /path/work/02.dropEst/data/WBJPE18018648-1_HMVMKCCXY_L7_WBJPE18018648_20180729_P_S5_L007_R2_001.fastq.gz
$dropest_dir/droptag -c $config_file -r 0 -p 20 -S -s -n sample6 -l sample6 /path/work/02.dropEst/data/WBJPE18018648-2_HMVMKCCXY_L7_WBJPE18018648_20180729_P_S6_L007_I1_001.fastq.gz /path/work/02.dropEst/data/WBJPE18018648-2_HMVMKCCXY_L7_WBJPE18018648_20180729_P_S6_L007_R1_001.fastq.gz /path/work/02.dropEst/data/WBJPE18018648-2_HMVMKCCXY_L7_WBJPE18018648_20180729_P_S6_L007_R2_001.fastq.gz
$dropest_dir/droptag -c $config_file -r 0 -p 20 -S -s -n sample7 -l sample7 /path/work/02.dropEst/data/WBJPE18018648-3_HMVMKCCXY_L7_WBJPE18018648_20180729_P_S7_L007_I1_001.fastq.gz /path/work/02.dropEst/data/WBJPE18018648-3_HMVMKCCXY_L7_WBJPE18018648_20180729_P_S7_L007_R1_001.fastq.gz /path/work/02.dropEst/data/WBJPE18018648-3_HMVMKCCXY_L7_WBJPE18018648_20180729_P_S7_L007_R2_001.fastq.gz
$dropest_dir/droptag -c $config_file -r 0 -p 20 -S -s -n sample8 -l sample8 /path/work/02.dropEst/data/WBJPE18018648-4_HMVMKCCXY_L7_WBJPE18018648_20180729_P_S8_L007_I1_001.fastq.gz /path/work/02.dropEst/data/WBJPE18018648-4_HMVMKCCXY_L7_WBJPE18018648_20180729_P_S8_L007_R1_001.fastq.gz /path/work/02.dropEst/data/WBJPE18018648-4_HMVMKCCXY_L7_WBJPE18018648_20180729_P_S8_L007_R2_001.fastq.gz

cd ../02_alignment
STAR --runThreadN 20 --genomeDir $star_index --readFilesCommand zcat --outSAMtype BAM Unsorted --readFilesIn /path/work/02.dropEst/01_dropTag/sample1.fastq.gz.tagged.fastq.gz,/path/work/02.dropEst/01_dropTag/sample2.fastq.gz.tagged.fastq.gz,/path/work/02.dropEst/01_dropTag/sample3.fastq.gz.tagged.fastq.gz,/path/work/02.dropEst/01_dropTag/sample4.fastq.gz.tagged.fastq.gz,/path/work/02.dropEst/01_dropTag/sample5.fastq.gz.tagged.fastq.gz,/path/work/02.dropEst/01_dropTag/sample6.fastq.gz.tagged.fastq.gz,/path/work/02.dropEst/01_dropTag/sample7.fastq.gz.tagged.fastq.gz,/path/work/02.dropEst/01_dropTag/sample8.fastq.gz.tagged.fastq.gz

cd ../03_dropEst
# $dropest_dir/dropest -w -M -u -G 20 -g $gtf_file -c $config_file ../02_alignment/Aligned.out.bam
$dropest_dir/dropest -w -m -r "/path/work/02.dropEst/01_dropTag/sample8.params.gz /path/work/02.dropEst/01_dropTag/sample7.params.gz /path/work/02.dropEst/01_dropTag/sample6.params.gz /path/work/02.dropEst/01_dropTag/sample5.params.gz /path/work/02.dropEst/01_dropTag/sample4.params.gz /path/work/02.dropEst/01_dropTag/sample3.params.gz /path/work/02.dropEst/01_dropTag/sample2.params.gz /path/work/02.dropEst/01_dropTag/sample1.params.gz"  -g $gtf_file -c $config_file ../02_alignment/Aligned.out.bam

分步去跑第一步,droptag,然后将8个样本的结果合并起来,用于第二步的比对,再跑第三步的dropest。
第三步dropest报错:内存超了128G,因为我服务器的运行内存只有128G,转到天河超算中跑。

(三)用zUMIs软件跑10x数据

(四)比较,同一份数据用不同的软件得出的结果比较

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,509评论 6 504
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,806评论 3 394
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,875评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,441评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,488评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,365评论 1 302
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,190评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,062评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,500评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,706评论 3 335
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,834评论 1 347
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,559评论 5 345
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,167评论 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,779评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,912评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,958评论 2 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,779评论 2 354

推荐阅读更多精彩内容