单细胞学习2:10xgenomics从头开始分析

[参考链接](https://www.jianshu.com/p/705a348e8623
单细胞实战1,2,3,4,5 https://my.oschina.net/u/4503882/blog/4438601

1.下载数据
使用prefetch或者ascp都可以。
EBI数据库地址
获取下载命令

ascp -QT -l 300m -P33001 -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh era-fasp@fasp.sra.ebi.ac.uk:vol1/srr/SRR772/002/SRR7722942 ./
ascp -QT -l 300m -P33001 -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh era-fasp@fasp.sra.ebi.ac.uk:vol1/srr/SRR772/001/SRR7722941 ./
ascp -QT -l 300m -P33001 -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh era-fasp@fasp.sra.ebi.ac.uk:vol1/srr/SRR772/000/SRR7722940 ./
ascp -QT -l 300m -P33001 -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh era-fasp@fasp.sra.ebi.ac.uk:vol1/srr/SRR772/009/SRR7722939 ./
ascp -QT -l 300m -P33001 -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh era-fasp@fasp.sra.ebi.ac.uk:vol1/srr/SRR772/008/SRR7722938 ./
ascp -QT -l 300m -P33001 -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh era-fasp@fasp.sra.ebi.ac.uk:vol1/srr/SRR772/007/SRR7722937 ./

我们服务器有时候,会报错,查询解决方案说是33001端口没开,但是过一会儿再试,又能正常下载。

cat >SRR_Acc_List-2586-4.txt
SRR7722937
SRR7722938
SRR7722939
SRR7722940
SRR7722941
SRR7722942

2.安装软件cellranger 4.0版(截止2020.8.11)
下载地址https://support.10xgenomics.com/single-cell-gene-expression/software/downloads/latest 自己注册后,会给出下载地址
下载cellranger软件

wget -O cellranger-4.0.0.tar.gz "https://cf.10xgenomics.com/releases/cell-exp/cellranger-4.0.0.tar.gz?Expires=1597153912&Policy=eyJTdGF0ZW1lbnQiOlt7IlJlc291cmNlIjoiaHR0cHM6Ly9jZi4xMHhnZW5vbWljcy5jb20vcmVsZWFzZXMvY2VsbC1leHAvY2VsbHJhbmdlci00LjAuMC50YXIuZ3oiLCJDb25kaXRpb24iOnsiRGF0ZUxlc3NUaGFuIjp7IkFXUzpFcG9jaFRpbWUiOjE1OTcxNTM5MTJ9fX1dfQ__&Signature=Xx0erSX~dD-bjM4iSNM-PbDrdP2Q~QPNw0qEnyB~hff7U243dKjoeWyukXoHpddkqYDdQ0-HHMOITdPA4CmNXVbGXlMGsnY-LSBySee7mgy~MhXEGBiwDOhTLhoxOgyviZfyW-eMYuutVW6Hy-I3tQjqD1bAENfbVNekD25RkNgkTEsOwkhZzLU1hGRaRYD0kMD10~KCUN7-u0OO9WdKsEw7tzPCvb7Hz85O08ENNabAvnyPLw4ZskHNMmP-ciFTi7IItTqLFIQw8D~HAN5GDsTv14Rd2LfOQnS6OwLWffu-eew9m1FzH7zRzjWgb1AFFwDuXx5MHI~knkSYGYCpsQ__&Key-Pair-Id=APKAI7S6A5RYOXBWRPDA"

下载配套的人类基因组11G

wget -c https://cf.10xgenomics.com/supp/cell-exp/refdata-gex-GRCh38-2020-A.tar.gz

下载小鼠基因组

wget -c https://cf.10xgenomics.com/supp/cell-exp/refdata-gex-mm10-2020-A.tar.gz

cellanger安装方法:

tar -zxvf cellranger-4.0.0.tar.gz
cd cellranger-4.0.0
pwd #获取目录
echo `PATH=上述目录\bin:$PATH` >>~/.bash_profile
source export
cellranger #测试命令即可运行
  1. 数据处理
    3.1 SRR数据解压
##1解压缩文件
cat SRR_Acc_List-2586-4.txt|while read id
do
    fastq-dump --gzip --split-files ./0.raw/$id
done

#2文件批量重命名
# 将原来的_1.fastq.gz改成_S1_L001_I1_001.fastq.gz
# 依次类推,将原来_2的改成R1,将_3改成R2。批量处理,就利用下载SRA的SRR ID好了。
cat SRR_Acc_List-2586-4.txt | while read i 
do
 mv ${i}_1*.gz ${i}_S1_L001_I1_001.fastq.gz;
 mv ${i}_2*.gz ${i}_S1_L001_R1_001.fastq.gz;
 mv ${i}_3*.gz ${i}_S1_L001_R2_001.fastq.gz;
done
一定要按照上面的要求重命名,不然后面cellranger分析的时候,不会自动识别文件名。

选做分析QC

#质控QC
###config里面存的是重命名后的fastq.gz文件的文件名。
cat config | while read id
do
        fastqc --outdir ./2.qc/ --threads 24 ./1.fastq/${id} >> ./2.qc/${id}_fastqc.log 2>&1
done
multiqc  ./2.qc/*zip  -o ./2.qc/multiqc

multiqc目录有最终的html文件。可以看到各组样本的数据质量。
这批数据,个别有问题。


3.cellranger分为4个pipeline
3.1 cellranger mkfastq
将原始碱基(BCL)文件整合为fastq格式,实质是封装的Illumina bcl2fastq
3.2 cellranger count
将获取的fastq文件比对、过滤、计数,这是一个自动化过程
3.3 cellranger aggr
将多个测序结果归一化到相同的测序深度,重新计算feature-barcode matrices
3.4 cellranger reanalyze

先运行测试文件,测试cellranger能否正常运行。

cellranger testrun --id=testruncellranger id指定运行后保存的目录。
分配24个cpu,需要647s.差不多10分钟多。
查看标准输出,标准输出文件最后出现如下,代表测试通过。

Pipestance completed successfully!

2020-08-11 17:19:13 Shutting down.
下载好参考基因组后,解压缩。

tar -zxvf refdata-gex-GRCh38-2020-A.tar.gz
如果想自己构建参考基因组,是整个流程的难点。
3.2 使用cellranger count开始分析

####参数说明:
#id指定输出文件存放目录名称
#转录组指定与CellRanger兼容的参考基因组
#fastqs指定mkfastq或自定义的fastq文件放置位置
#sample要和fastq文件的初始中的样本保持一致,作为软件识别的标志
#except-cells指定复现的细胞数量,这个要和实验设计结合起来
#nosecondary仅获得表达矩阵,不进行后续的降维,聚类和可视化分析(因为后续会自行用R包去做)

##输如参数时,一定不要有多余的空格,不然会报错。
cat SRR_Acc_List-2586-4.txt|while read id
do
 cellranger count --id=$id --transcriptome=~/soft/cellranger/refdata-gex-GRCh38-2020-A --fastqs=1.fastq --sample=$id --expect-cells=5000 --nosecondary
done
这里没有指定使用的内存和cpu数量,大服务器,内存和cpu足够大,所以就没指定,如果内存小于64G,请指定内存。

3.3 合并上面的分析

3.3.1构建Aggregation CSV

AGG123_libraries.csv

library_id,molecule_h5
LV123,/opt/runs/LV123/outs/molecule_info.h5
LB456,/opt/runs/LB456/outs/molecule_info.h5
LP789,/opt/runs/LP789/outs/molecule_info.h5

其中molecule_h5:文件molecule_info.h5 file的路径
echo library_id,molecule_h5 >AGG123_libraries.csv
cat SRR_Acc_List-2586-4.txt|while read id
do
echo $id,$id/outs/molecule_info.h5 >>AGG123_libraries.csv
done

3.3.2 合并

cellranger aggr --id=AGG123 --csv=AGG123_libraries.csv --normalize=mapped

结果输出到AGG123这个目录中

在AGG123的输出结果中,


newplot (1).png
newplot.png

其中有1个红色的alert,Fraction of Reads Kept (SRR7722940) 16.0%的深度不足50%。

4. 使用Seurat分析(其实cellranger也可以自动分析)

5.难点解决,基因组的构建

论文原文是使用人类基因组和MCPyV病毒基因组一起分析的。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,711评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,079评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,194评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,089评论 1 286
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,197评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,306评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,338评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,119评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,541评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,846评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,014评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,694评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,322评论 3 318
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,026评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,257评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,863评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,895评论 2 351