单细胞转录组数据发oncotarget
文章发表于:Oncotarget. 2016; 7:66069-66076. https://doi.org/10.18632/oncotarget.11803 是深圳大学及其附属罗湖医院团队做的,在BGI测序是。题目是:Single-cell analyses of transcriptional heterogeneity in squamous cell carcinoma of urinary bladder 这篇文章就一幅图!!!而且是对一个病人拿的
癌症背景知识
很明显,关注的癌症是: squamous cell carcinoma of the bladder (SCCB) ,是膀胱癌症的一种,但是只占10%左右,不过比起占比非常高的urothelial carcinoma (UC)来说,更容易复发,更恶性!
单细胞转录组
不过该文章采用的单细胞转录组方法比较不常见,是 single-cell tagged reverse transcription (STRT) ,使用 Fluorescence Activated Cell Sorting (FACS) 挑选细胞,拿到了 75 tumor cells, 18 normal cells and 3 negative control ,平均每个细胞测序数据量是0.38M ,平均成功比对率是64.87%,具体统计信息可以查看Supplementary Table S1. 唯一的过滤标准是表达基因数量要超过3000,这样剩下 67 tumor cells and 7 normal cells。
使用的是HiSeq2000测序仪,Single-end reads of 50bp were generated along with 8-bp index reads corresponding to the cell-specific barcodes.
数据处理使用的是 Tophat 2.0.12 ,NCBI 37.1 assembly, Reads Per Million (RPM) , 很简单,比较奇怪的是基因表达定量他们居然用自己的perl脚本,我感觉很诡异,现成的featureCounts和HTseq居然不用。
差异分析
很明显,作者把差异分析当做了重头戏,而且完全是把单细胞转录组测序数据用传统的bulk转录组分析方法来处理的,比如使用NOISeq包(参数是; “q = 0.999, graphic = “MD”)来找差异表达基因。统计学显著的上调下调基因就去做GO/KEGG等数据库富集分析,再讨论一下富集分析结果在膀胱癌的生物学意义即可。
高级转录组数据分析
仍然是传统的bulk转录组分析方法,这里用了Weighted Gene Co-expression Network Analysis (WGCNA),挑选5530高表达变异的基因,得到48个模块,然后集中分析前5个比较大的基因模块,同样也是去做GO/KEGG等数据库富集分析,再讨论一下富集分析结果在膀胱癌的生物学意义即可。加多了一个分析,就是在这些模块里面找hub gene,讨论一下这些在膀胱癌的生物学意义即可。 至于WGCNA如何做,看我在菜鸟团博客写的教程即可。
单细胞水平的肿瘤异质性
既然是一个病人的67个肿瘤细胞的单细胞表达矩阵,那么没办法很清晰的分群也很正常,这些细胞的相关系数差异很大 r ~ 0.15 to 0.89,说明了肿瘤异质性。然后仅仅是针对那些高表达量基因 (RPM > 100)来根据coefficient of variation (CV)值来挑选the most 100 variably and most 100 stably 基因集,理所当然的,变化剧烈的那些基因是癌症相关的,表达量稳定的那些基因是housekeeping genes。
意义
The fresh tissues (cancer and normal control specimens from one patient) were minced (5-10mm in maximum dimension) during surgery, and kept in cryopreservation medium (10% DMSO+90% DMEM medium with 30% FBS) under -80°C.
病人其实已经去世了!
The patient died six months after the operation because of intestinal metastasis.
Upregulation of CCND1 was uncovered in various cancers, indicating its potential effects on tumorigenesis process, providing a therapeutic target of this patient.
数据可以重新下载并且分析
数据都在NCBI的SRA数据库:SRP078083 ,查看我在生信技能树的教程就很容易理解: https://vip.biotrainee.com/d/334-sra
很容易下载样本列表及原始数据,然后自己重新分析:https://www.ncbi.nlm.nih.gov/Traces/study/?acc=SRP078083
(文章转自jimmy的2018年阅读文献笔记)
生信基础知识大全系列:生信基础知识100讲
史上最强的生信自学环境准备课来啦!! 7次改版,11节课程,14K的讲稿,30个夜晚打磨,100页PPT的课程。
如果需要组装自己的服务器;代办生物信息学服务器
如果需要帮忙下载海外数据(GEO/TCGA/GTEx等等),点我?
如果需要线下辅导及培训,看招学徒
如果需要个人电脑:个人计算机推荐
如果需要置办生物信息学书籍,看:生信人必备书单
如果需要实习岗位:实习职位发布
如果需要售后:点我
如果需要入门资料大全:点我