开篇-单细胞测序分析
回想起来自己从事生物相关的研究已经大概15年了,从研究生进入实验室也有10年时间,陆续从硕士,博士到博后,研究地点也从化学学院,到药学院再到医院科室。自己做的研究是“干-湿”实验结合的,发表的成果也是各自一半,但是综合起来还是生物信息分析的文章发表的影响因子高一些。到现在由于工作场所频繁发生变化,反而没有稳定的场所做实验,所以愈发的在生物信息方面下较多的功夫。因此我对这十几年来的生信研究进行总结,希望帮助新手克服生物信息陡峭的学习曲线,当然我自己也不是科班出身的,也希望与你一起交流学习。所有的内容均是以自己的实验数据(会明确下载地址给读者)操作来进行,避免某些在demo运行很好却在自己的环境中出现bug的情况。最后一点,现在通讯太发达了,欢迎大家与我直接交流共同进步。
单细胞测序介绍
从单细胞层面分析生物学现象一直是生物医学研究的常见做法。包括我们做分子生物学实验培养细胞也是在单细胞群体的基础上进行实验。近年来,最火爆的单细胞高通量的技术莫过于单细胞测序了,那么常见的单细胞研究方法有哪些呢?
流式细胞技术
流式细胞技术是最常见的实验层面的单细胞研究技术。主要利用抗原抗体特异性结合的原理,将抗体偶联染料可被流式细胞仪器识别,最终将蛋白质表达量转为数据,供我们分析。
没有完美的技术,只有不断的探索新的突破。流式细胞技术虽然方便也很快用于临床检测,但是对于科学研究而言却能力不足。尤其是受到了荧光染料种类单次检测的限制,于是需要新的技术和设备。
Cytof质谱流式细胞技术
该技术与传统的流式细胞技术原理相同,最大的不同在于抗体偶联的染料是金属元素,极大的改善光谱,改善流式细胞痛点荧光遗漏问题,可以单次检测更多的蛋白。例如,基于该技术骨髓内免疫细胞得到了高分辨的分群,这在之前的流式细胞技术中是达不到或者是非常复杂的实验设计的。
在蛋白检测的过程中,也有一类特殊的需求,就是单个细胞的拍照,因为流式细胞加入了荧光,因而很容易让人联想到两者的应用,因此也出现了图像流式的存在,这类的应用主要在循环肿瘤细胞的鉴定中。由于科研应用较少所以在这里不做重要介绍。
以上质谱流式细胞技术与图像流式细胞技术均可以解决相应的问题,但是在检测指标上并没有带来太大的进步。基于RNA seq转录测序火爆的情况,开发了单细胞测序技术。
单细胞测序技术
根据取样的不同,单细胞测序技术分为单细胞转录组测序技术和单细胞空间转录组测序技术,当然还有更加的细分,比如smart seq2,ATAC等,我们这里只介绍符合10x规范的单细胞数据分析,这应该也是一个趋势。
单细胞转录组测序
单细胞转录组测序顾名思义就是基于单个细胞的转录水平的测序,利用的原理就是经典的油包水检测原理,将细胞打散然后进行耽搁细胞的建库分析。这样的情况下每一个细胞就相当于一个样本来进行测序和分析,但是更准确来说一个细胞更像是一个细胞系,所以这些细胞系有可能相同又有可能有微小变化。
单细胞空间转录组测序
单细胞空间转录组测序核心技术与单细胞准路测序一致,只是在取样上需要根据组织结构进行,因而涵盖了更多的信息,当然需要的人力和资金自然更多。
注:我也是仅仅根据我个人的理解,详细的信息你可以搜索官方介绍和各大搜索引擎。
单细胞数据分析
实际上目前单细胞测序基本都是商业公司上门处理和检测的,并且一般会给出常规分析报告。所以后续的重中之重就是放在测序数据的分析上。我会在后面分步骤的一个个来说明。主要如下:
- 单细胞测序环境配置(测试环境,你可以加VX:cll7658获取,已经预装所有程序)
- 单细胞数据获取(自测数据以及五花八门的数据库下载数据的整理和清洗)
- R/Seurat包对数据处理(由于网络上说Seurat教程的pbmc数据太多了,我介绍基于肿瘤样本)
- 复杂细胞的定义marker
- cellphone细胞通讯分析
- monocal3细胞轨迹分析
- senice重要转录因子的筛选
- 在TCGA数据库中验证单细胞测序的重要结论