暖场
2019年的Single cell genomic day于3月22日在Satija Lab举办,共八位研究者发表了相关研究的演讲。虽然会议的规格不是很高,但是不妨碍他是一场全球单细胞研究者关心的大会。当地时间上午九时Rahul Satija发表了第一篇演讲(PPT如本文所示),算是对这次大会的一个总的概括,他的题目是:Single-cell genomics: Recent advances and future directions。我将依据他的演讲梳理一下这次会议,以飨读者;
会议的开始Rahul Satija 简单介绍了Single cell genomic day的举办初衷和简要的历史,这次会议配备了LOGO文化衫:
在简单的寒暄之后,他给出自己认为2018年出现的重要的八个分析方法,每幅图是一种新的方法:
然后回顾了2017年度八个重要的分析工具:
空间分析(spatial analysis )
介绍了几种空间分析的方法,其中Single cell genomic day 2019|| Imaging the transcriptome Mapping the brain with MERFISH是一种单细胞成像技术。空间分析是表达矩阵无法描述的,所以需要新的技术。除了MERFISH,还提及了starmap: Immersive visualisation of single cell data using smartphone-enabled virtual reality、Pooled optical screens in human cells、Spatial Transcriptomics、Slide-seq: A Scalable Technology for Measuring Genome-Wide Expression at High Spatial Resolution。可以预见,在不久的将来单细胞空间分析会是一项十分普及的技术,空间分析本来就是人们研究单细胞最原始的动力--窥探单细胞水平上的生物学过程。而历史到了这个节点,工具日渐成熟,也给人们带来一线曙光。
这里的每一项技术主持人都做了简要的介绍,我这边把相关的链接给到大家,说实话,我目前还没有那个实力去介绍这些。
starmap: Immersive visualisation of single cell data using smartphone-enabled virtual reality
Pooled optical screens in human cells
Slide-seq: A Scalable Technology for Measuring Genome-Wide Expression at High Spatial Resolution
深度学习在单细胞研究中的应用
是高通量技术把生物学带到了大数据时代,数据越来越多,维度越来越大,数据到信息到知识的距离越来越远,巧合的是互联网的发展也对人类提出了大数据分析的需求。单细胞分析已经到了不缺数据的时代,旧的统计方法很多已经不再适用,于是人们开始把机器学习、深度学习里面的算法应用到单细胞的数据挖掘中去。其中,目前最为流行的降维和聚类非监督算法已经成为单细胞数据分析的标配。
一位与会者做了这方面的介绍Single cell genomic day 2019|| Introduction to Deep Learning methods for single-cell analysis.
大家Google一下 Deep Learning 我想一定会有大量的学习资料,我就不再介绍了。文章提出一种基于深度学习的单细胞分析开源工具scVI,大家有兴趣可以研究研究。
表观/染色体仿形技术(epigenetic/chromatin profiling technologies)
会议聚焦了ATAC技术的新发展:表观/染色体仿形技术(epigenetic/chromatin profiling technologies)。Grace Zheng做了详细的介绍:Single cell genomic day 2019||Overview of sci-RNA-seq
发育重建(Developmental Reconstruction)
单细胞水平的发育重建(分化轨迹、拟时分析)方面,会议介绍了这方面比较成熟的Monocle包以及一种比较新的轨迹构建软件URD,这些都是开源的,一共研究者探索使用。关于URD会上Harvard University 的Jeff Farrell 做了详细的介绍:Single cell genomic day 2019||Reconstruction of developmental trajectories during zebrafish embry...
内源性谱系追踪 (Endogeneous lineage tracing)
同时测量细胞谱系和细胞命运是生物医学的一个长期目标。在这里,我们描述EMBLEM,这是一种利用ATAC-seq数据中的内源性线粒体DNA变异来跟踪细胞谱系的策略。我们发现线粒体DNA的体细胞突变可以在单细胞分辨率下重建细胞谱系关系,具有较高的敏感性和特异性。具体地可以阅读Single-cell lineage tracing by endogenous mutations enriched in transposase accessible mitochondrial DNA
多样本整合分析(integrative single-cell data)
2019年1月Nature Reviews Genetics (2019) 发表了一篇文章Integrative single-cell analysis,标志着单细胞分析进入多样本(不同条件,不同器官,不同个体)整合分析的阶段。会上,Tim Stuart (NYGC/NYU )就这一主题做了演讲Single cell genomic day 2019||Integration and harmonization of single-cell data,并对比分析了几款分析软件;
以上是高度集成的开源的R包或者Python库,为多样本单细胞分析提供更多可能。
替代序列技术(alternative sequence technologies)
利用单细胞异构体rna测序(scor -seq)方法,能够在没有特异性抗体荧光激活细胞分选的情况下,测定来自非均匀体组织(小脑)的数千个单个细胞中的异构体表达。进而阐明了亚型在高级细胞类型中的应用,如神经元、星形胶质细胞和小胶质细胞,以及更精细的亚型,如浦肯野细胞和颗粒细胞,包括远距离剪接位点的组合模式,这对于单个分子需要长时间的读取。我们产生一个增强的基因组注释,揭示细胞类型的特异性表达。见Single-cell isoform RNA sequencing (ScISOr-Seq) across thousands of cells reveals isoforms of cerebellar cell types.
结语
分析软件和算法如雨后春笋一般涌现,不懂原理,我们该如何抉择,抑或自己开发?
2019年度的Single cell genomic day落下帷幕了,我们看到了单细胞研究像一个十七八岁的少年:茁壮、蓬勃、扩张、吞噬。高度集成的研究方法日新月异,表面上来看普通的研究者只要安装学习大牛们开发的软件就可以完成自己的分析了。但是随着算法的不断优化和复杂,其实对单细胞研究人员提出了更高的统计和算法的要求。
我们需要承认新工具的出现对这个行业是有利的、也是必须的。个别的工具多到一定程度就会有更大的平台来整合,把它们集成到一个更大的软件中去。届时,单细胞研究将由现在的星星之火,形成燎原之势。
我整理了八场演讲的PPT,祝大家学习愉快:
- Single cell genomic day 2019|| Introduction to Deep Learning methods for single-cell analysis
- Single cell genomic day 2019||Integration and harmonization of single-cell data
- Single cell genomic day 2019|| Single-cell genomics Recent advances and future directions
- Single cell genomic day 2019||Multi-modal single-cell analysis
- Single cell genomic day 2019|| Imaging the transcriptome Mapping the brain with MERFISH
- Single cell genomic day 2019||Reconstruction of developmental trajectories during zebrafish embryogenesis
- Single cell genomic day 2019||Dissecting complex systems with multidimensional data
- Single cell genomic day 2019||Overview of sci-RNA-seq
LIGER (Linked Inference of Genomic Experimental Relationships)
scVI