单个液滴内含有,一个磁珠(特异标签) + 一个细胞,是理想的实验。
如果单个液滴内含有,一个磁珠(特异标签) + 两个或者多个细胞(即双胞,多胞),则会造成多个细胞被单一标签标记,如果液滴内所含各细胞状态不同,则会造成后续假性中间状态细胞数据的产生。在基本版本的液滴测序中,如果双胞、多胞出现的比例较高,是不好的实验。
可以通过基本的概率计算,与泊松分布,在不做真实实验的前提下,理论计算出细胞投入量、磁珠投入量、与双胞/多胞的发生概率。泊松分布的概率计算公式如下:
其中,lambda 为平均数,也等于方差。在基于液滴的单细胞测序应用场景中(胶体珠投入量 约等于 液滴生成量),lambda = 细胞投入量 / 胶体珠投入量。K 为单个液滴内出现的细胞数目。因此,通过调整lambda与K,可以在理论上算出特定设置下,单胞,双胞,多胞的发生概率。
例如,当细胞投入量为10万,胶体珠投入量为30万,lambda = 1/3。当K=0时,P0 = 0.7165313 (空胞的概率);当K=1时,P1= 0.2388438 (单胞的概率);则K>=2时,P = 1 - P0 - P1 = 0.0446249 (双胞或者多胞的概率,交叉污染率= 4.5%, 处于一个可以接受的范围)。因此这是一个较合理的液滴设置参数。
参考
https://jef.works/blog/2017/12/14/barcode-doublets/