SPADE算法总共分为四步:
1. 密度依赖的下样(Density-dependent down-sampling),使细胞的数据点密度云处于相同的密度中。
2. 对划分的细胞数据点进行合并聚类(agglomerative clustering),成为所有的细胞种类。(fig2.iii)
根据19种marker(ER,PR,CD68,CD20,c-MYC,HER2,pAMPK,H3,pERK,pBad,CD44,β-cateni,CAH IX的表达量)将降采样的细胞事件(也就是采样的单细胞)聚类,聚成表型相似的细胞团块。
3. 构建最小连接树(minium spanning tree),连接所有的细胞种类(也就是连接上面聚好的细胞团)。(fig2.iv)
在表型上相似的细胞团通过边缘连接,以绘制最小的生成树。
4. 上样(up-sampling),将所有的细胞绘制在生成的树状结构中。(fig2.v)
注意:每个节点的颜色与细胞marker的中位数密度值相对应。
- 接下来执行上采样步骤,将初始数据集中的每个单元事件分配给最具代表性的聚集体。
- 最后,将最小生成树投影到二维区域,并用给定测量参数的中值强度水平对表示细胞团块的树的圆圈进行着色,从而使整个细胞层次中的标记表达可视化。对于代表细胞种群的SPADE树,节点的大小以总百分比表示(有多少比例的细胞被分到该簇群,例如,来自给定图像的细胞数量落入细胞簇)。
eg.使用的属性值为:0/5/7/15 /最大值,节点大小:60/120/150/200/200。