Introduction:
血球计数。如果血球细胞数量异常,可能说明你患有疾病。人工计数是通过显微镜观察血细胞切片,然后数数。自动计数要面对的一个问题是:分割或者说如果处理clustered cells 和 粘连细胞。clustered cells 和其相邻的细胞接触到一起,导致只有一小部分不相连的细胞可以看得清楚。两个相邻的细胞,他们之间的对比度是很小的。因此想要将粘连细胞分离开比分离细胞和背景难得多。(在二值图里,背景是黑色的,细胞是白色的)
Discuss Methods
A、 Edge Detection
Canny or Sobel 算子的边缘检测都是利用图像intensity(亮度) 梯度强度来检测物体的边缘。但是在两个粘连细胞里,他们之间的对比度很小,所以很难分别画出他们内部的轮廓。
B、 Hough Transform (不是很懂)
霍夫变换是用来检测一些形状。通常,霍夫变换需要边缘检测作为前处理。然后霍夫变换estimates the parameters of the shape from its edge,然后在参数空间进行voting。他可以用来检测部分粘连的圆形细胞。对于图片要求比较高。
C、 Model Based Contour Tracing
利用细胞形状的先验知识来促进轮廓描绘。它使用一个二阶多项式模型来自动检测图片。但是这个方法很垃圾基本只能检测独立的细胞。下面是原话。
this method can trace the contours of fully visible or minimally occluded cells only
D、 Morphological Image Processing
用一个预先定义好的(也是根据先验知识确定的)几何形状 (structuring elements),来进行形态学操作。一般是用disk元素。这个方法的缺点是当粘连细胞很严重时,腐蚀就不是很准确了。
E、 Template-Based Matching
利用一个模板图片在图片里去搜索想要的目标。在识别相似的目标时,模板会与图片的不同区域相匹配。通常我们是使用模板和图片之间的互相关cross-correlation来进行匹配的。因为cross-correlation具有抗噪性,所以它的鲁棒性还可以。另一方面,模板匹配在处理object occlusion时不是那么好,因此对于高聚类的细胞效果不好。
F、 Distance Transform
一张二值图片的距离变换标记了每个目标像素到离它最近的背景像素的距离。因为目标中心centroid是距离背景像素最远的,因此距离变换被用来可以检测细胞中心点。为了分割二值图像中的overlapping目标,距离变换和分水岭变换通常结合起来去分割overlapping目标。首先,计算出二值图像的距离变换。接着,距离变化图distance map 被complemented so that 细胞中心点就对应了局部最小值。最后,分水岭变换被用到complemented distance map上,把细胞看作disjoint集水盆地。但是,分水岭算法会产生过分割,因为图片里有许多局部最小值,就会产生许多的盆地。
First, the distance transform of the binary thresholded microscopy image is computed. Next, this distance map is complemented so that the cell centroids now correspond to the local minima. Finally, the watershed transform is applied to the complemented distance map in order to identify the cells as disjoint catchment basins. However, the watershed method produces a severe oversegmentation of the image, i.e., many small catchment basins are produced due to many local minima in the input image.
The Proposed Method : Distance Mapping
在距离变换不被细胞的overlapping和occlusion影响的情况下,基于距离变换的方法对clustered cells的分割、计数效果不错。然而, 当噪声存在或者distance map里有局部不规律时,距离变换会造成过分割,从而导致很多False positive。这种过分割在面对有噪声的high degree of cell overlapping的显微图像时,显得更加明显。
我们提出了一种Distance Mapping方法,把基于模式匹配的模板用到distance transform map上,来最小化过分割。这种模板匹配有助于检测细胞中心点,并且抵消了distance map中假的local maxima作用。这些local maxima造成了过分割和计数中的False positive值。因此,我们的模板匹配有助于减弱过分割现象,(由于定冠词一直是the,我也分不清楚到底是哪个模板匹配)。具体步骤见下。
A、 Steps of Counting
1)Pre-Processing:
首先,原始original图片Io用Contrast-Limited Adaptive Histogram Equal(CLAHE)处理从而得到增强enhanced图片Ie。CLAHE增强了图片的对比度,修正了光照的不均匀。
2)Global Threshold:
接下来,把细胞和背景分割开来。用Otsu阈值分割,得到二值图像B。
3)Distance Transform:
然后,计算二值图像的distance transform。这一步把二值图像B变成了a distance map D,D代表了每个cell pixel距离它最近的背景像素的distance。
4)Template Generation:
为了运用模板匹配,模板图片T是由一个圆盘的距离变化产生的。圆盘的半径是根据细胞的平均size来选择的。
5)Template Matching:
模板图片T和distance transform map D匹配来识别细胞的中心点。 模板匹配 is performed by T和D之间的normalized cross-correlation。
S代表了相似矩阵,矩阵里的值都是[0,1]。0代表了毫不相似,1代表了完美匹配。Trow 和 Tcol 代表了模板图片的行数与列数,Ed 和 Et 代表了 the energy of the distance map 和 the energy of the template image。为了检测边界上的partial cells,我们使用symmetric border handling during the cross-correlation computation。
6)Watershed Transform:
最后,相似矩阵S is complemented 并且所有的背景像素 are set to -Inf。然后把分水岭变换用到这个 complemented 相似矩阵-S上。(??)这样就把相似矩阵S分成了separate disjoint regions L。每个区域都被标记和计数,这样就能得到细胞数目。
B、 The Algorithm
distance mapping 算法见table I。
结果
A、 Cell-Background Separation
因为细胞和背景之间的对比度很高,所以Otsu阈值分割方法可以很准确地分割背景和目标。但是不能分开clustered cells。
B、 Cell Counting
下面是distance mapping 的示意图。
Note:high (60%) overlap probability
然后是不同方法的对比,红色部分是false positive值。
特别是distance transform 和 distance mapping。