常见特征参数:区域面积、 灰度密度、 边界长度 、 长轴、 短轴、 中心矩、 形状参数 、 圆形性及偏心率。
其中有的是基于目标内部区域的特征 , 也有的是基于目标边界的特征 ,下面对各个特征逐一进行描述。
1. 区域面积:在用阈值化方法得到血细胞的二值分割图像以后 ,再通过标记的方法把单个血细胞提取出来 ,一种简单而又精确的求面积方法就是对提取出来的目标象素进行计数,具体方法 : 将目标区域 (包括边界 ) 中所有象素的值置为 1, 背景区域的象素值置为 0;扫描整个区域 , 可以很容易求出目标区域面积。
2. 灰度密度:目标的灰度密度是对目标内部亮度进行描述的特征参数,它可以通过已分割的二值图像为模板 ,从原始图像中得到 。常用的区域灰度特征有目标灰度的最大值、 最小值、 中值 、 平均值、 方差以及高阶矩等统计量。
3. 边界长度:目标边界的长度是指边界所包围区域的轮廓的周长。我们考虑区域由内部点加边界点构成的情况,边界可以由边界点按四邻域或八邻域连接组成,对于某一区域R来说,它的边界点P应该同时满足两个条件: (1) P属于R, (2)P的邻域中有像素不属于 R。
4. 长轴:根据定义长轴长度是目标边界上任意两点之间距离的最大值 , 计算长轴需要对目标边界进行多次遍历 , 任取目标边界上两点 p、 q, 对于 p、 q两点坐标的每一种取值计算它们之间的距离 z, z的最大值就是长轴的长度。
5. 短轴:确定了长轴端点,计算长轴两侧边界点中离轴最远的两个点,到长轴的距离和就是短轴长度。
6. 形状参数:目标的形状参数是根据区域的周长和区域的面积计算出来的。公式为 : F =B 2 /4πA,其中 B 为目
标的周长, A 为目标的面积。由该式可见 , 一个连续区域为圆形时其形状参数值为 1, 当区域为其它形状时其形状参数值大于 1。但仅靠形状参数 F并不能把不同形状的区域分开,如下图。
7. 偏心率:我们用上文中计算出的目标长轴与短轴的比值来定义目标的偏心率 ,它能够在一定程度上描述目
标外形关于中心对称的程度 ,目标的偏心率 E定义为 :E = rc / ri, 其中,i代表区域的短轴, 而 rc代表区域的长轴。标的偏心率不受平移、 旋转和尺度变换的影响,它只能粗略描述目标的基本形状和中心的情况 , 并不能精确的区分目标的形状, 比如正方形和圆形的偏心率都为 1,但它们的形状显然不同。
8. 目标的圆形性: 上面已经讨论的偏心率和形状参数都不能很精确的区分目标的形状, 因此我们有必要使用一个能够较好区分目标形状的参数 ,进一步增强对目标的识别能力 ,这就是目标的圆形性 C,它是用一个区域 R的所有边界点定义的特征量 : C =μR /σR ,其中 μR 为从区域重心到边界点的平均距离 , σR 为从区域重心到边界点的距离的均方差。
特征提取结果分析
一般来说,二值化后,有五类细胞需要识别,一类:健康细胞,二类:异常细胞,三类 :粘连细胞,四类:边界细胞,五类:噪声。
三、四、五类细胞是我们首先要去除的。三、四圆形性相对于其他三类细胞来说都小很多,很容易排除。
五类细胞可以通过更有效的去噪方法或者根据细胞面积很容易去除。
一,二类细胞就需要使用面积,周长及灰度密度进行区分。
参考文献:血细胞显微特征提取,毕峰,辽东学院学报,第13卷 第二期,2006年6月