使用纹理和形态特征与集成学习对脑MRI进行胶质瘤检测
摘要
计算机辅助检测系统在脑肿瘤诊断中的应用尚待探索。胶质瘤是最常见的脑部恶性肿瘤。本文提出的基于MRI的非入侵CAD系统不仅能够帮助医生检测胶质瘤的存在,还可以检测胶质瘤的类型。该系统的工作原理与图像脉冲序列无关。针对不同的脉冲序列,采用不同的分割方案,融合纹理特征,集成分类器进行分类。一旦肿瘤在第一级分类中被发现,利用脑幕分析其位置,再将其分为上幕和下幕。该系统根据形态特征和内在特征(面积、周长、坚实度和方向),在三级分类中识别肿瘤类型。该系统对JMCD的平均准确率为97.76%,对BRATS数据集的第一级分类准确率为97.13%。在公开获取的BRATS数据集中,低级别肿瘤和高级别肿瘤的发生率分别为95.45%和95.50%。通过检测,统计检验该CAD系统的性能,系统的性能得到了领域专家的实时验证。
前言
CT和MRI扫描等呈像方式被用来检测肿瘤,但是由于其分辨率高、包含大量冗余切片,使得手工检查变得困难不易操作。MRI扫描更加清晰的显示了脑组织中的异常区域,因此,人们更加倾向于使用MRI扫描。MRI更倾向于检测恶性肿瘤,由于这些肿瘤具有不同的特征和形态特征,其在图像上出现/可见性顺序不同。通过CAD系统对这些异常进行正确的解释,可以帮助放射科医生进行术前诊断和治疗规划。此外,肿瘤的精准分类仍然是一个具有挑战性的工作,现有的大多数CAD系统虽然可以检测肿瘤,但是不能对肿瘤进行分类。这项工作的目的就是在MRI图像中准确评估各种最常见的脑胶质瘤。
核磁共振扫描显示胶质瘤及其特征
胶质瘤是一个广泛的术语,几乎包括所有发生在脑胶质或脑中支持组织的肿瘤。神经细胞是中枢神经系统支撑组织的基本细胞。根据组织学分类,胶质瘤有以下几种,包括星形细胞瘤,视管膜瘤,少突胶质细胞瘤和多形胶质母细胞瘤。世界卫生组织将这些肿瘤分为I~IV级,其中,低评级指的是I级和II级;高评级指的是III级和IV级。本位的重点是胶质瘤的检测和识别。
脑肿瘤检测的CAD系统
自2006年以来,利用脑部磁共振呈像技术开发了多个CAD系统。在各种纹理和形状特征中,使用Gabor、灰度共生矩阵(GLCM)、Zernike矩、面积、圆度和小波变换。分类其一般采用马尔科夫随机场(Markov Random Filed, MRF)、人工神经网络(ANN)、支持向量机(SVM)等,报告的准确率在75%~98%之间。
- Khayati等人利用空间信息和MRF分类器将脑核磁共振呈像分为正常组织、脑脊液和病变等三类。
- Wang et al.利用模糊集k-means将脑组织分为WM、GM和CSF,并在加拿大麦吉尔大学的数据集上的验证结果为96.01%。
- Iscan等人使用Zernike矩,在未知数据集上使用ANN的准确率为97%。
- Dahshan等人在哈佛医学院网站提供的数据集上使用小波,通过主成分分析对数据进行降维,通过ANN和KNN分类器分别达到97%和98%的准确率。
- Zuplhe利用前馈神经网络的GCLMs进行组织表征,最终检测肿瘤的准确率为97.5%。
- Saha等人使用质心坐标,对加拿大阿尔伯塔省cross cancer institute收集的数据集的准确率为92%,
- Ain et al.将各向异性扩散和小波变换与支持向量机结合,对印度拉瓦尔品第MRI和CT扫描中心采集的数据进行测试,准确率为99.47%。
- Arakeri et al.使用几个带有集成分类器的形状和纹理特征,对玛尼帕尔的癌症医院的数据集进行验证,准确率为99.09%。
- Guptal等利用基于阈值的分类方法,对印度Jabalpur NSCB医学院手机的数据集中的几个特征进行了性能检测,准确率为97.93%。
- Nabizadeh的利用SVM分类器提出了Gabor小波和统计特征,在NCI-MICCAI2013挑战赛数据及上取得了96.01%的准确率。
- Subashini et al.利用纹理和形状结合朴素贝叶斯分类器,在印度Calicut MRI & Medical Research Center收集的数据集上的准确率为91.67%。
- Soltaninejad等使用超像素技术,利用几个纹理特征区分肿瘤和非肿瘤图像,准确率为98.28%。
- Nabizadeh利用复小波变换和统计特征结合skippy贪心snake算法对脑肿瘤进行分类和检测,准确率为96.80%。
本文的CAD系统
本文的CAD系统主要贡献是能够有效地处理不同的图像脉冲序列。该系统适用于三个级别的分类:
第一级别识别神经胶质瘤的存在不存在,第二级别用来识别肿瘤的位置(如果存在),第三级别用于对胶质瘤肿瘤进行分类,分为四类:星形细胞瘤,视管膜瘤,少突胶质细胞瘤和多形胶质母细胞瘤。
特征提取与分类
理解各种特征的物理意义有助于理解他们在脑磁共振图像分类中的作用。临床分析中需要纹理分析不变得特征。
- Gabor滤波器
是最常见也是最强大的特征之一,但由于其的非正交行为,它们保持一定的相关性。 - DWT系数
DWT系数具有移位变异性,方向性差。 - GLCMs
GLCMs更加能表现出空间信息和放生的细节。肿瘤可能在某些特定的方向上具有特殊的结构特征,这些可以通过GLCMs进行追踪。 - LBP
局部二值模式提取相邻像素的二值模式来表征局部图像纹理的空间结构,LBP也有助于肿瘤或非肿瘤组织的识别。 - GLRL
灰度游程长度编码,是一种强大的纹理特征。对强度模式非常敏感,它能够区分图像的不同强度,有助于发现肿瘤的外观和扩散。 - Zernike矩
Zerknike矩是一种成功的形状描述符,具有许多理想的特征,如不变性、快速计算和多层次的表示来描述形状。 - PHOG
金字塔方向梯度直方图,其具有局部和全局形状信息特征。
在此基础上,首先对纹理特征的GLCMs、LBP、GLRL进行融合,以及Zernike矩与PHOG作为形状特征融合进行分类,以区分肿瘤和非肿瘤。
在本文中使用了最流行的22个GLCM特性。为了提取肿瘤的不规则的模式,0度(Horizontal H),45度(Diagonal D1),90度(Vertical V),135度(Diagonal D2)四个方向被认为是各自方向的GLCM,并且用他们的平均值进行试验。LBP的计算方法是将像素值与其相邻像素进行匹配。GLRL是通过计算指定方向每个灰度级别在该方向上的运行次数和长度来定义的。对于PHOG特征,图像被划分为一系列越来越细的空间网格,记录每个网格单元中的点数,形成一个金字塔表示,每个分辨率级别的单元格计数表示该级别的直方图的bin数量。
在第一级发现肿瘤后,幕部决定肿瘤的位置,并将其分为幕上和幕下。在分类的第三个层次上,利用肿瘤的形态特征进行分类。根据肿瘤的面积、实性、周长和方向等固有特性,对特定胶质瘤进行检测和分类,可以有效解决肿瘤的检测问题。