数据预处理。作者对肺区进行预处理得到128*128*128的立方体,然后使用多尺度策略,生成两个尺寸的小立方体:36 * 48 * 48和20 * 36 * 36。从整个肺部区域收集小立方体,进入两个分类网络,获得不同的结节视野大小来预测整体结果。
针对正负样本不平衡的问题,将正样本进行数据增强,从三个维度进行90度、180度、270度的翻转。
网络。作者采用了三维的FPN(特征金字塔网络),FPN是何凯明团队17年新提出的在Faster RCNN上改进的网络,主要将FCN融入到Faster RCNN。网络具体结构如下图所示,输入一个128的立方体到FPN网络,针对正负样本不平衡的问题,作者尝试了两种策略,一种是焦点损失(焦点损失。这个损失函数是基于标准的交叉熵损失修改的。这个功能可以使模型在训练过程中更加关注难于分类的样本,同时减少易于分类的样本的权重);一种是逐渐增加负面样本的权重,文章采取的是第二种方法,首先,随机选取N个负样本作为候选池。然后,根据其分类置信度得分将该池中的负样品按降序排序,并将前n个样品选为hard 负样本,训练期间逐渐增加N。
假阳性减少。针对这个任务,作者采取了两种网络,一个是3D DCNN,结构如下图所示。四个阶段组成,前三个阶段是三维的卷积层,包括最大池、正则和dropout,第四个阶段是全连接层输出分类结果。
另外作者还采用了U-Net网络,微调检测网络的结构,如下图。两种方法都采用焦点损失解决样本不平衡的问题,最终融合两种网络完成假阳性减少的任务。
对于3D CNN网络:作者在多尺度策略上做了很多尝试,包括概率加权和微调。通过实验,作者发现使用36 * 48 * 48数据训练网络得到源网络,然后使用源网络上的20 * 36 * 36数据进行微调,会有更好的结果。当然整个结构使得平安科技拿到了luna 16双任务的第一名,目前仍旧排名第一。