竞赛网址:https://odir2019.grand-challenge.org/
任务:
这个竞赛的目的是开发自动眼病分类方法。左眼和右眼的彩色眼底图像作为输入(可以使用其他提供的信息,如患者的年龄、性别等),眼部疾病分类的目标是将患者分为八个类别,包括正常,糖尿病,青光眼,白内障,年龄相关性黄斑变性,高血压,近视和其他疾病/异常。
【1】初步实践:
由上述可知,该疾病有8个类别。该分类是属于图像分类的多标签分类问题。为此,决定采用模型的多输出来进行分类。这样的话,就有8个模型的输出。
首先采用了ShufflenetV2网络进行修改。
遇见的问题:test图像经过模型,每个输出结果都判为正常,明显存在问题。
思考问题:
(1)类别不平衡导致模型出错。
由于对于一张图像一个输出,存在可能几乎输出的结果都为正常的话,也能有很高的正确率,导致模型可能将直接输出都预测为正常。
1、首先,考虑到loss函数,是否可以使用focal loss在做目标检测的话,对于背景类太多的情况很有用,但是focal loss存在较难调整的问题。
2、可能由于每个类的疾病都比较少,所以可以把少的类训练的时候每一张图像多读几份,如果每类都少的话,正常样本少放些。
3、做数据均衡。
控制正常类和疾病类比率最多1:3和1:5。