URL : https://www.kaggle.com/greenarrow2018/minist-recognizer-with-cnn-with-0-996-acurracy
本来的做法是直接使用CNN对原始数据做分类。效果也还可以。
阅读了 Another Solution : https://www.kaggle.com/alifrahman/digit-recognizer-in-keras-ensemble-method-0-99628
之后对做法进行改进。
主要多了三步,首先是标准化,把像素控制在0-1之间。其次是数据增强,对数据进行横向纵向的移动,旋转,或者PCA白化,ZCA白化。这样可以增强模型泛化能力。
ImageDataGenerator这个类之前在10-monkey的时候用过,以为只是读取数据而已,没想到还有数据增加的作用。