数据和方法
MNIST数据集是收集的手写字体,为单色图像,共有训练集60000项,测试数据集10000项。
建模方法我们使用最简单的神经网络模型,多层感知器(MLP)。
数据下载和处理
数据下载
Keras已经提供了模块用于下载数据,通过一下代码即可完成下载。
### 首先导入程序所需要的库
import numpy as np
import pandas as pd
from keras.utils import np_utils
np.random.seed(10)
from keras.datasets import mnist
(X_train,y_train),(X_test,y_test) = mnist.load_data() #下载数据
我们可以看下数据的长度。
通过matplotlib绘制图片看看数据长什么样子~
数据处理
数据处理大概分为以下几步:
- 图片是28X28,我们要转换为一维的,这样才可以作为我们的输入层。
- 图片标准化
- label值换为one-hot编码,做为输出层。
代码:
X_train = X_train.reshape(60000,784).astype('float32')
X_test = X_test.reshape(10000,784).astype('float32')
X_train = X_train/255
X_test = X_test/255
y_train = np_utils.to_categorical(y_train)
y_test = np_utils.to_categorical(y_test)
MLP建模
模型结构
输入层为784(28×28)个神经元 ,隐层256个,输出层为10。
建立模型
导入相应的库,建立Sequential模型,然后模型加入Dense神经网络层(全连接)。具体代码如下:
from keras.models import Sequential
from keras.layers import Dense
model = Sequential()
model.add(Dense(units=256,
input_dim=784,
kernel_initializer='normal',
activation='relu'))
model.add(Dense(units=10,
kernel_initializer='normal',
activation='softmax'))
我们可以通过summary查看模型的摘要:
训练模型
model.compile(loss='categorical_crossentropy',
optimizer='adam', metrics=['accuracy'])
train_history = model.fit(x=X_train,
y=y_train,validation_split=0.2,
epochs=10, batch_size=200,verbose=2)
对训练模型进行可视化: