本节讲述神经网络实例用MLP进行手写识别。
使用MNIST数据集
MNIST数据集包含60,000个用于训练的示例和10,000个用于测试的示例。这些数字已经过尺寸标准化并位于图像中心,图像是固定大小(28x28像素),其值为0到1。为简单起见,每个图像都被平展并转换为784(28 * 28)个特征的一维numpy数组。
训练MLP神经网络
在建立好训练数据集和测试数据集后,开始训练神经网络,选取了5000个样本作为训练数据集,选取1000个数据作为测试数据集,数据集中存储的样本是28x28像素的手写数字图片的像素信息,因此特征数为28x28=784个,样本特征是从0~255的灰度值。
Python代码实现:
X_train, X_test, y_train, y_test = train_test_split(
X, y, train_size = 5000, test_size=1000,random_state=62)
mlp_hw = MLPClassifier(solver='lbfgs',hidden_layer_sizes=[100,100],
activation='relu', alpha = 1e-5,random_state=62)
mlp_hw.fit(X_train,y_train)
print('测试数据集得分:{:.2f}%'.format(mlp_hw.score(X_test,y_test)*100))
测试数据集得分:92.70%
使用模型进行数字识别
随便用一个图像测试一下,这里用下面的图片
Python代码实现:
image=Image.open('4.png').convert('F')
image=image.resize((28,28))
arr=[]
for i in range(28):
for j in range(28):
pixel = 1.0 - float(image.getpixel((j,i)))/255.
#pixel = float(image.getpixel((j,i)))/255.
arr.append(pixel)
arr1 = np.array(arr).reshape(1,-1)
a=mlp_hw.predict(arr1)[0]
print("图片中的数字是:",a)
图片中的数字是: 4
分析:神经网络正确地识别出了图片中的数字是4,效果还是不错的。