MNIST数据集
MNIST数据集是深度学习领域标准,易用的成熟数据集。
由6万个训练样本和1万个测试样本组成,每个样本都是一张28*28像素的灰度手写数字图片。
data包含三个元素的列表:train_set、val_set、 test_set,包括50 000条训练样本、10 000条验证样本、10 000条测试样本。每个样本包含手写数字图片和对应的标签。
train_set(训练集):用于确定模型参数。
val_set(验证集):用于调节模型超参数(如多个网络结构、正则化权重的最优选择)。(验证是否过拟合)
test_set(测试集):用于估计应用效果(没有在模型中应用过的数据,更贴近模型在真实场景应用的效果)。
train_set包含两个元素的列表:train_images、train_labels。
train_images:[50 000, 784]的二维列表,包含50 000张图片。每张图片用一个长度为784的向量表示,内容是28*28尺寸的像素灰度值(黑白图片)。
train_labels:[50 000, ]的列表,表示这些图片对应的分类标签,即0~9之间的一个数字。