MNIST
此数据集是正确分类手写数字,0-9。
MNIST(NIST:National Institute of Standards and Technology,M为modified), 数据经过预处理,以减轻计算机视觉的处理负担,该数据集专注于数字识别。训练集 (training set) 由来自 250 个不同人手写的数字构成, 其中 50% 是高中学生, 50% 来自人口普查局 (the Census Bureau) 的工作人员.
此数据集是正确分类手写数字0-9。在许多情况下它是机器学习算法排名的标准。Geoffrey Hinton将数据集描述为"the drosophila of machine learning"。
MNIST本身包含60,000个训练图像和10,000个测试图像。每个特征向量是784-dim,对应于图像的28×28灰度像素强度。这些灰度像素强度是无符号整数,落在[0,255]范围内。
Animals:狗,猫和熊猫
每种动物1000张,共有3000张图片。可以在我们的CPU或GPU上快速训练深度学习模型并获得合理的准确性。
CIFAR-10
CIFAR-10由60,000 32323 (RGB)图像组成。
CIFAR-10由10类组成,包括:飞机,汽车,鸟,猫,鹿,狗,青蛙,马,船和卡车。
虽然很容易训练在MNIST上获得> 97%分类精度的模型,但在CIFAR-10(以及更大集CIFAR-100)很难获得这样的模型。
挑战来自于物体出现方式的巨大差异。
参考: https://www.cs.toronto.edu/~kriz/cifar.html
SMILES
SMILES数据集由面部图像组成,这些图像要么是微笑的,要么是不笑的,数据集中有13,165个灰度图像,每个图像大小64*64。数据集中的图像被紧紧地裁剪在脸部周围,允许我们设计机器学习算法专注于微笑识别。
Kaggle:Dogs vs. Cats参考资料:
Dogs vs. Cats挑战是Kaggle比赛的一部分,旨在设计学习算法正确地将图像分类为包含狗或猫。共提供了25,000张图片
使用不同的图像分辨率。
参考:https://www.kaggle.com/c/dogs-vs-cats/data
Flowers-17
Flowers-17数据集是17类别的数据集,每个类别有80个图像,由Nilsback等人策划。
Flowers-17为具有挑战性的数据集,因为规模大,视角,背景负责,变化的光照条件和类内变化。
参考:http://www.robots.ox.ac.uk/~vgg/data/flowers/17/