打卡第四天-数据驱动的图像分类方式:K最近邻与线性分类器(上)

图像分类

  • 计算机视觉的核心问题

为什么对计算机来说是困难的:

  • 在计算机中一张图片是一堆像素
  • 拍摄角度
  • 光线不同
  • 姿态不同
  • 遮挡问题
  • 背景干扰
  • 多个目标图像

传统编程思想无法解决图像分类问题

比较早的时候也没有大量数据供使用

通过大量数据训练模型来进行图像识别——图像分类器

CIFAR-10 训练集:

  • 10个类别
  • 50000训练图片,32✖️32
  • 10000测试图片

k最近邻分类器

  • 记住所有有标签的图片
  • 将给定的新的图片与记住的图片一一对比,判断它的标签

如何对比图片

  • 计算曼哈顿距离:每个像素的差的绝对值求和

  • 找到距离最近的图片对应的标签

  • 数据越多,测试耗费的时间越长

  • 欧式距离:像素差平方和开根号

超参数

  • 距离算法:曼哈顿、欧式
  • k,选择几张距离最近的图片对应标签来投票决定测试图片的标签
  • 选择超参数的方法:测试不同的值
  • 交叉验证法,找到合适超参数,防止过拟合

算法的缺点

  • k-近邻算法不会用在图像分类上
  • 图片略做变动,距离值会有很大的变化,很难得到很好的分类结果。

线性分类器

此处引出神经网络,卷积神经网络

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。