(一)预备知识

1. 图像

1.1 图像(Image)
  • 具体概念:可以看作是对物体或场景的一种表现形式,在人的视觉系统中产生视觉印象的客观对象,如自然景物、建筑、用数学描述的图形等等。

  • 抽象定义:二维函数f(x, y)

    • 几何属性

    • 物理属性

1.2 数字图像分类
  • 位图:又称为点阵图像,由像素的单个点组成。常见格式有BMP、JPG、GIF等

    • 优点:色彩丰富,形象逼真

    • 缺点:文件较大,缩放和旋转容易失真(位图被放大,但像素点数量不变,因此图像的分辨率会降低)

  • 矢量图:由矢量数据表示的图像。矢量数据可以是点、线、矩形等。常见格式有PNG、BW、AI等

    • 优点:文件较小,放大、缩小或旋转等操作时不会失真

    • 缺点:不易制作色彩丰富的图像

1.3 色彩系统介绍
  • 彩色图像

    • 自然界的所有颜色都可以由红、绿、蓝(RGB)三原色组成

    • R、G、B每种颜色各由1Byte描述,即8bit,由此,将3原色分成0-255共256个等级

    • 根据红、绿、蓝各种不同的组合我们可以表示出约1600万种颜色(256×256×256)

    • 当一幅图像中每个像素点被赋予不同的RGB值时,就能形成彩色图像了

    • 对于一幅200×200的彩色图像,一个像素需要3个字节,保存整个图像需要用200×200×3的存储空间,即120000个字节

  • 灰度图像

    • 灰度图就是只含亮度信息,不含色彩信息的图像

    • 要表示灰度图,只需要将亮度值进行量化

      • 量化成0-255共256个等级,0表示最暗(全黑),255表示最亮(全白)

      • 灰度图的RGB每个分量都相同(即只保留一个通道)

  • 二值图像

    • 每个像素只有黑白两种颜色的图像,即只有0、1两种取值
  • 对比图


1.4 图像在计算机中的存储
  • 存储的是像素点

  • 对于彩色图像:每个像素点各有RGB三个通道,每个通道的值都在0-255之间

  • 对于灰度图像:可以认为每个像素点只有一个通道,值也在0-255之间

  • 对于二值图像:只有0、1两个值

1.5 如何用图片来训练&测试BP神经网络
  • 以本次实验所用的实验数据Mnist数据集为例:包含6w个训练集train样本、1w个测试集test样本;所有的图片都是灰度图;每张图片都有20*20=400个像素点

  • 读取图片,读取的是像素值,将每张图片的这400像素点的像素值拉成1行或1列向量存储

  • 将BP神经网络输入层的节点数定为400

  • BP神经网络每次处理一个样本,即一张图片

  • 由此,这400个像素点的像素值便可作为BP神经网络输入层的输入

2. BP神经网络

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容