1. 图像
1.1 图像(Image)
具体概念:可以看作是对物体或场景的一种表现形式,在人的视觉系统中产生视觉印象的客观对象,如自然景物、建筑、用数学描述的图形等等。
-
抽象定义:二维函数f(x, y)
几何属性
物理属性
1.2 数字图像分类
-
位图:又称为点阵图像,由像素的单个点组成。常见格式有BMP、JPG、GIF等
优点:色彩丰富,形象逼真
缺点:文件较大,缩放和旋转容易失真(位图被放大,但像素点数量不变,因此图像的分辨率会降低)
-
矢量图:由矢量数据表示的图像。矢量数据可以是点、线、矩形等。常见格式有PNG、BW、AI等
优点:文件较小,放大、缩小或旋转等操作时不会失真
缺点:不易制作色彩丰富的图像
1.3 色彩系统介绍
-
彩色图像
自然界的所有颜色都可以由红、绿、蓝(RGB)三原色组成
R、G、B每种颜色各由1Byte描述,即8bit,由此,将3原色分成0-255共256个等级
根据红、绿、蓝各种不同的组合我们可以表示出约1600万种颜色(256×256×256)
当一幅图像中每个像素点被赋予不同的RGB值时,就能形成彩色图像了
对于一幅200×200的彩色图像,一个像素需要3个字节,保存整个图像需要用200×200×3的存储空间,即120000个字节
-
灰度图像
灰度图就是只含亮度信息,不含色彩信息的图像
-
要表示灰度图,只需要将亮度值进行量化
量化成0-255共256个等级,0表示最暗(全黑),255表示最亮(全白)
灰度图的RGB每个分量都相同(即只保留一个通道)
-
二值图像
- 每个像素只有黑白两种颜色的图像,即只有0、1两种取值
-
对比图
1.4 图像在计算机中的存储
存储的是像素点
对于彩色图像:每个像素点各有RGB三个通道,每个通道的值都在0-255之间
对于灰度图像:可以认为每个像素点只有一个通道,值也在0-255之间
对于二值图像:只有0、1两个值
1.5 如何用图片来训练&测试BP神经网络
以本次实验所用的实验数据Mnist数据集为例:包含6w个训练集train样本、1w个测试集test样本;所有的图片都是灰度图;每张图片都有20*20=400个像素点
读取图片,读取的是像素值,将每张图片的这400像素点的像素值拉成1行或1列向量存储
将BP神经网络输入层的节点数定为400
BP神经网络每次处理一个样本,即一张图片
由此,这400个像素点的像素值便可作为BP神经网络输入层的输入