[TOC]
第二章 数字图像处理基础
- 人眼视觉特性
- 图像感知和获取
- 图像数字化
- 像素间的基本关系
- 图像文件格式
人眼视觉特效
1.光与电磁波谱
可见光谱:380nm~780nm
波长越小,呈色越冷,波长越长,呈色越暖。可见光谱区间之外,下区间为紫外线,上区间为红外线,这些区间内的光谱成像需要特殊的硬件设备。
2.人类视觉基础
人眼生理结构:视网膜中三种椎体细胞对三种波长的光最敏感,也就是RGB,一个颜色进入人眼,实际就是这三种细胞的感受。当RGB以某种比例进入人眼,颜色感会消失,只剩下亮度感。
3.人眼视觉特性
小孔成像模型,倒置成像。
视觉的空间特性
- 视觉的空间分辨能力为1‘(一分)
- 灰度分辨能力大约64级
视觉的时间特性
- > 15帧每妙,具有连贯的感觉。
亮度适应能力:人眼能通过改变灵敏度来适应非常大的光强度变动范围。
主观亮度:视觉系统感受到的亮度,是进入人眼的光强度的对数函数,并不是光强度本身。
对比灵敏度:人能分辨的强度差△I,是I的函数,韦伯分数=△I/I,韦伯分数约等于0.02,就是说,强度相差2%的时候才能感受到光强度的不同,这个值和背景光强度也有关。target1和target2光强度相差大约2%,能感受两个目标不同,但是这个2%的阈值随着整个背景的不同而有所不同。
马赫带效应,Mach Band,人的视觉系统会过高或过低估计不同亮度区域边界值(简单理解为对不同强度具体天然分割功能,一种滤波处理)。
同时对比度:人的眼睛无法判断出视场中目标物的绝对亮度,因为人类视觉对亮度的主观响应与背景亮度有密切关系。
空间错觉和假轮廓:人对物体形状的感知中另一个重要现象是错觉。
图像感知与获取
1.传感器
- 胶片(化学反应),模拟图像,需要数字化
- 电荷耦合器件CCD,charge coupled device,将光转为电荷,存储转换后的电荷。
- CMOS金属-氧化物-半导体,metal-oxide-semiconductor。
CCD灵敏度、解析度、分辨率噪声控制、成像等方面都优于CMOS,但CMOS成本低、功耗低,整合度高的优点。
2.成像方式
单个传感器、带状传感器、整列传感器
图像数字化
1.数字化,digitizing-scanning/sampling and quantization。
将模拟图像经过离散化之后,得到数字表示的图像。
-
采样:空间xy的离散化,即像素。二维采样定理(xy上离散的程度,通俗说就是划分多少格合适)。根据一维的香浓采样定理推导二维上的采样定理。二维采样定理,Nyguist准则:
1/△x,1/△y ≥ 2倍的图像函数上限频带
目前的数字图像采样通常都满足,无需额外考虑采样定理的限制。
量化:强度Z的离散化。采样后的各像素的灰度值从模拟量到离散量的转换称为图像灰度的量化。若只取2级量化,只有0和1,则为二值图像。
编码:对离散的Z进行编码,如对数据进行PCM编码(脉码调制)。
2.数字图像的性质
分辨率
- 图像分辨率,组成图像的像素密度,单位为:像素*像素
- 显示分辨率,显示器上能显示出的像素数目。
- 其他的分辨率,dpi,display pixels/ inch。单位长度显示的像素数量。
像素深度:存储每个像素所用的位数,也用来度量图像的分辨率
位面层数:区分灰度图和彩色图的。灰度图只有一个位面,彩色图有三个位面——红色分量、绿色分量、蓝色分量
像素之间的基本关系
1.像素的领域和邻接
邻域:与某一像素相邻的像素的集合,反映像素间的空间关系。
- 4邻域:$N_4(p)$,像素p的上下左右4个相邻像素。它们到p点的距离都为1.
- 对角邻域:$N_D(p)$.像素p的对角相邻的4个像素。到p点的距离都为$\sqrt2$.
- 8-邻域:4邻域+对角邻域,正好组成一个3*3矩阵。
当P位于图像边界,认为某些邻域的点落在图像外。
像素邻接,connectivity,空间上相邻,且像素灰度值相似。
- 邻接判断:1)是否存在邻域关系?2)灰度值是否满足某个特定的相似准则v(相似的一种度量,如相等、同处一个灰度值集合中)
- 三种邻接:假设V为灰度值集合
- 4-邻接:1)p和q都在v中取值(同处一个灰度值集合中)。2)q在p的4-邻域中。
- 8-邻接:与上面4-邻接相似,条件2改为q在p的8-邻域中。
- m-邻接(混合邻接):两个条件满足一个即可。
2.连通性
反应两个像素间的空间关系。
- 通路:像素p到q的一条通路,由一系列具有坐标的独立像素组成,且路径中的前后路径点相邻接。
- 连通:通路上所有像素灰度值满足相似准则。
3.距离度量
距离:对于像素p(x,y)和q(s,t)及z(u,v),若:
- D大于等于0,且当且仅当p=q时,D=0
- D(p,q) = D(q,p)
- D(p,z)<=D(p,q)+D(q,z)
则,D可以作为距离的度量或D是距离函数
- 欧式距离:De,平面两点距离公式。欧氏距离为半径形成一个圆平面。
- 城市距离:D4,两个像素坐标的绝对差值之和,等于△x+△y,城市距离为半径,形成一个菱形。
图像的文件格式
1.数字图像类型
静态图像可分为矢量图Vector和位图Bitmap。
-
矢量图:数学公式描述的图像,可用一系列绘图指令表示图像。
优点:数据量小;质量与分辨率无关;无论图像放大缩小多少倍,总是以显示设备允许的最大清晰度显示。
缺点:色调、色彩不够丰富;不够逼真;不易在不同软件间交换使用。
-
位图:用过像素点表示图像,每个像素具有颜色属性和位置属性。
优点:显示速度快;真实世界图像可通过设备转换为点位图。
缺点:存储传输过程中数据量大;缩放、旋转时算法复杂且容易失真。
分类:
- 线画稿LineArt,只有黑白两种颜色,二值图
- 灰度图GrayScale,从黑到白的若干种灰度的单色图像,常说的黑白照片实际是灰度图。
- 索引颜色位图Index Color,映射颜色,颜色是一组预先定义的、有限的颜色,图像最多只能显示256种颜色。
- 真彩色图True Color,24位图,由RGB三个通道,每个通道8bit表示0到255之间的不同亮度值,共表示256*256*256=约为1670万中颜色。
2.图像文件格式
图像文件的格式即图像文件的数据构成,通常是一个文件头,之后是图像数据。
文件头一般包括了文件类型、作者、时间、版本号、文件大小等内容。
图像数据包含图像的压缩方式和存储效率等。
例如,BMP图像文件格式
- 位图文件头,bitmap fileheader
- 位图信息头,bitmap infoheader
- 调色板,palette,用于索引色,真彩色图像不用调色板,infoheader之后就是实际位图数据。
- 实际位图数据,image data,真彩色下就是RGB的实际值,索引图像(用到调色板)下就是该店颜色在调色板中的颜色索引。