数字图像处理:基础

本文同时发布在我的个人博客上:https://dragon_boy.gitee.io

数字图像处理概念

一幅图像可定义为一个二维函数f(x,y)xy是空间坐标,在任何一对空间坐标(x,y)处的幅值f称为图像在该点处的强度或灰度。当x,y,f时有限的离散数值时,我们称该图像为数字图像。数字图像处理就是指借用计算机处理数字图像。数字图像由有限数量的元素组成,每个元素都有一个特定的位置和幅值,这些元素称为像素。

数字图像处理的基本步骤

视觉感知

马赫带


在不同亮度的边界,我们往往会感受到不同的亮度。,即带有毛边的亮度模式。

同时对比


感知区域的亮度并不简单地取决于其强度,随着背景变量,所观察的物体的亮度看起来变暗了一些。

错觉

顾名思义。


光和电磁波谱

这里只关注电磁波谱的可见光波段,可以分为6个主要区域:紫、蓝、绿、黄、橘黄、红。

人感受物体颜色由其反射光决定,物体吸收其它波长光的大部分能量。

没有颜色的光被称为单色光或无色光。单色光的唯一属性是它的强度。因为感知单色光的强度从黑色到灰色的变化,最后到白色,灰度级一词常用来表示单色光的强度。从黑到白的单色光的度量值范围通常称为灰度级,而单色图像常称为灰度图像。

简单的图像生成模型

当一副图像由物理过程产生时,其亮度值正比于物理源所辐射的能量,因此,f(x,y)一定时非零和有限的:

0<f(x,y)<∞

函数f(x,y)可由两个分量来表征:(1)入射到观察场景的光源照射总量;(2)场景中物体所反射的光照总量。这两个分量分别称为入射分量和反射分量,且分别表示为i(x,y)r(x,y)。两个函数作为一个乘积合并为f(x,y):

f(x,y) = i(x,y)r(x,y)

其中,

0<i(x,y)<∞

0<r(x,y)<1

零单色图像在任何坐标(x_0,y_0)处的强度表示为

l = f(x_0,y_0)

l的取值范围为

L_{min} \leq l \leq L_{max}

其中L_{min} = i_{min}r_{min}L_{max} = i_{max}r_{max}

区间[L_{min},L_{max}]称为灰度级,实际情况下常令该区间为[0,L-1],其中l=0为黑色,l=L-1为白色。

图像的取样和量化

为了产生一幅数字图像,我们需要把连续的感知数据(如电压波形)转化为数字形式,这种转化包含两种处理:取样和量化。

基本概念


图a是一幅连续图像,它的坐标和幅度可能都是连续的,为将其转化为数字形式,我们在坐标和幅度上都进行取样操作。对坐标值数进行数字化称为取样,对幅值数字化称为量化。

图b的一维函数是沿AB的连续图像幅度值的曲线。我们沿线段AB等距地对该函数取样,结果如图c,接着量化灰度值。我们制作一个分为多个离散区间的灰度标尺,对每一个样本的灰度值进行比较,较其的灰度值置为最接近的标尺中的灰度值,取样和量化的结构如图d。

数字图像表示

f(s,t)表示一幅具有两个连续变量st的连续图像函数,通过取样和量化操作,可以将其转换为数字图像。假如将其取样为一个阵列f(x,y),该阵列包含M行和N列,这样,数字图像的原点的值是f(0,0)(左上角),f(0,1)表示第一行的第二个样本。

由一幅图像的坐标张成的实平面部分称为空间域,xy称为空间变量或空间坐标。

这里,我们将数字图像表示为矩阵形式:

f(x,y) = \left[ \begin{matrix} f(0,0)& f(0,1)&-&f(0,N-1)\\ f(1,0)&f(1,1)&-&f(1,N-1)\\ |&|& &|\\ f(M-1,0) &f(M-1,1)&-&f(M-1,N-1) \end{matrix} \right]
矩阵中的每个元素可以成为像素。

数字化过程要求针对M、N和灰度级L做出判断。对于M和N,必须为正整数。出于存储和量化硬件的考虑,灰度级数典型地取为2的整数次幂,即

L=2^k

我们假设离散灰度级时等间距的,区间是[0,L-1]内的整数。有时,由灰度值跨越的值域非正式地称为动态范围。这里,我们将图像系统的动态范围定为系统中最大可度量灰度和最小可度量灰度之比。作为一条规则,上限取决于饱和度,下限取决于噪声,同时,我们定义最高和最低灰度级间的灰度差为对比度,当有高动态范围时,则认为图像有高的对比度。

存储数字图像所需的比特数b为:

b = M\times N\times k

M=N时:

b = N^2k

下表是Nk取不同值是需要用来存储方形图像的比特数:

空间和灰度分辨率

直观来说,空间分辨率是图像中可辩别的最小细节的度量。在数量上,空间分辨率的度量可以表示为每单位距离线对数和每单位距离像素数。假设我们使用交替的黑白垂直线来构造一幅图形,线宽为W个单位,线对的宽度就是2W,每个单位距离有1/2W个线对。广义的图像分辨率的定义是每单位距离可分辨的最大线对数量。每单位距离像素数是印刷和出版业常用的图像分辨率度量,在美国,这一度量通常使用每英寸点数(dpi)来表示。

类似地,灰度分辨率是指在灰度级中可分辨的最小变化。

图像内插

内插是在诸如放大、收缩、旋转和几何校正等任务中广泛应用的基本工具。

比如,要将一幅大小为500\times 500像素的图像放大1.5倍,一种简单的放大方法是创建一个假想的750\times 750网格,它与原始图像有相同的间隔,然后将其收缩,使它准确地和原图像匹配。收缩后的750\times 750网格的像素间隔要小于原图像的像素间隔,为了对覆盖的每一个点赋予灰度值,我们在原图像中寻找最接近的像素,并把该像素的灰度赋予750\times 750网格中的新像素。当完成对网格覆盖的所有点的灰度赋值后,就把图像扩展到原来规定的大小,得到放大后的图像。

上述方法称为最近邻内插值,但这个方法不常使用,因为会造成极为严重的失真。更为使用的方法使双线性插值,我们使用4个最邻近去估计给定位置的灰度,v(x,y)表示要赋予的灰度值:

v(x,y) = ax+by+cxy+d

其中,4个系数可由4个邻近点写出的未知方程确定。

另一个复杂度较高的方法是双三次插值,包含16个邻近点:

v(x,y) = \sum^3_{i=0} \sum^2_{j=0}a_{ij}x^iy^j

其中,16个系数可由16个邻近点写出的未知方程确定。

像素间的基本关系

相邻像素

位于(x,y)处的像素p有4个水平和垂直的相邻像素:

(x+1,y),(x-1, y),(x,y+1),(x,y-1)

这组像素称为p的4邻域,用N_4(p)表示。

p的4个对角相邻像素的坐标如下:

(x+1,y+1),(x+1,y-1),(x-1,y+1),(x-1,y-1)

N_D(p)表示。这些点和4个邻点一起称为p的8邻域,用N_8(p)表示。

邻接性、连通性、区域和边界

V是用于定义邻接性的灰度值集合。在灰度图像中,例如灰度级为0-255的临界像素中,V可能是256个值中的任何一个子集。考虑3种邻接:

  • 4邻接。如果q在集合N_4(p)中,则具有V中数值的两个像素pq是4邻接的。
  • 8邻接。如果q在集合N_8(p)中,则具有V中数值的两个像素pq是8邻接的。
  • m邻接。如果qN_4(p)中,或在N_D(p)中,且集合N_4(p)∩N_4(q)中没有来自V中数值的像素,则具有V中数值的两个像素pqm邻接的。

m邻接用来消除8邻接的二义性。

从像素p到像素q的通路是特定的像素序列:

(x_0,y_0)(x_1,y_1),...,(x_n,y_n)

(x_0,y_0)p的坐标,(x_n,y_n)q的坐标,之间相邻像素是邻接的。n是通路的长度。根据相邻像素的邻接方式可以来命名通路名。

S是图像中的一个像素子集,如果S的全部像素之间存在一个通路,则pqS中连通。对于S中任意像素pS中连通到该像素的像素集称为S的连通分量。如果S只有一个连通分量,则集合S称为连通集。

R是图像的一个像素子集。如果R是连通集,则R称为一个区域。两个区域如果联合成一个连通集,那么它们称为邻接区域。

距离度量

像素p(x,y)q(s,t)的欧式距离:

D_e(p,q) = \left[ (x-s)^2 + (y-t)^2\right]^{1/2}

城市街区距离:

D_4(p,q)=|x-s|+|y-t|

棋盘距离:

D_8(p,q)=max(|x-s|,|y-t|)

数字图像处理中所用数学工具

阵列和矩阵操作

图像可以等价地被看成是矩阵。阵列和矩阵间地操作是有区别的。矩阵乘法不必多说,而阵列乘法是每个像素相对应的乘法。

线性操作和非线性操作

图像处理方法的最重要分类之一是它是线性的还是非线性的。考虑一般的算子H,该算子对给定的输入图像f(x,y),产生一幅输出图像g(x,y)

H[f(x,y)]=g(x,y)

如果

H[a_if_i(x,y)+a_jf_j(x,y)] = a_ig_i(x,y)+a_jg_j(x,y)

H是一个线性算子。反之是非线性操作(比如求最大值操作)。

算数操作

即两个阵列间的加减乘除操作(两个图像的大小要相同)。

空间操作

分为三类:(1)单像素操作。(2)邻域操作。(3)几何空间变换。

单像素操作

在数字图像中执行的最简单的操作就是以灰度为基础改变单个像素的值:

s = T(z)

其中,z是原图像中像素的灰度,s是处理后的图像中相应像素的灰度。

邻域操作

S_{xy}代表图像f中以任意一点(x,y)为中心的一个邻域的坐标集。邻域处理在输出图像g中的相同坐标处生成一个相应的像素,该像素的值由输入图像中坐标S_{xy}内像素经指定操作决定。

几何空间变换和图像配准

几何变换由两个基本操作组成:(1)坐标的空间变换。(2)灰度内插,即对空间变换后的像素赋灰度值。

坐标变换:

(x,y) = T{(v,w)}

(v,w)是源图像中像素的坐标,(x,y)是变换后图像像素的坐标。T是变换矩阵。

灰度内插的方法在之前提到过(双线性内插,双三次内插)。

图像配准:
比如对图像进行放射变换时,对四个角生成约束点,变换这些约束点可以对图像进行配准操作。

图像变换

除在空间域对处理外,还可以在频域进行处理。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,496评论 6 501
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,407评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,632评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,180评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,198评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,165评论 1 299
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,052评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,910评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,324评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,542评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,711评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,424评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,017评论 3 326
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,668评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,823评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,722评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,611评论 2 353