第一章 数字图像处理概述 天津大学版
第一讲:数字图像处理的基本概率
整个课程用 Visual C++ 和 MATLAB 结合做图像处理
色度学理论认为,任何颜色可由 红、绿、蓝 三种颜色混合得到。
1 Byte(字节) = 8 bit(比特)
1 KB = 1024 Byte
1 MB = 1024 KB
图形:
由指令集合组成,指令由位置、形状、颜色等描述。记录的是坐标值,颜色隐含,统一描述。显示时执行命令,转变为屏幕上所看到的形状和颜色。
图像:
图像是矩阵,它里面的数据就是每一点的颜色值,位置按规则排列。
上图是一个9像素的图像,左上角最黑的是0,左下角很白的是250.
第二讲:图像的存储格式
图像有2位的黑白图像,8位灰度图像,8位彩色图像,其中8位灰白、彩色图像都带 8位索引图像,一个数据矩阵x和一个调色板矩阵MAP。只有一个像素占8位的时候,才有索引矩阵,才有个颜色表。8位灰度的索引表和索引号是对应的,RGB相等。
对于一个256色(BPP=8)的800*600分辨率的图像而言,若R、G、B分别采用一个字节描述,则需要 800*600*3=1440000Byte的存储空间,使用颜色表则只需800*600*1+256*3=480768Byte的存储空间
,颜色表是提前设置好的表,通过索引即可推断出 R、G、B的值。矩阵中每个元素的值就是 颜色表中的索引号。
真彩图像:一个像素就24位 ,能表现的颜色数量为2^24,能表达接近实际世界的颜色。
真彩图像不带索引号,它每个像素直接是RGB值 (还有更高的48位彩色,目前只用在少数特殊行业,我们一般的显示屏也都是24位彩色,2^24=1677万色人眼已经无法分辨,够用了)
常见的图片格式:
JPEG (Joint Photographic Experts Group) 其优点为兼容性高、传输速度快、内存小。大部分的数码相机都能够拍 JPEG,它是一种有损压缩方案,可在保持较高图片质量的前提下,被压缩到原图内存的二十分之一大小,令细节和质量流失。但同时文件比较小,一些相机能够拍不同画质的 JPEG﹙如低、中、高三种﹚。意味着画质越高,压缩得越少,文件也会相对地大。当然,如果是出于对图片高质量的要求,JPG格式的图片依然存在失真的情况,故而无法与PNG或TIF格式相比较。还有一个注意点,就是在图片编辑中,对于JPG格式的图片,每一次输出都会损失像素质量,在用图片编辑软件,编辑JPG格式的图片时,尽量不要过于频繁地保存步骤,防止像素损失。
TIFF (Tagged Image File Format)RAWDNG (Digital Negative) 是一种灵活的位图格式,这是最常用的工业标准格式,有一些印刷商会要求 TIFF 档。使用无损格式存储图像的能力使TIFF文件成为图像存档的有效方法。与JPEG不同,TIFF文件可以编辑然后重新存储而不会有压缩损失。在后期上比较容易,但在记忆卡上占用更多容间。优点:能在后期软件上作后期制作、用于打印。缺点:档案较大,也占用空间。主要用来存储包括照片和艺术图在内的图像。
PNG (Portable Network Graphics) “可移植网络图形格式“,是图像文件存储格式,其设计目的是试图替代GIF和TIFF文件格式,同时增加一些GIF文件格式所不具备的特性。对于图片本身质量的减损非常低。因其能够支持压缩不失真、透明背景、渐变图像的制作要求,PNG格式也是各大制图软件例如PS、InDesign输出或编辑的原始格式。PNG文件非常适合在互联网上使用。但它也不足以用作专业印刷。优点:能够相容半透明 / 透明图像,缺点:档案比 JPEG 大,不能用于印刷PNG
GIF (Graphics Interchange Format) GIF格式的图片是分为静态和动态两种的。静态的GIF格式图片和JPG格式的图片无异,而动态的GIF图片则是由多幅图片保存为一个图片,形成动画效果而制成的。然而,它们只能包含最多 256 种颜色,因此并不适合用在照片上,除非照片的颜色比较单一。优点:档案小、非常适合在网页使用,可以制作动画缺点:包容颜色太少
BMP (Bitmap)PSD (Photoshop Document) BMP 是由微软发明,最初在 Windows 平台上使用,但现在 Mac 电脑上也能用到 BMP格式。BMP 格式能把颜色数据保存在每一个单独的像素中,BMP格式的图片文件内存较大,不会作任何压缩,保存了每个像素的信息。优点:可用于打印,是能保留高品质影像的格式,缺点:档案一般较大。
第三讲 BMP文件存储格式
BMP文件由四部分组成
BMP文件头:BITMAP FILE HEADER
里面存放第一个东西是 2个字节,是bm
文件标识符,后面4个字节存放 文件的大小 bisize,后面2个字节是0,再后面还是2个0,再后面4个字节是数据区的起始位置,总共字节2+4+2+2+4=14字节
位图信息头: BITMAP INFOHEADER
这里定义了很多信息,着重说几点,首先定义了本结构bisize的大小,总共 40字节。颜色表: RGB QUAD
颜色表有3种颜色,实际上有个保留字,实际是4个字节,最后一个保留。位图像素 数据
第四讲 基于MATLAB的图像处理基础
将一幅真彩图像变成灰度图像,MATLAB代码如下:
close all; # 关闭当前所有图形窗口
clear all; # 清空工作空间变量
clc:; # 清屏 (以上三步是新建程序的基本步骤)
X = imread('football.jpg'); # X读取文件格式为.jpg。文件名为 football的JPG图像
I = rgb2gray(X); 将RGB图像转化为灰度图像
set(0, 'defaultFigurePositon', [100, 100, 1000, 500]); # 修改图形图像的位置默认设置
set(0, 'defaultFigureColor', [1 0 1]); # 修改图形背景颜色的设置
subplot(121), imshow(X); #显示原RGB图像
subplot(122), imshow(I); #显示转换后的灰度图像
第二章 图像处理编程
第一讲 图像处理编程基础
教学软件 VC_DIP框架结构
数字图像处理 刚萨雷斯版
1.2 数字图像的起源
数字图像处理最早的应用是报纸业,把图像从纽约通过还跌光缆传输到伦敦。1929年时候,可以做到15个灰度图像的传输。
1964年美国通过数字图像技术获取第一张月球表面图片。
2.0 数字图像基础
2.3.4 简单的图像形成模型
可以用函数 f(x,y) 表示一个图像。0< f(x,y) < 无限大~
函数f(x,y) 可以由2个分量来表征,入射到观察场的光源总量;场景中物体反射光的总量,分别表示为i(x,y),r(x,y)
f(x,y) = i(x,y)r(x,y)
0<i(x,y)<无穷
0< r(x,y)<1
2.4 数字图像的表示
对于一幅大小是 M*N
,灰度级为L = 2 ^k
的数字图像,其存储空间为 b = M * N * k
当一个图像有2^k 个灰度时候,一般称这个图像为 k比特图像。
2.4.2 放大或缩小数字图像
放大和缩小数字图像需要执行的两个步骤:
- 计算新的像素在原图中的位置
- 为这些对应的位置赋新灰度值
一维线性差值:已知2个点,这2个点中间的点的坐标。
临近差值,双线性差值,双线性差值效果好,不容易造成图像细节丢失,临近差值简单,速度快。
m混合邻接是对 8邻接的改进,为了消除8邻接容易发生的 二义性
2.6 数字图像处理中所用数学工具的介绍
阵列与矩阵操作
线性操作与非线性操作
集合和逻辑操作
使用图像相乘和相除来降低阴影
第三章. 灰度变换与空间滤波
术语空间域 指的是图像平面本身,这类图像处理方法直接以图像中的像素操作为基础。而变换域的图像处理首先把一幅图像变换到变换域,在变换域中进行处理,然后通过反变换把处理结果返回到空间域。空间域处理主要分为 灰度变换和空间滤波两类。 灰度变换在图像的单个像素上操作,主要以对比度和阈值处理为目的。空间滤波涉及改善性能和操作,如通过图像中的每一个像素的邻域处理来锐化图像。
3.1.1 灰度变换和空间滤波基础
我们知道空间域就是简单的包含图像像素的平面,空间域的技术直接在图像像素上进行操作。比如一些图像增强。
对于频域来说,其操作是在图像上进行傅里叶变换的基础上进行。
3.2 一些基本的灰度变换函数
图像反转
对数变换
幂律(伽马)变换
分段线性变换函数
3.3. 直方图处理
直方图是多种空间域处理技术的基础。直方图操作可以用于图像增强、图像压缩、分割。
直方图均衡:增强对比度,使得图片能显示更多细节,适合偏亮的图片
直方图匹配(规定化):使灰度提高,图片更亮,适合偏暗的图片
3.4 空间滤波基础
低通滤波器的最终效果是模糊(平滑)一幅图像。
3.5 平滑空间滤波器
平滑滤波器用于模糊处理和降低噪声。模糊处理经常用于预处理任务中,例如在目标中提取之前去除图像中的一些琐碎细节,以及桥接直线或者曲线的缝隙。通过线性滤波器和非线性滤波模糊处理,可以降低噪声。
3.6 锐化空间滤波器
锐化处理的主要目的是突出灰度的过渡部分。
使用二阶微分进行图像锐化---拉普拉斯算子
第四章 频率域滤波
滤波器:抑制或最小化某些频率的波或振荡的装置或材料
频率:自变量单位变化期间,一个周期函数重复相同值序列的次数
4.1 傅里叶级数和 变换简史
傅里叶在这个领域的贡献是,他指出任何周期函数都可以表示为不同频率的正玄或者余弦之和的形式,每个正弦项和/或余弦项 乘以不同的系数(现在称该和未傅里叶级数),甚至非周期函数(但该曲线下的面积是有限的)也可以用正弦和/余弦 乘以 加权函数的积分来表示。用傅里叶级数或者变换表示的函数特征完全可以通过傅里叶反变换来重建,而不会丢失任何信息。