什么是图像金字塔

有些情况下,我们需要处理源自同一张图像的不同分辨率的图像集合。这些不同分辨率的图像组成的集合称为图像金字塔

图像金字塔的主要类型可分为低通和带通

有两种常用图像金字塔:

  1. Gaussian Pyramid (低通)
  2. Laplacian Pyramids (带通)

之所以称为金字塔,是因为金字塔底部由大尺寸的原图组成,越往上层,尺寸越小,堆叠起来就是一个金字塔的形式:

金字塔的生成过程

  1. 低通金字塔:使用一个恰当的平滑filter对图像进行平滑处理,接着对平滑之后的图像进行下采样(subsampling),下采样因子通常为2.(分别对应各个坐标轴)。继续对得出的结果图像做相同的操作,重复这个步骤多次。每循环一次,会得出一副更小的、平滑程度更高的、分辨率更低的图像。
    如果把原图放在最底部,之后每一次的生成图像都堆叠到上一次的结果之上,就形成了金字塔的形状
  2. 带通金字塔:通过将金字塔中相邻两层图像做差得到。由于相邻两层图像尺寸不同,因此需要进行一些图像插值操作,已达到计算像素间差值的目的。
    具体的,拉普拉斯金字塔(Laplacian Pyramids)中的每一层,是由高斯金字塔的对应层以及高一层(需要先插值放大)做差而成。

Scale Space 尺度空间

尺度空间: 将一幅图像表示为一系列的平滑图像,称为尺度空间表示,这些平滑图像可参数化表示为平滑核(用于抑制细尺度结构)的尺寸。
定义:
尺度空间的概念适用于有着任意数目变量的信号。而其在二维图像上的应用是最常见的。

尺度空间的其中一个主要类型,就是线性(高斯)尺度空间。高斯尺度空间因其良好的性质而被广泛地应用。

对于给定的一副二维图像 f(x,y),他的线性(高斯)尺度空间表示是由一系列的派生信号L(x,y;t)所组成,其中L(x,y,;t)由f(x,y)与一个二维高斯核卷积而成,其中二维高斯核定义如下:

2dGaussian.png

因此有:

L.png

其中 * 号代表卷积。 分号表示卷机操作只对 x,y 这两个变量进行,t仅指代定义好的尺度级别(scale level)。上述L 适用于连续的尺度级别 t≥0, 但一般情况下仅会考虑离散的一组t

尺度参数 t=σ^2 是高斯filter的方差。当t趋于零时,g就成为了一个脉冲函数(除了零点,别处的函数值都为零),则有 L(x,y;0)=f(x,y), 也就是说,位于尺度级别 t = 0 的尺度空间表示(scale-space representation)就是原图本身。随着t的增大,越来越大的filter被作用于图像f,形成平滑度越来越高的L,以至于原图中越来越多的细节被丢弃。由于每个filter的标准差为σ=√t, 对于位于尺度等级t的图像,远小于√t的细节很大程度上会被丢弃。

关于filter的选取

并非任何低通filter都可用于生成尺度空间。可用于生成尺度空间的filter必须满足以下一点:由该平滑filter生成的粗尺度图像(高层图像)不会引入不存在于细尺度图像(低层图像)中的杂散结构。换言之,给定粗尺度图像中的任何一个区域,细尺度图像上总能找到相应的区域。这两个区域相比,粗尺度图像区域不能够有新的结构。

受制于尺度空间公理,高斯卷积核是实现尺度变换的唯一线性核。

为什么要提出尺度空间?

在现实世界中,物体在不同尺度下,有着不同的结构。这就表明,我们如果从不同的尺度去观察同一个物体,会得出不一样的结果。比如,观察一棵树的适当尺度应该是“米”,而观察一片叶子可能需要更细粒度的尺度才能得出较好的结果。 当计算机系统要对一个未知的场景进行分析时,并不能够提前预知要用什么样的尺度来对图像信息中的兴趣结构(interesting structures)进行描述才是最合适的。因此,唯一可行的方案就是将多个不同尺度的描述都考虑进来,以便捕获未知的尺度变化。

尺度空间理论和生物视觉之间也有着十分密切的联系。哺乳动物的视网膜以及视觉皮层第一阶段所记录的接受场的分布,与许多尺度空间操作都高度近似。

参考链接:

https://en.wikipedia.org/wiki/Scale_space
http://opencv-python-tutroals.readthedocs.io/en/latest/py_tutorials/py_imgproc/py_pyramids/py_pyramids.html
https://en.wikipedia.org/wiki/Pyramid_(image_processing)

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,039评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,223评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,916评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,009评论 1 291
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,030评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,011评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,934评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,754评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,202评论 1 309
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,433评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,590评论 1 346
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,321评论 5 342
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,917评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,568评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,738评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,583评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,482评论 2 352

推荐阅读更多精彩内容

  • 不同图像灰度不同,边界处一般会有明显的边缘,利用此特征可以分割图像。需要说明的是:边缘和物体间的边界并不等同,边缘...
    大川无敌阅读 13,847评论 0 29
  • 转自:http://www.cnblogs.com/silence-hust/p/4193208.html关于用拉...
    Mordekaiser阅读 3,163评论 1 2
  • 本章介绍了基于elastix的基本配准概念。 更高级的配准主题将在第6章中讨论。图像配准是医学影像领域的重要工具。...
    peterpan_hai阅读 9,700评论 1 10
  • SIFT特征 SIFT(Scale-invariant feature transform)是一种检测局部特征算法...
    张博一阅读 12,436评论 0 6
  • 标签(空格分隔): Android 单元测试的好处:Martin Fowler在《重构》里面还解释了为什么单元测试...
    背影杀手不太冷阅读 5,821评论 3 25