一般来说,我们都是处理固定大小的图片,但是有时候也会需要处理一个图像的不同分辨率的图片。比如在搜索图像里的某些元素的时候,比如脸,我们并不确认目标在图片里的大小。在这种情况下,我们可能需要创建一系列的不同分辨率的图片来在其中寻找目标。这些不同分辨率的图片叫做图片金字塔(因为他们从小到大堆在一起的时候像个金字塔)
有两种图像金字塔1)高斯金字塔 2)拉普拉斯金字塔
高斯金字塔的高级(低分辨率)是从低级别(高分辨率)的图像里移除连续的行和列来形成的。高级别理的每个像素是下级5个高斯权重的像素得到的。通过这种方法,一个M x N的图像变成了M/2 x N/2的图像。所以面积减小到了原来的四分之一。这被叫做Octave。同样的模式我们可以不断向上(减小分辨率)。同样的如果是扩大,编辑会变成原来级别的四倍。我们用cv2.pyrDown()和cv2.pyrUp()函数来找高斯金字塔。
img = cv2.imread('messi5.jpg')
lower_reso = cv2.pyrDown(higher_reso)
下面是图像金字塔的4级
现在你可以通过cv2.pyrUp()函数来沿图像金字塔向下
higher_reso2 = cv2.pyrUp(lower_reso)
记住,higher_reso2和higher_reso不同,因为一旦你降低了分辨率,你就丢失了图像信息,下面的图像是用前面最小的图片向金字塔下3级的结果。
拉普拉斯金字塔式从高斯金字塔得到的,没有单独的函数。拉普拉斯金字塔图像像是边缘图片,大部分元素是0.它被用在图像压缩上,拉普拉斯金字塔的一级是由那一级的高斯金字塔和他的更高一级的高斯金字塔的图像差别来生成的。拉普拉斯的三个级别可能是这样的:
用金字塔来混合图像
一个金字塔的应用是图像混合,比如拼接中,你可能会需要把两个图像堆到一起,不过可能会因为图像不连续而不好看,在这种情况下,用金字塔进行图像混合可以让图片无缝混合。一个典型的例子是混合两种水果,桔子和苹果。看下面的结果:
简单来说,它完成了下面这些工作:
1.加载两张图片,苹果和桔子的。
2.找到苹果和桔子的高斯金字塔(在这个例子里,一共6级)
3.从高斯金字塔找到拉普拉斯金字塔
4.把左半个苹果和右半个桔子在拉普拉斯金字塔的每个级别合起来
5.最后从这些图像金字塔里重建出原始图像。
import cv2
import numpy as np, sys
A = cv2.imread('apple.jpg')
B = cv2.imread('orange.jpg')
# generate Gaussian pyramid for A
G = A.copy()
gpA = [G]
for i in xrange(6):
G = cv2.pyrDown(G)
gpA.append(G)
# generate Gaussian pyramid for B
G = B.copy()
gpB = [G]
for i in xrange(6):
G = cv2.pyrDown(G)
gpB.append(G)
# generate Laplacian Pyramid for A
lpA = [gpA[5]]
for i in xrange(5,0,-1):
GE = cv2.pyrUp(gpA[i])
L = cv2.subtract(gpA[i-1],GE)
lpA.append(L)
# generate Laplacian Pyramid for B
lpB = [gpB[5]]
for i in xrange(5,0,-1):
GE = cv2.pyrUp(gpB[i])
L = cv2.subtract(gpB[i-1],GE)
lpB.append(L)
# Now add left and right halves of images in each level
LS = []
for la, lb in zip(lpA,lpB):
rows, cols, dpt=la.shape
ls = np.hstack((la[:,0:cols/2],lb[:,cols/2:]))
LS.append(ls)
# now reconstruct
ls_ = LS[0]
for i in xrange(1,6):
ls_ = cv2.pyrUp(ls_)
ls_ = cv2.add(ls_,LS[i])
# image with direct connecting each half
real = np.hstack((A[:,:cols/2],B[:,cols/2:]))
cv2.imwrite('Pyramid_blending2.jpg',ls_)
cv2.imwrite('Direct_blending.jpg',real)