什么是图像金字塔
图像金字塔是由一副图像的多个不同分辨率的子图所构成的图像集合。该组图像是由单个图像通过不断地降低采样所产生的,最小的图像可能仅仅只有一个像素点。如下图所示,分辨率从低到高,逐渐降低的图像集合。
通常level0是原图,每往上一层图像的宽高降低为原来的一半,以此类推。比如假如level0的原图宽高为N,那么level1的宽高就为N/2,得到的就是(N/2)*(N/2)大小的图像。最简单的金字塔是通过删除图像的偶数行或偶数列得到。
当然,也可以先对原始图像进行滤波,得到原始图像的近似图像,然后将近似图像的偶数行与偶数列删除以获取向下采样的结果。
至于滤波一般有以下两种选择:
(1)高斯滤波器:采用高斯滤波器对原图像滤波,得到高斯金字塔。
(2)领域滤波器:采用领域平均技术求原始图像的近似图像,得到平均金字塔。
高斯金字塔
在OpenCV中,它给我们提供函数cv2.pyrDown()实现高斯金字塔中的向下采样。其完整定义如下:
def pyrDown(src, dst=None, dstsize=None, borderType=None):
src:原始图像
dstsize:目标图像大小
borderType:边界类型,只支持BORDER_DEFAULT。
经过原理的介绍,我们知道输入图像的默认值为Size((src.cols+1)/2,(src.rows+1)/2),而高斯滤波器的矩阵如下所示:
当然,有高斯金字塔中的向下采样,自然也有高斯金字塔中的向上采样,在OpenCV中,该函数为cv2.pyrUp(),其完整定义如下:
def pyrUp(src, dst=None, dstsize=None, borderType=None):
至于参数是一样的,这里不在赘述,当然dstsize默认是Size(src.cols2,src.rows2)。
需要特别注意的是,虽然图像向下采样,在进行向上采样,会恢复到原来的图像大小。但是其都是不可逆的。也就说,在经历两次采样之后,得到的图像虽然大小一致,但二者像素并不一致,因为丢失的行列不可能无缘无故的生成。
拉普拉斯金字塔
虽然说,在使用高斯滤波器进行向下采样之后,在进行向上采样不能恢复原来的图像。但我们可以通过拉普拉斯金字塔来恢复原来的图像。因为这些丢失的信息,构成的就是拉普拉斯金字塔。
拉普拉斯金字塔的数学定义如下:
其中,Li表示拉普拉斯金字塔的第i层,Gi表示高斯金字塔中的第i层。
实战
既然我们了解了高斯金字塔与拉普拉斯金字塔的原理。下面,我们来通过高斯滤波器向下采样之后,在通过拉普拉斯金字塔恢复原图像。
具体代码如下所示:
import cv2
img = cv2.imread("23.jpg")
print(img.shape)
# 获取高斯金字塔
G1 = cv2.pyrDown(img)
# 获取拉普拉斯金字塔
L0 = img - cv2.pyrUp(G1)
# 恢复原图像
result1 = L0 + cv2.pyrUp(G1)
cv2.imshow("img", img)
cv2.imshow("G1", G1)
cv2.imshow("L1", L0)
cv2.imshow("result1", result1)
cv2.waitKey()
cv2.destroyAllWindows()
运行之后,效果如下所示: