(一)、什么是傅里叶变换
我们生活在时间的世界中,早上700起来吃早饭,800去挤地铁,900开始上班。。。以时间为参照就是时域分析。但是在频域中—切都是静止的。
傅里叶变换的作用:
高频:变化剧烈的灰度分量,例如边界。
低频:变化缓慢的灰度分量,例如一片大海。
滤波:
低通滤波器:只保留低频,会使得图像模糊。
高通滤波器:只保留高频,会使得图像细节增强。
——opencv中主要就是cv2.dft()和cv2.idft(),输入图像需要先转换成np.float32 格式。
——得到的结果中频率为0的部分会在左上角,通常要转换到中心位置,可以通过shift变换来实现。——cv2.dft()返回的结果是双通道的(实部,虚部),通常还需要转换成图像格式才能展示(0,255)。
(二)、理论部分
1、什么是频域
频域(frequency domain)是描述信号在频率方面特性时用到的一种坐标系。
傅里叶同学告诉我们,任何周期函数,都可以看作是不同振幅,不同相位正弦波的叠加。
你眼中看似落叶纷飞变化无常的世界,实际只是躺在上帝怀中一份早已谱好的乐章。
2、正弦波的叠加过程
正弦波的叠加:随着叠加的递增,所有正弦波中上升的部分逐渐让原本缓慢增加的曲线不断变陡,而所有正弦波中下降的部分又抵消了上升到最高处时继续上升的部分使其变为水平线。
用Python进行绘图:
import matplotlib.pyplot as plt
import numpy as np
# 定义X
x = np.arange(-3.14, 3.14, 0.02)
# 定义Y
y1 = np.sin(x)
y2 = 1 / 3 * np.sin(3 * x)
y3 = 1 / 5 * np.sin(5 * x)
y4 = 1 / 7 * np.sin(7 * x)
# 正弦波的叠加
y_plus_2 = y1 + y2
y_plus_3 = y1 + y2 + y3
y_plus_4 = y1 + y2 + y3 + y4
# 绘制函数图像
fig = plt.figure()
ax1 = fig.add_subplot(221) # top left
ax2 = fig.add_subplot(222) # top right
ax3 = fig.add_subplot(223) # bottom left
ax4 = fig.add_subplot(224) # bottom right
ax1.plot(x, y1)
ax2.plot(x, y_plus_2)
ax3.plot(x, y_plus_3)
ax4.plot(x, y_plus_4)
plt.show()
(三)、频域变换结果
1、cv2.dft(img, cv2.DFT_COMPLEX_OUTPUT):进行傅里叶变化
参数说明: img表示输入的图片, cv2.DFT_COMPLEX_OUTPUT表示进行傅里叶变化的方法
2、np.fft.fftshift(img):将图像中的低频部分移动到图像的中心
参数说明:img表示输入的图片
3、cv2.magnitude(x, y):将sqrt(x^2 + y^2) 计算矩阵维度的平方根
参数说明:需要进行x和y平方的数
4、np.fft.ifftshift(img):进图像的低频和高频部分移动到图像原来的位置
参数说明:img表示输入的图片
5、cv2.idft(img):进行傅里叶的逆变化
参数说明:img表示经过傅里叶变化后的图片
傅里叶变化:将图像从空间域转换为频率域, 下面是傅里叶变化的公式
程序测试:
import cv2
import numpy as np
import matplotlib.pyplot as plt
# 第一步读取图片
img = cv2.imread("img/test01.jpg", 0)
# 第二步:进行float32形式转换
float32_img = np.float32(img)
# 第三步: 使用cv2.dft进行傅里叶变化
dft_img = cv2.dft(float32_img, flags=cv2.DFT_COMPLEX_OUTPUT)
# 第四步:使用np.fft.shiftfft()将变化后的图像的低频转移到中心位置
dft_img_ce = np.fft.fftshift(dft_img)
# 第五步:使用cv2.magnitude将实部和虚部转换为实部,乘以20是为了使得结果更大
img_dft = 20 * np.log(cv2.magnitude(dft_img_ce[:, :, 0], dft_img_ce[:, :, 1]))
# 第六步:进行画图操作
plt.subplot(121)
plt.imshow(img, cmap='gray')
plt.subplot(122)
plt.imshow(img_dft, cmap='gray')
plt.show()
(四)、低通与高通滤波
只保留低频/高频,即进行低通滤波,因为高频表示是一些细节,即图像的轮廓和边缘,失去了高频部分,图像就容易变得模糊第一步:读取图片
第二步:np.float32进行类型转换
第三步:使用cv2.dft进行傅里叶变化
第四步:使用np.fft.fftshift 将低频/高频部分转换到图像的中心
第五步:构造掩模,使得掩模的中心位置为1,边缘位置为0
第六步:将掩模与傅里叶变换后的图像结合,只保留中心部分的低频/高频位置
第七步:使用np.fft.ifftshift将低频部分转移回图像的原先位置
第八步:使用cv2.idft进行傅里叶的反转换
第九步:使用cv2.magnitude将图像的实部和虚部转换为空间域内
第十步:进行作图操作
程序测试:
import cv2
import numpy as np
import matplotlib.pyplot as plt
# 第一步读取图片
img = cv2.imread("img/test01.jpg", 0)
# 第二步:进行数据类型转换
img_float = np.float32(img)
# 第三步:使用cv2.dft进行傅里叶变化
dft = cv2.dft(img_float, flags=cv2.DFT_COMPLEX_OUTPUT)
# 第四步:使用np.fft.fftshift将低频转移到图像中心
dft_center = np.fft.fftshift(dft)
# 第五步:定义掩模:生成的掩模中间为1周围为0,这是保留低频区域
crow, ccol = int(img.shape[0] / 2), int(img.shape[1] / 2) # 求得图像的中心点位置
mask_low = np.zeros((img.shape[0], img.shape[1], 2), np.uint8)
mask_low[crow - 30:crow + 30, ccol - 30:ccol + 30] = 1
mask_hight = np.ones((img.shape[0], img.shape[1], 2), np.uint8)
mask_hight[crow - 30:crow + 30, ccol - 30:ccol + 30] = 0
# 第六步:将掩模与傅里叶变化后图像相乘
# 保留中间部分 低通滤波器
mask_img_low = dft_center * mask_low
# 保留周围部分 高通滤波器
mask_img_hight = dft_center * mask_hight
# 第七步:使用np.fft.ifftshift
img_idf_low = np.fft.ifftshift(mask_img_low) # (将低频移动到原来的位置)
img_idf_hight = np.fft.ifftshift(mask_img_hight) # (将高频移动到原来的位置)
# 第八步:使用cv2.idft进行傅里叶的反变化
img_idf_low = cv2.idft(img_idf_low)
img_idf_hight = cv2.idft(img_idf_hight)
# 第九步:使用cv2.magnitude转化为空间域内
img_idf_low = cv2.magnitude(img_idf_low[:, :, 0], img_idf_low[:, :, 1])
img_idf_hight = cv2.magnitude(img_idf_hight[:, :, 0], img_idf_hight[:, :, 1])
# 第十步:进行绘图操作
plt.subplot(221)
plt.imshow(img, cmap='gray')
plt.subplot(222)
plt.imshow(img_idf_low, cmap='gray')
plt.subplot(223)
plt.imshow(img_idf_hight, cmap='gray')
plt.show()
为什么要转换到一个频域当中做处理?
当你检测图片中那些是高频的那些事低频的,在原始图形中做起来特别麻烦,但是如果转换到傅里叶变换的频域当中,这个频域当中的低频和高频层次分明,在这里面做变换特别容易。