"""
反向投影可以用来做图像分割,或者在图像中找寻我们感兴趣的部分。
反向投影就是首先计算某一特征的直方图模型,然后使用模型去寻找图像中存在的该特征。。如果把图像的某个区域含有特定和的纹理和物体,这个区域的的直方图就可以看作是一个函数,该函数返回某个像素属于这个特殊纹理或物体的概率;
它会输出与输入图像(待搜索)同样大小的图像,其中的每一个像素值代表了输入图像上对应点属于目标对象的概率。
输出图像中像素值越高(越白)的点就越可能代表我们要搜索的目标 (在输入图像所在的位置)。
直方图投影经常与camshift 算法等一起使用。
步骤:
1. 为一张包含我们要查找目标的图像创建直方图,我们要查找的对象要尽量占满这张图像。
最好使用颜色直方图,因为一个物体的颜色要比它的灰度能更好的被用来进行图像分割与对象识别。
2. 再把这个颜色直方图投影到输入图像中寻找我们的目标,
也就是找到输入图像中的每一个像素点的像素值在直方图中对应的概率,这样我们就得到一个概率图像。
3. 设置适当的阈值对概率图像进行二值化
"""
import cv2 as cv
import numpy as np
from matplotlib import pyplot as plt
# OpenCV 提供的函数 cv2.calcBackProject() 可以用来做直方图反向投影。
# 它的参数与函数 cv2.calcHist 的参数基本相同。其中的一个参数是我们要查找目标的直方图。
# 同样再使用目标的直方图做反向投影之前我们应该先对其做归一化处理。
# 返回的结果是一个概率图像
def back_projection_demo():
#首先将图像读进来,然后将其转成hsv色彩空间,然后形成2d直方图,对其进行归一化,输出结果对其反向投影
sample = cv.imread("C:/Users/tzting/Desktop/opencv-python/lena.png")
target = cv.imread("C:/Users/tzting/Desktop/opencv-python/example.png")
sample_hsv = cv.cvtColor(sample,cv.COLOR_BGR2HSV)
target_hsv = cv.cvtColor(sample,cv.COLOR_BGR2HSV)
cv.imshow("sample",sample)
cv.imshow("target",target)
roiHist = cv.calcHist([sample_hsv],[0,1],None,[100,256],[0,100,0,256])#计算样本直方图 [100,256]越小,效果越好
cv.normalize(roiHist,roiHist,0,255,cv.NORM_MINMAX)#0-255之间归一化
dst=cv.calcBackProject([target_hsv],[0,1],roiHist,[0,180,0,256],1)#1表示大小放缩 产生反向投影生成出来的图像
cv.imshow("backprojection_demo",dst)
# 2D直方图建立
def hist2d_demo(image):
hsv = cv.cvtColor(image,cv.COLOR_BGR2HSV)
hist =cv.calcHist([image],[0,1],None,[180,256],[0,100,0,256]) # 计算直方图
#cv.imshow("hist2d",hist)
plt.imshow(hist,interpolation='nearest') # 直方图必须是float32
plt.title("2D Histogram")
plt.show()
使用图像:
target:
最后结果:
备注:
1、使用[cv.calcHist()]函数来找出直方图。
cv.calcHist(images, channels, mask, histSize, ranges[, hist[, accumulate]])
例子:roiHist = cv.calcHist([sample_hsv],[0,1],None,[180,256],[0,100,0,256])
images : 它是uint8或float32类型的原图。它应该用方括号表示,即“[img]”。
channels : 它也在方括号中给出。它是我们计算直方图的通道索引。例如,如果输入的是灰度图像,则其值为[0]。对于彩色图像,可以通过[0]、[1]或[2]分别计算蓝色通道、绿色通道和红色通道的直方图。
mask : 遮罩图像,要找出完整图像的直方图,就把这个参数设为"None"。但如果你想要找出图像一部分的直方图的话,你必须创建一个遮罩图像,并且把它当做参数传入。(稍后我会展示一个例子。)
histSize : 这代表了我们抽屉的数量。需要在方括号中给出,如果要取全量,我们传入[256]。
ranges : 这是我们的区域。通常来说是[0,256]。
参考博客:https://blog.csdn.net/ssybc/article/details/84960863
2、 归一化就是要把需要处理的数据经过处理后(通过某种算法)限制在你需要的一定范围内。
归一化函数cv2.normalize:
normalize(src, dst[, alpha[, beta[, norm_type[, dtype[, mask]]]]]) -> dst
例子:cv.normalize(roiHist,roiHist,0,255,cv.NORM_MINMAX)
src->输入数组。
dst参数->输出与src相同大小的数组,支持原地运算
alpha->range normalization模式的最小值。
beta->range normalization模式的最大值,不用于norm normalization(范数归一化)模式。
norm_type参数->归一化的类型,norm_type参数可以有以下的取值:
NORM_MINMAX:数组的数值被平移或缩放到一个指定的范围,线性归一化,一般较常用。
NORM_INF:归一化数组的C-范数(绝对值的最大值)。
NORM_L1 :归一化数组的L1-范数(绝对值的和)。
NORM_L2 :归一化数组的(欧几里德)L2-范数。
参考博客:https://blog.csdn.net/solomon1558/article/details/44689611
3、反向投影用于在输入图像(通常较大)中查找特定图像(通常较小或者仅1个像素,以下将其称为模板图像)最匹配的点或者区域,也就是定位模板图像出现在输入图像的位置。
函数原型cv2.calcBackProject:
calcBackProject(images, channels, hist, ranges, scale[, dst]) -> dst
例子: dst=cv.calcBackProject(target_hsv,[0,1],roiHist,[0,180,0,256],1)
images参数表示输入图像(是HSV图像)。传入时应该用中括号[ ]括起来。
channels参数表示用于计算反向投影的通道列表,通道数必须与直方图维度相匹配。
hist参数表示输入的模板图像直方图。
ranges参数表示直方图中每个维度bin的取值范围 (即每个维度有多少个bin)。
scale参数表示可选输出反向投影的比例因子,一般取1。
参考博客:https://blog.csdn.net/keith_bb/article/details/70154219