- 使用python,opencv库,numpy库
- 上一篇,简单介绍图像
- 用到的一些基本操作
此篇介绍一些图像处理常用的基础操作
像素处理
使用Numpy库中的函数zeros()可以生成一个元素值都是0的数组,并可以直接使用数组的索引对其进行访问、修改。
灰度图像:
import cv2
import numpy as np
img = np.zeros((256, 256)) # 生成256x256的零二维矩阵
print(img) # 会在控制台显示这个零矩阵
cv2.imshow("black", img) #显示创建好的灰度图像,我们知道,0表示黑色,255是白色
print(img[20, 20]) # 读取灰度图像[20,20]位置处的像素点的值
img[20, 20] = 255 # 修改该像素点,使其成为白色
cv2.imshow("the modified", img) # 显示修改后的灰度图像
cv2.waitKey()
cv2.destroyAllWindows() # 随意按键盘使图像销毁
零矩阵在控制台显示如下:
读取的[20,20]位置的值为0,就不放图了。
原图和修改一个点的图如下,白色与黑色对比还是很明显的,不过我还是圈出来了:)
彩色图像:
RGB模式的彩色图像在读入OpenCV内进行处理时,会按照行方向依次读取该RGB图像的B通道、G通道、R通道的像素点,并将像素点以行为单位存储在ndarray的列中。
例如,有一幅大小为R行×C列的原始RGB图像,其在OpenCV内以BGR模式的三维数组形式存储,如图:
如果我们要访问一个像素点,用img[0,0,0]来表示即可,前两个索引与灰度图像一样,表示行列,第三个索引表示通道,0就是B通道。其他操作与灰度图像相同。
我们还可以使用numpy.array访问像素,numpy.array提供了item()和itemset()函数来访问和修改像素值,而且这两个函数都是经过优化处理的,能够更大幅度地提高处理效率。在访问及修改像素点的值时,利用numpy.array提供的函数比直接使用索引要快得多,同时,这两个函数的可读性也更好。
格式为:
- item(行, 列)
- itemset(索引值, 新值)
使用方式:
import numpy as np
img = (此处省略,可以创建随机的灰度图像或者彩色,总是img变量就是一个图像矩阵)
# 如果是灰度图像
img.item(100, 100) # 读取一个点
img.itemset((100,100), 255) # 为该点赋新值
# 如果是彩色图像
img.item(100, 100, 0) # 对比灰度图像,需要再加一个通道索引
img.itemset((100, 100, 0), 255) # 赋值时也一样需要加通道
感兴趣区域(ROI)
在图像处理过程中,我们可能会对图像的某一个特定区域感兴趣,该区域被称为感兴趣区域(Region of Interest, ROI)。在设定感兴趣区域ROI后,就可以对该区域进行整体操作。例如,将一个感兴趣区域A赋值给变量B后,可以将该变量B赋值给另外一个区域C,从而达到在区域C内复制区域A的目的。
举个列子
获取堡垒的头部
原图是这样的
取其头部:
import cv2
Bastion = cv2.imread("Bastion.jpg", -1) # -1是保持原图格式不变的一个数值
head = Bastion[120:350, 150:350] # 就是这个代码,一看就懂了吧
cv2.imshow("head", head)
cv2.waitKey()
cv2.destroyAllWindows()
其实也就是截取一部分:
同样的,如果我们给头部位置赋值,那么头部就变成其他样子了,相当于打码了吧....(留个括号位置,之后学习学习好玩的马赛克)
通道操作
在图像处理过程中,可以根据需要对通道进行拆分和合并。在OpenCV中,既可以通过索引的方式拆分通道,也可以通过函数的方式拆分通道。
1.通过索引拆分
b = img[:, :, 0] # 获取图像B通道
g = img[:, :, 1]
r = omg[:, :, 2]
2.通过函数拆分
函数cv2.split()能够拆分图像的通道。
b, g, r = cv2.split(img)
#下面这个和上面是一样的
b = cv2.split(img)[0]
g = cv2.split(img)[1]
e = cv2.split(img)[2]
通道合并
合并是拆分的逆过程,可以把三个通道的灰度图像合成一副彩色图像。函数cv2.merge()可以实现图像通道的合并。
img = cv2.merge([b, g, r])
比如我们把堡垒图像的三个通道拆分,然后换个顺序再合并一下,看看是什么样子。
import cv2
Bastion = cv2.imread("Bastion.jpg", -1)
b, g, r = cv2.split(Bastion) # 通道拆分
Bastion_modified = cv2.merge([g, b, r]) # 通道顺序改变,再合成
cv2.imshow("original", Bastion)
cv2.imshow("b", b)
cv2.imshow("g", g)
cv2.imshow("r", r)
cv2.imshow("modified", Bastion_modified)
cv2.waitKey()
cv2.destroyAllWindows()
原图上面已经有了,不贴了。
B通道:
G通道:
R通道:
改变通道顺序合成的图像:
可以看到,图像发生了变化。
获取图像属性
图像属性,例如大小、类型。
常用属性
- shape:如果是彩色图像,则返回包含行数、列数、通道数的数组;如果是二值图像或者灰度图像,则仅返回行数和列数。通过该属性的返回值是否包含通道数,可以判断一幅图像是灰度图像(或二值图像)还是彩色图像。
- size:返回图像的像素数目。其值为“行×列×通道数”,灰度图像或者二值图像的通道数为1。
- dtype:返回图像的数据类型。
这些方法直接使用即可:
img.shape # 返回(行数,列数,通道数) 例如 (256,256,3) 灰度则为(256,256)
img.size # 返回 行数*列数*通道数 例如 65536
img.dtype # 返回类型 例如uint8
参考:
《OpenCV轻松入门:面向python》