一、OpenCV-Python的安装
直接使用pip方法进行安装
pip install opencv-python
可能还会用到其他的库,这里一起安装。
pip install numpy
pip install matplotlib
直接使用pip可能会出现安装时下载速度较慢的问题,可以通过切换下载源来解决。切换下载源有两种方法:
1.在每次使用pip时声明下载源,如:
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple opencv-python
2.直接为pip设置下载源
在 C:\Users\xxx\ 下新建一个pip文件夹,在文件夹下新建一个pip.ini文件,pip.ini中写下如下文本即可
[grobal]
index-url=https://pypi.tuna.tsinghua.edu.cn/simple
其中index-url即为pip使用下载源,这里也可以还可以换成别的安装源,比如:
1.豆瓣http://pypi.douban.com/simple
2.阿里云http://mirrors.aliyun.com/pypi/simple
3.中科大http://pypi.mirrors.ustc.edu.cn/simple
4.清华https://pypi.tuna.tsinghua.edu.cn/simple
二、图片操作
这一部分将教我们学会怎样读入一幅图像,怎样显示一幅图像,以及如何保存一幅图像。
1.读入图像
使用函数 cv2.imread(filename, flags=None)
读入图像。第一个参数为需要读取的图片的路径;第二个参数时要告诉函数如何读取图片。
import cv2
img = cv2.imread('lena.jpg', cv2.IMREAD_COLOR)
cv2.imread()的第二参数:
- cv2.IMREAD_ANYCOLOR
- cv2.IMREAD_ANYDEPTH
- cv2.IMREAD_COLOR # 读入彩图
- cv2.IMREAD_GRAYSCALE # 读入灰度图
- cv2.IMREAD_IGNORE_ORIENTATION
- cv2.IMREAD_LOAD_GDAL
- cv2.IMREAD_REDUCED_COLOR_2 # 读入彩图并缩小到原来的1/2
- cv2.IMREAD_REDUCED_COLOR_4
- cv2.IMREAD_REDUCED_COLOR_8
- cv2.IMREAD_REDUCED_GRAYSCALE_2 # 读入灰度图并缩小到原来的1/2
- cv2.IMREAD_REDUCED_GTAYSCALE_4
- cv2.IMREAD_REDUCED_GRAYSCALE_8
- cv2.IMREAD_UNCHANGED
2.显示图像
使用函数 cv2.imshow(winname, mat)
显示图像。第一个参数为窗口的名字,随意设置;第二个参数为需要传入的图像。
import cv2
img = cv2.imread('lena.jpg', cv2.IMREAD_COLOR)
cv2.imshow('image', img)
cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(delay=None)
是一个键盘绑定函数,需要指出的是它的时间尺度是毫秒级。函数等待特定的几毫秒,看是否有键盘输入。特定的几毫秒之内,如果按下任意键,这个函数会返回按键的 ASCII 码值,程序将会继续运行。如果没有键盘输入,返回值为 -1,如果我们设置这个函数的参数为 0,那它将会无限期的等待键盘输入。它常被用来检测特定按键是否被按下。cv2.destroyAllWindows()
删除所有我们建立的窗口。如果想要删除特定的窗口可以使用cv2.destroyWindow(winname)
所以,上述代码表示显示一张图像,如果有按键输入,就关闭图像。
3.保存图像
使用函数 cv2.imwrite(filename, img, params=None)
来保存图像。
import cv2
img = cv2.imread('lena.jpg', cv2.IMREAD_GRAYSCALE)
cv2.imshow('image',img)
k = cv2.waitKey(0)&0xFF
if k == 27: # wait for ESC key to exit
cv2.destroyAllWindows()
elif k == ord('s'): # wait for 's' key to save and exit
cv2.imwrite('lena_gray.jpg',img)
cv2.destroyAllWindows()
如果电脑是64位系统,通常需要将 k = cv2.waitKey(0) 改成 k = cv2.waitKey(0)&0xFF
三、视频操作
这一部分主要是学习如何读取视频文件,如何显示视频和保存视频文件;另外还学习如何从摄像头获取并显示视频。
1.用摄像头捕获视频
我们经常会使用摄像头捕获实时图像,而OpenCV恰好为我们提供了一个简单的接口。
为了获取视频,我们应该线创建一个VideoCapture对象,即 cap = cv2.VideoCapture()
,它的参数可以是设备的索引号,也可以是一个视频文件。一般的笔记本电脑都有内置的摄像头,所以参数就是0。当然,我们也可以通过设置成1或者其他索引号来选择别的摄像头。这样,我们就可以一帧一帧地捕获视频了。另外,最后别忘了停止捕获视频。
import cv2
# 1.创建一个VideoCapture对象,使用笔记本电脑内置摄像头
cap = cv2.videoCapture(0)
while(Ture):
# 2.摄像头捕获一帧数据
ret, frame = cap.read()
# 3.显示一帧数据
cv2.imshow('frame', frame)
if(cv2.waitKey(1)&0xFF == ord('q')):
break
# 4.停止捕获视频
cap.release()
cv2.destroyAllWindows()
cap.read()
返回一个布尔值(True/False)。如果帧读取正确则返回True。所以这个函数通常被用来检查视频文件是否已经到了结尾。
另外几个重要的函数:
cap.get(propId)
获取视频地一些参数信息。这里的propId可以是0到18之间的任何整数。
propId参数
- CV_CAP_PROP_POS_MSEC视频文件的当前位置(以毫秒为单位)或视频捕获时间戳。—— 0
- CV_CAP_PROP_POS_FRAMES接下来要解码/捕获的帧的基于0的索引。—— 1
- CV_CAP_PROP_POS_AVI_RATIO视频文件的相对位置:0 - 电影的开始,1 - 电影的结尾。—— 2
- CV_CAP_PROP_FRAME_WIDTH视频流中帧的宽度。—— 3
- CV_CAP_PROP_FRAME_HEIGHT视频流中帧的高度。—— 4
- CV_CAP_PROP_FPS帧速率。—— 5
- CV_CAP_PROP_FOURCC编解码器的4字符代码。—— 6
- CV_CAP_PROP_FRAME_COUNT视频文件中的帧数。—— 7
- CV_CAP_PROP_FORMAT返回的Mat对象的格式retrieve()。—— 8
- CV_CAP_PROP_MODE指示当前捕获模式的特定于后端的值。—— 9
- CV_CAP_PROP_BRIGHTNESS图像的亮度(仅适用于相机)。—— 10
- CV_CAP_PROP_CONTRAST图像对比度(仅适用于相机)。—— 11
- CV_CAP_PROP_SATURATION图像的饱和度(仅适用于相机)。—— 12
- CV_CAP_PROP_HUE图像的色调(仅适用于相机)。—— 13
- CV_CAP_PROP_GAIN图像的增益(仅适用于相机)。—— 14
- CV_CAP_PROP_EXPOSURE曝光(仅适用于相机)。—— 15
- CV_CAP_PROP_CONVERT_RGB布尔标志,指示是否应将图像转换为RGB。—— 16
- CV_CAP_PROP_WHITE_BALANCE白平衡(当前不支持)—— 17
- CV_CAP_PROP_RECTIFICATION立体摄像机的整流标志(注意:目前仅支持DC1394 v 2.x后端)—— 18
cap.set(propId, value)
可以用来设置某些参数的值。比如可以通过使用 cap.set(3, 320)和cap.set(4, 240)将宽和高设置成320×240
cap.isOpened()
检查是否成功初始化摄像头设备,成功则返回True,否则则需要使用 cap.open()
开启。
2.从文件中播放视频
与从摄像头中捕获一样,只需要将设备索引号改成视频文件的名字即可播放视频文件。在播放每一帧时,使用 cv2.waiKey() 设置适当的持续时间。如果设置的太低视频就会播放的非常快,如果设置的太高就会播放的很慢(你可以使用这种方法控制视频的播放速度)。通常情况下 25 毫秒就可以了。
import cv2
cap = cv2.VideoCapture('vtest.avi')
while(cap.isOpened()):
ret, frame = cap.read()
# 转成灰度图
gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
cv2.imshow('frame',gray)
if cv2.waitKey(1) & 0xFF == ord('q'):
break
cap.release()
cv2.destroyAllWindows()
3.保存视频
在我们捕获视频,并对每一帧都进行加工之后我们想要保存这个视频。对于图片来时很简单只需要使用 cv2.imwrite()。但对于视频来说就要多做点工作。
我们要创建一个 VideoWriter 的对象。我们应该确定一个输出文件的名字。接下来指定 FourCC 编码(下面会介绍)。播放频率和帧的大小也都需要确定。最后一个是 isColor 标签。如果是 True,每一帧就是彩色图,否则就是灰度图。
FourCC 就是一个 4 字节码,用来确定视频的编码格式。可用的编码列表可以从fourcc.org查到。这是平台依赖的。下面这些编码器对我来说是有用个。
- In Fedora: DIVX, XVID, MJPG, X264, WMV1, WMV2. (XVID is more preferable. MJPG results in high size video. X264 givesvery small size video)
- In Windows: DIVX (More to be tested and added)
- In OSX : (I don’t have access to OSX. Can some one fill this?)
FourCC 码以下面的格式传给程序,以 MJPG 为例:
cv2.cv.FOURCC('M','J','P','G')
或者 cv2.cv.FOURCC(*'MJPG')
下面的代码是从摄像头中捕获视频,沿水平方向旋转每一帧并保存它。
import cv2
cap = cv2.VideoCapture(0)
fourcc = cv2.VideoWriter_fourcc(*'DIVX')
out = cv2.VideoWriter('output.avi',fourcc, 20.0, (640,480))
while(cap.isOpened()):
ret, frame = cap.read()
if ret==True:
frame = cv2.flip(frame,0) # 旋转
# 保存
out.write(frame)
cv2.imshow('frame',frame)
if cv2.waitKey(1) & 0xFF == ord('q'):
break
else:
break
cap.release()
out.release()
cv2.destroyAllWindows()