爱情,能够让普通的日子变得熠熠生辉。感谢喜欢着别人的每一个人,是因为我们的目光,对方熠熠生辉。
项目背景
公司进行海报运营活动,需要判断用户是否确实在微信朋友圈向所有人分享了指定的海报, 我们用tensorFlow训练了一个模型来智能判定。现又提出需求,要求模型能够根据左上角的字来对海报进行分类。为了更快的响应运营需求,我花了半天用opencv-python做了一个临时分类服务,还有点意思,分享一下。
火花思维 | 火花AI课 |
---|---|
分类思路
- 把图片字样截取出来
- 用图片字样训练分类模型(logit)
- 进行预测
截取图片字样
import cv2
def cut_words(image):
image = image[0 : int(image.shape[0] / 6), 0 : int(image.shape[1] / 2)]
image_8bit = cv2.convertScaleAbs(image)
gray = cv2.cvtColor(image_8bit, cv2.COLOR_BGR2GRAY)
erode = cv2.erode(gray, np.ones((3, 2), np.uint8), iterations=3)
_, thresh = cv2.threshold(erode, 60, 255, cv2.THRESH_BINARY)
contours, _ = cv2.findContours(thresh, cv2.RETR_LIST, cv2.CHAIN_APPROX_NONE)
# filter the target contour
cv2.imwrite(output_path, image[min_y:max_y, min_x:max_x])
- 明确目标。
-
image[0 : int(image.shape[0] / 6), 0 : int(image.shape[1] / 2)]
, 字样一定在海报的左上角,所以第一步就截取出更小的图片操作,减少无关特征。 -
cv2.convertScaleAbs(image)
, 降低图片位数, opencv的基本操作,位数太高,操作不了... -
cv2.cvtColor(image_8bit, cv2.COLOR_BGR2GRAY)
, 更换颜色空间,基本操作。不同的颜色空间,方便做不一样的事情。灰度空间非常适合跟踪特点颜色的物体。
- 腐蚀图像
- 形态学操作,简单点说,腐蚀【erode】让黑的变黑,膨胀【dilate】让白的变白。
-
cv2.erode(gray, np.ones((3, 2), np.uint8), iterations=3)
, 海报中的字样是黑色,我们这里用腐蚀,让黑的变黑。- 第一个参数:灰度图片
- 第二个参数:像素框大小。从左上开始检查图片,如果每 3 * 2 个像素框内有黑色像素,则让整个像素框变黑。
- 第三个参数:迭代次数。用同样大小的像素框检查三次。
- 二极化
- 现在图片中还有很多颜色,为了更好的做edge detection(边界侦查),提高物体的对比度,我们把图片变成黑白两色。
-
cv2.threshold(erode, 60, 255, cv2.THRESH_BINARY)
, 这里有多种模式,挺长的,我百度了一个中文网站,感兴趣看看。
- 找轮廓
- 边界侦查,找轮廓。
-
cv2.findContours(thresh, cv2.RETR_LIST, cv2.CHAIN_APPROX_NONE)
, 这里也有很多模式,但是没那么有意思,主要原理是矩阵element wise相乘,感兴趣可以深入了解。
- 截取目标
- 选取轮廓的上下左右的最值,截成矩形图片。
训练和预测
-
cv2.resize(img, (max_x, max_y), interpolation=cv2.INTER_AREA)
, 把所有图片都变成一个大小; -
x = img.flat, y = 0
, 把图片摊平当作模型特征, 0, 1代表分类 -
clf = LogisticRegression(max_iter=10000).fit(x_train, y_train)
, 用logit训练模型 -
clf.predict(x_test)
, 预测结果
整个分类过程很简单,也很直接。20%的努力,换得80%的价值,体现了敏捷精神。
愿,每一位读者,都能收获幸福的爱情。