HoG特征SVM物品识别系统

公式完整版渲染请移步个人博客

系统架构

structure.png

该系统仍然是基于滑动框+传统机器学习的目标识别系统,分为两个主要部分:

  • HoG特征提取:从滑动框中提取出的子图中提取HoG特征
  • 支持向量机(SVM):以子图的HoG特征为输入,判断该子图中是否有物品

HoG特征

该系统的最大贡献为提出基于梯度的HoG(locally normalized Histogram of Oriented Gradient)特征,该特征的计算流程分为5步,分别如下所示:

hog.png

归一化

归一化目的是去除光线的影响,gamma校正的公式如下所示:
y(x,y) = I(x,y)^{gamma}
原论文尝试了多种输入方法,包括灰度图像和彩色图像与是否gamma校正的组合,由于这一步对最终结果影响很小,因此最终默认为使用彩色输入,不进行gamma校正。

梯度计算

梯度的计算使用相邻或不相邻的像素值相减获得,两个方向的梯度和计算出整体梯度的角度和模。原论文尝试了多种计算方法,最终使用的计算方法如下所示:

$$
grad_x(x,y) = I(x+1,y) - I(x-1,y) \\
grad_y(x,y) = I(x,y+1) - I(x,y-1) \\
||grad(x,y)|| = \sqrt{grad_x(x,y)^2 + grad_y(x,y)^2} \\
grad_{\theta}(x,y) = arctan(\cfrac{grad_y(x,y)}{grad_x(x,y)})
$$

其中grad_x(x,y)grad_y(x,y)的计算方法分别是与及其[-1,0,1]转置与这一步的输入图片卷积。若输入图片的输入通道不为1,那么将其所有通道的数据组合到一个向量中。

直方特征统计

该步骤是引入非线性的关键步骤,该步骤是基于一种被称为cell的结构,一个cell由一个正方形的块覆盖的像素组成,论文中使用的cell尺寸为4x4。对于一个cell中的所有像素统计一种直方图,该直方图的横轴为梯度方向,纵轴为梯度模,如下图所示:

hog_binning.png

角度落在相同区间的梯度的模累加,作为该区间的结果。上图为0~180度分为4个区域的划分,最终产生四个数据,分别是角度落在四个角度区域的梯度的模之和。原论文中,角度区域的划分方法对最终结果有一定的影响,最终试验后使用0~180度划分9个区域的划分方法(每个20度),每个cell产生9个数据。

特征归一化

特征的归一化基于block结构,该结构由一些cell组成,分为R-HoG和C-HoG两种。其中R-HoG应用较多,由相邻的构成方形的cell,block可以相互重叠,可以参考重叠的池化。C-HoG的block为圆形,未能找到资料,且论文描述较含糊。属于一个block的所有cell的数据组成一个向量。

标准化中,基于block的标准化使用cell组成的向量标准化,可以使用L2-Hys,L2标准化和带开方的L1标准化。L1与L2标准化如下所示:

$$
L1:v = \sqrt{\cfrac{v}{||v||_1 + e}} \\
L2:v = \cfrac{v}{\sqrt{||v||_2^2+e}}
$$

其中v为待标准化向量,e为为了防止除0的很小的常数。L2-Hys标准化首先进行L2标准化,对结果进行截短,再进行L2标准化,以上所述的标准化方法对结果影响均不大,论文中使用L2-Hys标准化。

除了这种标准化方式,论文中还提到了基于周围cell的标准化方式,但效果不佳。

组合特征

特征计算完成后,将所有block特征组合为一个向量,该向量即为后端SVM的输入。

SVM(支持向量机)

使用支持向量机判断候选框中是否有物品,支持向量机的输入为组合成向量的HoG特征,输出为是否是待检测物品。

代码实践

import cv2


def detectFaces(img):
    hog = cv2.HOGDescriptor()
    if img.ndim == 3:
        gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    else:
        gray = img

    faces, _ = hog.detectMultiScale(
        gray)
    print(faces)
    result = []
    for (x, y, width, height) in faces:
        result.append((x, y, x + width, y + height))
    return result


def drawFaces(img, draw, color=(255, 0, 0)):
    for (x1, y1, x2, y2) in draw:
        cv2.rectangle(img, (x1, y1), (x2, y2), color, 2)
    return img

if __name__ == '__main__':
    cap = cv2.VideoCapture(0)
    while(1):
        # get a frame
        ret, frame = cap.read()

        frame_face1 = detectFaces(frame)
        # frame_face2 = detectFaces(
        #     frame, "./haarcascades/haarcascade_profileface.xml")
        # frame_eye = detectFaces(
        #     frame, "./haarcascades/haarcascade_mcs_nose.xml")
        # frame_nose = detectFaces(
        #     frame, "./haarcascades/haarcascade_mcs_rightear.xml")

        frame = drawFaces(frame, frame_face1)
        # frame = drawFaces(frame, frame_face2, (0, 255, 0))
        # frame = drawFaces(frame, frame_eye, (0, 0, 255))
        # frame = drawFaces(frame, frame_nose, (255, 0, 255))

        cv2.imshow("capture", frame)
        if cv2.waitKey(1) == 0:
            break
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,922评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,591评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,546评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,467评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,553评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,580评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,588评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,334评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,780评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,092评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,270评论 1 344
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,925评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,573评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,194评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,437评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,154评论 2 366
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,127评论 2 352

推荐阅读更多精彩内容