机器学习入门(二十)——SVM(1)

1.0 什么是SVM

1.1 分类中的不适定问题

        简单的分类问题例子:在二维的特征平面中,已有一条决策边界将所有的数据点分两类,即蓝色圆形和黄色三角。

        但实际上,可以找到多条决策边界完成相同的分类结果,这就所谓的“不适定问题”。“不适定问题”会影响模型的泛化性。比如在下图的分类中,被黄色箭头标出的点被决策边界划为蓝色圆点,但实际上它和黄色三角更近一些,这个点就是决策的“损失”。

        事实上,一般分类模型都具有不适定问题,如最常用的logistics模型。为了解决或减弱不适定问题的对模型泛化能力的影响,就引出了SVM。

1.2 SVM的决策边界

        SVM在寻找决策边界时,要求边界距离两个分类都尽可能的远。如下图所示:离决策边界最近的点到决策边界的距离尽可能地远。此时就可以忽略其他大部分的数据点,只关注靠近决策边界的几个特殊点即可。

1.3 SVM的定义

        仍以上图为例,将最优决策边界向上和下平移,在遇到第一个点时停下来,这个点被称为支撑向量Support Vector;支撑向量到决策边界的距离是d;这两条平移后的直线的间隔(2d)被称为最大间隔Margin。

        支撑向量就是支撑着两条平移边界的点,解决分类问题只需要重点研究支撑向量即可,这就是SVM名称的由来;Margin就是分界面可以移动的范围,范围越大表示容错能力越强。

        所以支撑向量机的本质就是一个线性分类器,只不过这个线性分类器不仅能把样本分对,还可以最大化Margin。

2.0 SVM的目标函数

        由SVM的定义可知,SVM就是要找到使得margin最大的决策边界,那么就可以将SVM转化为一个最优化问题。

2.1 Margin的函数表达

        Margin是支撑向量到决策边界的距离。由空间几何知识可得在二维空间里,点到线的距离公式:

d=\frac{\vert Ax+By+C \vert }{\sqrt[2]{A^2+B^2} }

        拓展到n维空间,点x到 w^Tx+b=0(其中w为n为向量,即x的系数矩阵,b为截距)的距离为d=\frac{w^Tx+b}{\vert\vert w \vert \vert } \vert\vert w \vert \vert=\sqrt[2]{w_1^2+w_2^2+...w_n^2}

        则margin的范围为 2d=\frac{2\vert w^Tx+b\vert }{\vert\vert w \vert \vert }

2.2 决策边界的函数表达

        如下图所示,假设最优决策边界,下方margin边界,上方的margin边界分别为:w^Tx+b=0w^Tx+b=-1w^Tx+b=1

        于是得到函数方程组,该方程组的含义为:过所有点作与边界平行的直线,这些直线都应当是在margin边界之外,即所有点都要在margin之外:

        进步一可得:y_i(w^Tx_i+b)\geq 1。取临界值带入margin的函数式,简化为 2d=\frac{2}{\vert\vert w \vert \vert } ,此时求最大决策空间max(\frac{2}{\vert\vert w \vert \vert } ),就转换为求min(\frac{1}{2} w^Tw)

        综上,得到SVM的最优化问题:

\Phi (x)=\frac{1}{2} w^Tw=\frac{1}{2}\vert\vert w\vert \vert ^2 ,      s.t.   y_i(w^Tx_i+b)\geq 1

3.0 求解SVM最优化问题

        SVM的最优化问题属于有约束条件的最优问题,使用拉格朗日乘数法构造目标函数:

L_p=\frac{1}{2} \vert \vert w \vert  \vert ^2-\sum_{i=1}^la_iy_i(w^Tx_i+b)+\sum_{i=1}^la_ia_i\geq 0

        SVM的目标就是求L_p的最小值。

        对L_p分别对wb求导,得:

\frac{d L_p}{d w} =w-\sum_{i=1}^la_iy_ix_i=0   \implies   w=\sum_{i=1}^la_iy_ix_i

\frac{d L_p}{d b} =-\sum_{i=1}^la_iy_i=0   \implies    \sum_{i=1}^la_iy_i=0

        将上面两个推导结果带入目标函数L_p中,得到一个新的目标函数L_D

L_D=\sum_{i}^l a_i-\frac{1}{2} \sum_{i,j}^la_ia_jy_iy_jx_i·x_j=\sum_{i}^l a_i-\frac{1}{2} a^THa

        其中H_{i,j}=y_iy_jx_i·x_ja_i\geq 0

        L_DL_p是对偶问题,在SVM的情况下,二者是等价的,对L_D求解即可。

        求解方程,得到的a中,大部分都为0,少部分非0,非0的就是支撑向量的系数,因为SVM只研究支撑向量。

        前面求导已经得到得到w=\sum_{i=1}^l a_iy_ix_i,再将w带入到约束条件中y_i(w^Tx+b)=1,等式两边同时乘以y_i,y_i^2 (w^Tx_i+b)=y_i。由于y_i=\pm 1,于是有b= y_i-w^Tx_i。(从上图可以看出b对于任意x_i来说是相同的,因此选择任一点就可算出b)。

4.0 SVM求解示例

        假设在二维空间中有两个样本,(1,1,1)(0,0,-1),则对于样本1有x_1=(1,1)y_1=1;对于样本2有x_2=(0,0)y_2=-1

        根据约束条件\sum_{i=1}^la_iy_i=0得,a_1y_1+a_2y_2=a_1-a_2=0,于是有a_1=a_2

        根据H_{i,j}=y_iy_jx_i·x_j,得到:

        于是L_D = \sum_{i=1}^2 a_i-\frac{1}{2} [a_1,a_2]H[a_1,a_2]^T=2a_1-a_1^2

        求L_D的最大值,求导解得a_1=a_2=1

        将a_1a_2代入w=\sum_{i=1}^la_iy_ix_i,得w^T=[1,1]

        进一步计算b= y_i-w^Tx_i。取x^{(1)}时,b=1-[1,1][1,1]^T=1-2=-1;取x_1时,b=-1-[1,1][0,0]^T=-1-0=-1,结果是相同的。

        最终得到决策边界:\Phi (x)=w^Tx+b=[1,1][x_1, x_2]^T+b=x_1+x_2-1。margin区间为M=\frac{2}{\vert \vert w \vert  \vert } =\frac{2}{\sqrt{2} } =\sqrt{2}

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,547评论 6 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,399评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,428评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,599评论 1 274
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,612评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,577评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,941评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,603评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,852评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,605评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,693评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,375评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,955评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,936评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,172评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,970评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,414评论 2 342