【机器学习基础】对偶支持向量机

引言

在上一小节中,我们介绍,用二次规划的方法来求解支持向量机的问题。如果用非线性的特征转化的方式,可以在一个更复杂的Z空间里做二次规划。这种思想是希望通过最大间隔的方式来控制模型的复杂度,通过特征转换来实现复杂的边界。
但是这引入了新的问题:在进行特征转换之后,在新的高维空间中,求解二次规划问题就会变得很困难。甚至在无限大的维度上求解最佳化的问题就变得不可能了。
所以,这一小节,我们要解答的是,通过非常复杂的特征转换,甚至无限维的特征转换,该如何移除在Z空间上对高维度的依赖。

对偶问题

对于原始的SVM问题,进行特征转换之后,问题有d+1个变量(d为Z空间的维度),N个限制条件。我们要转化为一个对等的问题,在这种情况下,问题只有N个变量,N+1个限制条件。
所以,不管是变量的数量也好,条件的数量也好,都只有和数据量有关系,和转换到什么维度的空间中没有关系。变量的数量不会随着特征转换有所变化。

第一步:引入拉格朗日函数

SVM和正则化的思想有些类似,是求解一个有条件的最佳化问题。


由上面这个图可以知道,左侧是原始的有条件的最佳化问题,右侧是使用拉格朗日乘数αn >= 0将条件加入到表达式中去。
于是,我们得到了下面这个SVM表达式:

这个式子的意思是,当b和w向量固定的时候,调整α使得拉格朗日函数的值最大,然后再求一个最小值的问题。
下面再解释一下这里的max的过程:
当b和w是违反约束条件的,那么造成αn与一个正数相乘,对其求解一个最大值问题,只能得到一个无限大的值,这样再求解一个最小化的问题,就可以将这些违反条件的b和w排除掉
当b和w是符合约束条件的,那么造成αn与一个非正数相乘,就能得到一个有边界的最大值。

这一步,我们就可以将一个有条件的最佳化问题,通过拉格朗日乘数转换成一个表达式,从而方便后面的求解。

第二步:拉格朗日对偶问题的转化

对于一个给定的α,对拉格朗日函数的最大化的值总是大于任意一个拉格朗日函数的值,如下:


任何一个给定的α都会有上图的结果,于是我们对右边的式子去一个最大值的动作,就得到了下面的不等式:

这样看上去是将原来的式子的最大化和最小化作了一个交换,这被称为拉格朗日对偶问题。这样就得到了原来问题解法的下限。

强对偶关系需要满足条件

凸函数(convex primal)
原来的问题是有解的,在Z空间中可分(feasible primal)
线性条件(linear constraints)

如果满足上述强对偶关系的话,那么不等式的左右就是等价相等的了。于是,我们就可以来求解右边的问题。
右边的式子有个好处,本来,我们将约束条件通过拉格朗日乘数加入到求解问题中,但这样我们没有办法求解,现在对于max{min[L(b,w,α)]}来说,求解里面的最小化问题时α是固定的(可以看做一个常数),那么这就是一个凸二次规划问题,于是我们就可以用二次规划的方法来求解了。

第三步:化简


这是上面我们得到的式子进行展开的结果,接下来,我们要对其进行化简。

首先我们将拉格朗日函数L对b求偏微分,得到一个条件,化简了待求解的式子:




然后我们再将拉格朗日函数L对w求偏微分,得到另外一个条件,继续化简式子:




可以看到我们的化简结果,我们几乎将b和w都消去了,同时min也去掉了。最终得到了一个只有α的最佳化问题(拉格朗日对偶问题的简化版)!

KKT条件(b、w、α之间需要满足的条件):

第四步:求解

基于上面的化简,我们得到了标准的硬间隔svm对偶问题:


使用一般的二次规划的形式,来求解最佳解:



虽然,按照上面的二次规划形式去套用这个方法貌似很简单,但是对于数据量很大的情况,求解这个问题就需要很大的内存,所以需要特殊的专用方法来求解。

最后我们可以通过KKT条件和α来求解b和w:


得到w之后,通过KKT的这个条件,计算得到w:


αn > 0 的情况就对应于在边界上的支持向量。

对偶SVM传递的信息

通过上面的求解,我们将α和原始的SVM的支持向量关联上,即αn > 0 对应支持向量。



这样,我们只需要计算使用支持向量来计算w和b就可以了。


这里我们比较一下SVM和PLA算法,我们把SVM的w表示成数据yn*zn和αn的线性组合形式,其中αn是由对偶问题算出来的。
我们可以看出SVM和PLA最后得到的w都是原始数据的线性组合,这种情况我们可以说w可以被数据表示出来,而SVM不同的是,w只需要SVM中的支持向量表示出来就可以了。

小结

回到最初我们要解决的问题,我们通过对偶问题将待求解的问题的难度只依赖数据的数量N,但是其实我们发现在高维空间中,其维度隐藏在二次规划问题中的矩阵中去了。
那么我们该如何才能避开这个计算的难度呢?在下一节中,我们通过核技巧的方法来避免这个内积的计算。

转载请注明作者Jason Ding及其出处
Github博客主页(http://jasonding1354.github.io/)
CSDN博客(http://blog.csdn.net/jasonding1354)
简书主页(http://www.jianshu.com/users/2bd9b48f6ea8/latest_articles)
百度搜索jasonding1354进入我的博客主页

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,100评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,308评论 3 388
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,718评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,275评论 1 287
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,376评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,454评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,464评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,248评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,686评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,974评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,150评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,817评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,484评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,140评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,374评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,012评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,041评论 2 351

推荐阅读更多精彩内容

  • 【概述】 SVM训练分类器的方法是寻找到超平面,使正负样本在超平面的两侧(分类正确性即“分得开”),且样本到超平面...
    sealaes阅读 11,063评论 0 7
  • 机器学习是做NLP和计算机视觉这类应用算法的基础,虽然现在深度学习模型大行其道,但是懂一些传统算法的原理和它们之间...
    在河之简阅读 20,494评论 4 65
  • 引言 在上一小节中,我们介绍了核支持向量机。于是,不管是简单的问题还是复杂的问题,我们都可以做得到。然而,像高斯核...
    JasonDing阅读 8,290评论 0 8
  • 听到了另一个声音,从一则父亲把儿子的游戏机扔出去,孩子就跟着从楼上跳下去的新闻说开,中国的教育就是流氓教育! 只有...
    静馨_4aed阅读 116评论 0 1
  • 原来做自己喜欢做的事情真的会感动! 这段时间忙于装修,有两个月没去游泳了。今天晚上,不知道为什么,突然心血来潮地非...
    D076gege_长沙阅读 136评论 1 5