机器学习-DUAL+Kernel SVM-2020-01-13

RECAP:

在hard-SVM里介绍,SVM的目标是:

DUAL-SVM的初衷:

这里介绍的是Hard-SVM,hard的意思就是线性可分,linear。但是并不是所有的资料都是线性可分,因此这里需要进行维度转换。将X换成\varphi(x),转换到多维空间去。

一方面,使用SVM,采取了margin的方法,只有在边界上的点才是SV Candidate,才可以Shatter。这种方法降低了复杂度,dvc=d+1;而另一方面,进行多维的装换,则是增加函数的复杂度和d的维度。因此,是否有一种方法,可以让转换和复杂度无关!

构造拉格朗日函数

原有:max \frac{1}{||w||}, s.t. \space \space y_n(wx_n+b)\geq 1

n=1,2,3,...N

转换1:max->min;转换2:x->z

转换为:min\frac{1}{2}ww^T , s.t. \space \space y_n(wz_n+b)\geq 1

引入拉格朗日因子:\alpha _n

L (w,b,\alpha )=\frac{1}{2}ww^T +\sum_{n=1}^N\alpha_n (1- y_n(wz_n+b))

把条件加上\alpha 假定 \alpha \geq 0。把条件藏在函数中。固定w,b,那么\alpha 是变量。需要找到一个最大的\alpha ,使得L最小。

如果这些Z的点落在边界margin之内,那么\sum_{n=1}^N\alpha_n (1- y_n(wz_n+b))>0-> 正无穷大

L则无最大值

只有那些Z的点落在margin上或者margin外的点,才能使

\sum_{n=1}^N\alpha_n (1- y_n(wz_n+b))\leq 0

L存在最大值。最大值就是当\sum_{n=1}^N\alpha_n (1- y_n(wz_n+b))=0 ,max=\frac{1}{2}ww^T

可以发现条件有已经藏在了公式当中。

对偶问题

原有问题:

那么当任意一个\alpha 来讲,max\geq any

选择一个\alpha ,那么不同的样本集,选择最好的\alpha ,也只能使得\geq ,选择=

这里发现,Min和max发生了对调。把min和max发生对调的行为,叫做对偶。实践证明,当满足一下条件时,使得\geq ,变成=。强对偶关系。

这时,公式就简化成为:

对b和w分别求偏导,并带入原有SVM中,可以发现,对于b和w都已经消除,因此现在只需要求解\alpha

原有max的问题,转化为min问题:

变化:从dvc=d+1个变量,转化成为N个变量,与维度无关;限制条件,从N变成N+1。几乎无变化

维度虽然从表面上消失了,但是却被藏在\alpha_n\alpha_my_ny_mz_nz_m的z_nz_m中

KKT条件

这里的KKT条件,就是之前提到过的强对偶关系的条件:

1. 首先保证:yn(1-(wz+b)\geq 1

2. 引入拉格朗日函数:\alpha_n\geq 0

3. 对偶的条件,求偏导:\sum  \alpha_ny_n=0, w=\sum\alpha_ny_nz_n

4. 互补松弛性条件(complementary slackness):\sum  \alpha_n(1-y_n(wz+b))=0

由于\alpha \geq 0,那么只能有:1-y_n(wz+b)=0

而改上式=0的条件,就是这些点在margin的边界上。

变化:之前在hard-SVM的时候,讲落在margin边界上的点,使得1-y_n(wz+b)=0,这些点是SV candidates。那么在dual-SVM的时候,讲当\alpha \geq 0,在1-y_n(wz+b)=0的点,落在margin的边界上。这些点才是SV.

那么:当求得最佳解\alpha 时,

可以得到W:w=\sum\alpha_ny_nz_n

可以得到b:b=y_n-wz(由于\alpha \geq 0),在margin的边界上找一个点即可算出b

因此对偶问题,只完成了将简化hard-SVM的第一步。将b,w的依存消失,只与\alpha 以及z_nz_m有关。那么z_nz_m由于是维度变换后到更高空间维度,需要将z一步步展开么?NO。这里用到Kernel。

Kernel-SVM

在对偶问题中,进步的地方在于,由3个维度的变化,w,b,\alpha ,从以dvc=d+1以高维度转换,变化成为只求一个\alpha ,并且将维度的问题从明处藏在了z_nz_m中。

z_nz_m的难度在于高维度转换+高维度转换后再做乘积。

简化z_nz_m

对于2维的Z空间

可以看到,z_nz_m最后也只有d+1的维度,和转换到高维无关。

将Kernel命名:K_\varphi =\varphi (x^T)\varphi (x),那么K_{\varphi_2} ={\varphi _2}(x^T){\varphi_2} (x)=1+X^TX+(X^TX)^2

将一组在margin边界上的SV点带入,利用之前偏导的结果:

可以求得b:b=y_n-\sum\alpha _ny_nK_{\varphi_2}

g_{svm}=sign(\sum\alpha_ny_nK+b)

至此,如果样本点在原有维度无法线性可分,那么可以进行高维转换。Kernel的结果与高维无关,只有dvc=d+1。至此,原有的疑点以及解决:

一方面,使用SVM,采取了margin的方法,只有在边界上的点才是SV Candidate,才可以Shatter。这种方法降低了复杂度,dvc=d+1;而另一方面,进行多维的装换,则是增加函数的复杂度和d的维度--Kernel只与原有维度的dvc=d+1有关。

普通多项式的2维转换:

\gamma 选择不同的数值,就意味着Kernel不一样。Kernel不一样,就意味着w,b不一样。w,b不一样,就意味着g_{svm}不一样,margin也不一样。margin不一样,就意味着SV也不一样。

因此不同的kernel=>不同的margin definition

在推广一下:对常数项和x进行放缩,那么K_2=(\xi +\gamma X^TX)^2

在推广一下:在Q维进行维度变换,那么K_Q=(\xi +\gamma X^TX)^Q; \space \space \xi \geq 0,\gamma  \geq 0

在1维空间的话,K_1=(0 +1* X^TX)^1

高斯Kernel

在上面poly-Kernel可以看到,z_nz_m的乘积,并不用全部展开,并且也不用在Z空间计算dvc。非常简化。这时,是否可以想象,如果Z空间的多项式是无限多的时候,是否z_nz_m也可以是一个简单的X空间dvc呢?

当Z空间是无限多维时,Kernel仍然是一个多项式。这就是高斯kernel

高斯Kernel是一个正态分布函数: K=exp(-\gamma ||x-x_n||^2)

xn是某一个SV,\gamma 是高度。因此当\gamma 越大时,峰值越高。容易出现overfitting。因此在高斯kernel中对\gamma 也要谨慎选择

小结:

二项式-Kernel:

优点:可以进行高维转换,进而高阶线性可分。高阶也只和X维度有关。

缺点:当(\xi +\gamma X^TX)>1时,K趋近无穷大

(\xi +\gamma X^TX)<1时,K趋近于0

有3个参数可以调整

因此,当进行选择时,尽量选择比较小的Q

高斯Kernel

优点:可以进行无限多维的转换,比较power。只有一个参数可以调整

缺点:不太好解释,没有W。容易overfitting

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 219,701评论 6 508
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,649评论 3 396
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 166,037评论 0 356
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,994评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,018评论 6 395
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,796评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,481评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,370评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,868评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,014评论 3 338
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,153评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,832评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,494评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,039评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,156评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,437评论 3 373
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,131评论 2 356

推荐阅读更多精彩内容