【机器学习基础】核支持向量机

引言

在上一小节中,我们介绍了SVM的对偶形式,该形式也可以使用二次规划的方式来求解。
这个对偶形式告诉我们SVM背后的一些集合意义,再者,有了这个对偶问题,我们要求解的难度和转换的高维空间的维度好像没有关系。
在这一小节中,我们就之前未解决的问题继续探讨,使用核技巧的方式高效求解SVM。

核技巧(Kernel Trick)

在上一小节二次规划问题中的Q矩阵的求解中,我们要计算Z空间的两个向量的内积,这个计算可以看做是先将向量x进行空间转换得到高维向量z,然后再做内积。但是,如果我们可以将这两步合起来,使得计算的更快一点。

下面,我们以二次转换作为例子:




这样的转换和内积的计算复杂度从一步一步计算的O(d^2)变成了O(d)。

这样,我们就可以使用核函数来作内积的计算,用下面的几个式子代替原来的形式:




下面归纳出使用核函数来作SVM问题的算法步骤:


多项式核


从上面的图片可以看出,这些都是使用了二次多项式核函数,但是其中的系数有所不同。
我们要明白一点,它们对应到同一个空间,它们做事情的能力是一样的,但是不同的系数导致了不同的内积。不同的内积就定义了不同的距离,而不同的距离就有不同的几何特性,那么计算得到的边界就会有不同。
从上图中,我们发现相近的核函数改变其系数,其几何定义就不同了,那么边界的定义就会不同,支持向量的数量也不一样了。

由此,我们得到了更广义的多项式核函数的形式:


高斯核

下面我们有个更加疯狂的想法,就是可不可以通过核函数来实现无限维的转换?
我们假设x向量只有一个维度,我们使用高斯函数来计算x和x'的差,下面的推导说明这个转换是无限维的。
这里,我们用到了exp函数的泰勒展开。


下面是高斯核函数的定义:




我们看到高斯核SVM相当于以支持向量为中心的高斯函数的线性组合。
高斯核函数也被称作是径向基核函数(Radial Basis Function Kernel)。Radial表示像高斯一样,从某个中心放射出去的函数;Basis Function表示拿来做线性组合的。

虽然高斯核有强大的能力,但是依然存在潜在的问题,高斯核不同的参数会导致不同结果。当参数γ太大的时候,会造成高斯变尖(sharp Gaussians),造成过拟合的情况。


支持向量和核技巧的机制

现在我们可以做到超平面+特征转换(用核方法有效快速计算)+最大间隔(控制模型的复杂度)
这里我们做到了,不再使用变换Φ显式的计算高维向量,而是使用Kernel;还有,不再存Z空间中的w,而是存表示这个w的支持向量和这个线性组合的系数αn。

不同核函数的比较

线性核:

优点:
线性优先考虑,安全不易过拟合
使用特定二次规划方法快速求解
直观
缺点:
在线性不可分的情况下使用受限


多项式核:

优点:
比线性核限制少
通过设定Q来控制模型
缺点:
Q很大的时候,数值计算复杂
参数比较多,选择起来比较麻烦


高斯核:

优点:
能力强大,可以求解更加复杂的边界
数值变化范围小
只有一个参数,比较好选择
缺点:
无限多维,缺乏物理意义,从来不计算出w
比线性的计算慢
会出现过拟合情况


Mercer's Condition

核函数需要满足一定条件:将数据写成核矩阵的情况,核矩阵首先是对称的(因为内积运算是对称可交换的),其次这个矩阵要求是半正定的。


转载请注明作者Jason Ding及其出处
GitCafe博客主页(http://jasonding1354.gitcafe.io/)
Github博客主页(http://jasonding1354.github.io/)
CSDN博客(http://blog.csdn.net/jasonding1354)
简书主页(http://www.jianshu.com/users/2bd9b48f6ea8/latest_articles)
百度搜索jasonding1354进入我的博客主页

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,053评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,527评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,779评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,685评论 1 276
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,699评论 5 366
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,609评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,989评论 3 396
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,654评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,890评论 1 298
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,634评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,716评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,394评论 4 319
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,976评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,950评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,191评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,849评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,458评论 2 342

推荐阅读更多精彩内容