机器学习技法-1~3讲

三条直线都正确,哪条直线最好:
image.png

会选择第三条,原因:
image.png

因此我们希望找一条胖胖的线


fatness也就是我们所说的margin,上图中的公式就可以写成



需要满足两点:

  • 可以把样本点正确分类
  • margin是样本点离直线的最近距离

目标: find largest-margin separating hyperplane
hypothesis表示为h(x) = sign(WTX+b)
点到直线的距离计算公式:


目标变为:

继续简化-放缩

min 公式=1的必要条件是 min 公式>=1,解等价。
把条件放松之后,目标变为:
image.png

接下来的任务
求解SVM

转变成二次规划的形式求解

SVM的理论保证:和之前学习过的正则化比较。


另一个方面
consider ‘large-margin algorithm’ Aρ :
either returns g with margin(g) ≥ ρ (if exists), or 0 otherwise


对偶问题2

拉格朗日函数:

原问题有条件-->无条件的


选出b,w

  • (坏的,1-y大于0 )结果会越大。无限大
  • (好的1-y小于0),结果a越小越好。
  1. 通过L函数,可以求得原问题的下限。(最大化和最小化做了交换)
  2. 满足一定条件(凸,有解,线性条件)。有强对偶关系,解等价。


    对偶问题
拉格朗日函数解法

经过推到,原问题解和a有关,满足三个条件
KKT条件

然后取负号:把最大化-->最小化;再把约束写到下面。把平方展开。专心求解a,w是一个藏起来的条件。然后用二次规划求解。


  • 存在问题:Q矩阵计算量太大了。用特别为SVM设计的二次规划形式。
  • 用KKT条件,求解出w和b。求解b的时候,选一个a!=0 时候计算。 注意到满足a>0的点,一定落在fat boundary上,这些点就是支持向量。
  • 支持向量的理解:
    • an >0的属于SV(在边界上的点)
    • w,b只靠SV算出来。其他的不重要。
SVM和PLA比较
总结
  • 原始问题,和在哪个空间有关,d~空间太大的时候就难解
  • 对偶问题,切换到a的空间,资料量的大小有关,通过最佳化,找出SV在哪,然后重建胖胖的边界。

第三讲kernel SVM ——简化dual SVM的计算量

弯弯曲曲的d的解决:用kernel。
kernel不同,几何定义不同,距离计算的方式不同。得到的边界不一样。

kernel SVM

使用无限多维?
可以。

线性的kernel(不做任何转换):
优点:

  1. 简单,安全
  2. 不涉及别的问题,所以可以设计特别的QP二次规划的解决办法
  3. 可以很容易的看出来machine怎么做分类的。哪些点重要

坏处:
有限制,当数据不是线性可分的时候。

线性核

polynomial kernel多项式核:
计算有困难,很多参数要选择,比较困难,心里有想好的Q的时候用

py核

高斯核-无限多维的转换

高斯核

自己定义的核函数:对称,求出来的K是半正定的

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 211,884评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,347评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,435评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,509评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,611评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,837评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,987评论 3 408
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,730评论 0 267
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,194评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,525评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,664评论 1 340
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,334评论 4 330
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,944评论 3 313
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,764评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,997评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,389评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,554评论 2 349

推荐阅读更多精彩内容

  • 本文参考整理了Coursera上由NTU的林轩田讲授的《机器学习技法》课程的第三章的内容,主要介绍了Kernel ...
    sonack阅读 18,039评论 2 10
  • 本文参考整理了Coursera上由NTU的林轩田讲授的《机器学习技法》课程的第二章的内容,主要介绍了Hard Ma...
    sonack阅读 14,782评论 0 11
  • 《机器学习技法》是国立台湾大学林轩田讲授的一门课程,课程的上集是《机器学习基石》。相关资源可以在youtube找到...
    宣的写字台阅读 1,638评论 0 1
  • 本文参考整理了Coursera上由NTU的林轩田讲授的《机器学习技法》课程的第四章的内容,主要介绍了Soft-Ma...
    sonack阅读 10,668评论 1 6
  • 作者:彭星华 时间:2017-06-23 突然间发现,很多患肝胆疾病的,尤其是肝胆恶性肿瘤的患者有一个共同的特点:...
    d5453aa66e9b阅读 772评论 0 5