第六章 支持向量机

间隔与支持向量

分类任务中,最基本的思想就是通过超平面,将不同类别的样本分开。

超平面就是一个n维空间向n-1维空间的一个投影,它比原来空间少一个自由度。超平面可以通过以下公式描述:
w^Tx+b=0
其中w是法相量,确定超平面的方向;b是位移项,确定超平面与原点之间的距离。例如:ax+by+cz+d=0为一个三位空间的平面,(a,b,c)向量就是该平面的法相量,与该平面内的任意向量相乘等于零。

理解了超平面,我们需要得到最佳的超平面来将样本进行划分,就是相对于各类样本都比较居中的平面,就需要通过距离来衡量。将超平面标记为(w,b),那么样本空间中任意一点x(w,b)的距离为:
r=\frac{\mid w^Tx+b \mid}{\mid\mid w \mid\mid}
如果超平面能够正确划分样本,对于(x_i,y_i) \in D就有:
\begin{cases} w^Tx+b >0,& y_i=+1;\\w^Tx+b<0,&y_i=-1; \end{cases}
通过w,b缩放,必有:
\begin{cases} w^Tx+b \geq+1,& y_i=+1;\\w^Tx+b \leq -1,&y_i=-1; \end{cases}
对于样本中那些使等号成立的点,称为支持向量,两类支持向量到超平面距离之和称为间隔,为:
\gamma =\frac2{\mid\mid w\mid\mid}
想要间隔最大,即在条件y_i(w^Tx_i+b) \geq1,i=1,2,\dots ,m.下:
max_{w,b}\frac2{\mid\mid w\mid\mid}
最大化||w||^{-1}等价于最小化||w||^2,重写上式,即在条件y_i(w^Tx_i+b) \geq1,i=1,2,\dots ,m.下:
min_{w,b}\frac12 \mid\mid w\mid\mid^2

对偶问题

凸函数是指函数在一定区间内,任意亮点之间连线,连线上的任意一点的值,大于其对应自变量处的函数值。可用公式描述为:
f(\lambda x_1+(1-\lambda)x_2)<

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 1. 章节主要内容 支持向量机是我认为的机器学习算法中最复杂的算法之一,又因为我在总结西瓜书内容的时候是秉持着尽量...
    闪电随笔阅读 9,047评论 0 25
  • 【概述】 SVM训练分类器的方法是寻找到超平面,使正负样本在超平面的两侧(分类正确性即“分得开”),且样本到超平面...
    sealaes阅读 13,846评论 0 7
  • 支持向量机 0.引言 本文主要参考了李航的《统计学习方法》。是本人学习支持向量机的学习笔记。首先对支持向量机做简单...
    吴金君阅读 4,948评论 2 5
  • 参考Jerrylead和july-支持向量机通俗导论 一、由逻辑回归,引申出SVM(线性可分的SVM) 1.1 逻...
    小碧小琳阅读 5,416评论 0 2
  • 班级情况 校区:科学创想机器人茂业店 时间:周日上午9-10点 学员:多多,天成,赵智慧,喧喧,朋朋 老师:张玲 ...
    乐搭阅读 3,199评论 0 0

友情链接更多精彩内容