超平面用方程表示为
1.问题求解:
(1)拉格朗日乘子法
定义拉格朗日函数
,
KKT条件为:
求极值,则令
得到:
代入消去
和
,得到原问题的对偶问题为
由KKT条件得到:对于任意训练样本总有
或
,这就意味着当
时,该样本并不会对
产生而任何影响,当
时,此时意味着训练样本在最大间隔的边界上,该样本点称之为支持向量。
(2)对偶问题求解:
**
2.核函数
假设样本线性可分,即存在一个超平面对样本进行分类。而实际任务中,样本往往是非线性可分。此时,我们将映射到高维特征空间,在特征空间中找到超平面使得样本线性可分,记
为
映射到高维特征空间所对应的特征向量。
因此,对应的模型可以表示为
实际只需要求解如下函数:
对偶问题为:
当特征空间维度很高时,计算困难,故定义核函数
使得
,
则对偶问题重写为:
求解该对偶问题得到
3.软间隔
前面介绍的支持向量机形式是要求所有样本均满足约束
, 即所有样本都必须划分正确,这称为"硬间隔" (hard margin),而软间隔则是允许某些样本不满足约束。当然我们是希望这样不满足约束的样本越少越好。因此目标函数定义为
,其中
由于非凸、非连续,常用其他损失函数替代,如下图所示:
采用hinge损失得到:
引入松弛变量得到:
软间隔支持向量机
采用拉格朗日乘子法
,求极值,令
带入L得到原问题的对偶问题为:
KKT条件要求:
由此可得:
对于任意
,当
时, 该样本不会对
产生任何影响;当
时,必有
,此时该样本是支持向量。当
时,
,则
,此时样本处于最大间隔边界上,当
时,
,则
;若
,样本被错误分类;若
,样本落在最大间隔内部。
软间隔支持向量机模型仅与支持向量有关。
4.支持向量回归
(1)考虑与
最多允许有
的误差
(2)构建宽度为的间隔带,如图:
目标函数:
可允许间隔带两侧的松弛程度有所不同,故引入松弛变量
拉格朗日乘子法
代入L,得到SVR的对偶问题:
KKT条件为:
当且仅当
,
为非零;当且仅当
,
为非零.换言之,样本
没有落在
-间隔带时,
和
为非零。此外,
和
不能同时成立。因此,
和
至少有一个为零。
由可知,只有
非零时,
为SVR的支持向量,且落在
-间隔带之外。落在
-间隔带中的样本,满足
5.支持向量机与KNN
**