机器学习系列 - 10 SVM支持向量机

1.SVM原理与数据模型推导

支持向量机要解决的问题：就是找到一条合适的决策边界，决策边界越大越好。虽然说起来比较拗口，但是中心思想就是离决策边界最近的点到决策边界的距离尽可能地远。

1.1 定义及思想

将最优决策边界向上&下平移，在遇到第一个点时停下来，这个点被称为支撑向量Support Vector；支撑向量到决策边界的距离是d；这两条平移后的直线的间隔（2d）被称为最大间隔Margin。

支撑向量就是支撑着两条平移边界的点，我们只需要重点研究这几个支撑向量即可，这也是SVM名称的由来；Margin就是分界面可以移动的范围，范围越大表示容错能力越强。

所以我们可以看到，所谓的支撑向量机，最初就是一个线性分类器，只不过这个线性分类器不仅能把样本分对，可以最大化Margin。

1.2 优化目标

1.3 目标函数

1.4拉格朗日乘子法

1.5 SVM求解

2. 软间隔

2.1 为何需要软间隔

在线性可分问题中，对于样本点来说，存在一根直线可以将样本点划分，我们称之为Hard Margin SVM；但是（同样线性不可分），有时候会出现不那么完美，样本点会有一些噪声或者异常点，并不能完全分开。即没有一条直线可以将样本分成两类。那么就提出了Soft Margin SVM。

2.2 soft margin的思想