机器学习-西瓜书6章学习总结

支持向量机

间隔与支持向量

支持向量机基本理念:在样本空间中找到一个可以将不同类型的样本分开的超平面
划分超平面的选择原则:泛化性强、对噪声容忍度最高
=》结论:寻找两个类别正中间的、能将样本分为两类的超平面


西瓜书 支持向量与间隔.png

为了寻找这个超平面,需要寻找支持向量和间隔
支持向量是决定超平面位置,距离超平面最近的几个样本点
间隔是两类支持向量到达超平面的距离之和

对偶问题

(推导过程省略)
结论:支持向量机的模型只取决于支持向量(即部分样本点)
SMO:
1、选取一对变量i和j,固定其余参数

变量需要保证满足i对
西瓜书 KKT.png
违背程度最大,j与i间隔最大
2、求解
西瓜书 对偶函数.png
得到更新的i,j并循环

核函数

为了找到超平面,有时需要将样本空间投影到更高维空间中

西瓜书 定理6.1 .png

只要一个对称函数的核矩阵半正定,就可以作为核函数使用
常见核函数
1、线性核
2、多项式核
3、高斯核
4、拉普拉斯核
5、Sigmoid核
核函数和核函数的线性组合&直积也是核函数

软间隔与正则化

问题:很难找到一个超平面能完美分隔类型又保证不过拟合
解决方案:允许超平面在部分点上分类错误(软间隔)
选择软间隔时,损失函数为越阶函数,不便于求解,因此采用替代损失函数


西瓜书 替代损失函数.png

同时引入松弛变量来代表允许分类错误的程度

支持向量回归

定义:允许事实与预测值有误差,超过允许误差范围的才被记入损失
(即在分类区域两侧构建容忍带,在此范围内的样本都被认为分类正确)
结论:根据推导,支持向量必定在隔离带以外

核方法

定义:通过核化,将线性分类学习器扩展为非线性学习器

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容