统计学习方法(李航)--第二章 感知机(比较基础)

感知机是二分类的线性分类模型,属于判别模型,包括原始形式和对偶形式。

(一)感知机模型

     公式为:


               f是输出,x是输入,w和b是参数,sign是符号函数(大于0为1,小于0为-1)

     几何解释:

          对于特征空间Rn中的一个超平面S,w是S的法向量,b是截距,将超平面空间划分为两个部分,完成2分类任务。

(二)学习策略

     1.数据集的线性可分性:若存在wx+b的超平面可以将数据集完全分割,则称为线性可分。

     2.学习策略(以下均假设数据集线性可分):

          损失函数:选择了误分类点到超平面的总距离(可以选择误分类点数量,但是不是一个连续可导的函数,故舍弃,不易优化)

          损失函数推导过程:


     基础算法过程:1.定义损失函数为


                            2.使用梯度下降算法,可计算出w,b的梯度分别为:


(求偏导数即可)

                            3.取误分类点,对w,b进行更新:


     3.算法的收敛性证明:


4.对偶形式算法:


          由于w,b均初始化为0,故模型为:


          其余算法步骤同上。

          此外,由于训练事例仅以内积形式存在,故可提前算好Gram矩阵。G=[xi*xj]N*N

(三)课后习题

Minsky和Papert指出:感知机是线性模型,所以不能表示复杂的函数。如异或(XOR),验证感知机为什么不能表示异或?

答:参考https://blog.csdn.net/sanmaopep/article/details/78542361


©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 【概述】 SVM训练分类器的方法是寻找到超平面,使正负样本在超平面的两侧(分类正确性即“分得开”),且样本到超平面...
    sealaes阅读 13,836评论 0 7
  • 【概述】 1、感知机模型特征:感知机对应于输入空间中将实例划分为正负两类的分离超平面,属于判别模型。 2、感知机策...
    sealaes阅读 8,307评论 2 3
  • 感知机 概述 感知机是二类分类的线性分类模型,其输入为实例的特征向量,输出为实例的类别,取+1和-1二值。感知机学...
    _Joe阅读 10,679评论 2 7
  • 注:题中所指的『机器学习』不包括『深度学习』。本篇文章以理论推导为主,不涉及代码实现。 前些日子定下了未来三年左右...
    我偏笑_NSNirvana阅读 40,374评论 12 145
  • 每天人们都在这浮躁的时代中穿流!为了理想,为了生活,为了自己的家庭,及家族…………还有很多!社会学中有很多东...
    侯森磊阅读 1,661评论 0 0

友情链接更多精彩内容