登录注册写文章

感知机

感知机

感知机（perceptron）是二分类的线性分类模型，输入为实例的特征向量，输出为实例的类别（取+1和-1）。

感知机对应于输入空间中将实例划分为两类的分离超平面。

感知机旨在求出该超平面，为求得超平面导入了基于误分类的损失函数，利用梯度下降法对损失函数进行最优化（最优化）。

感知机的学习算法具有简单而易于实现的优点，分为原始形式和对偶形式。

感知机预测是用学习得到的感知机模型对新的实例进行预测的，因此属于判别模型。感知机由Rosenblatt于1957年提出的，是神经网络和支持向量机的基础。

感知机模型

数学原理

用数学的语言来说，如果我们有m个样本，如果我们有m个样本，每个样本对应于n维特征和一个二元类别输出，如下：

$(x_1^{(0)}, x_2^{(0)}, ...x_n^{(0)}, y_0), (x_1^{(1)}, x_2^{(1)}, ...x_n^{(1)},y_1), ... (x_1^{(m)}, x_2^{(m)}, ...x_n^{(m)}, y_m)$

目标是找到一个超平面，即

$\theta_0 + \theta_{1}x_1 + ... + \theta_{n}x_{n} = 0$

目标是让
某一类样本
$\theta_0 + \theta_{1}x_1 + ... + \theta_{n}x_{n} > 0$
另一类样本满足
$\theta_0 + \theta_{1}x_1 + ... + \theta_{n}x_{n} < 0$
从而得到线性可分。如果数据线性可分，这样的超平面一般都不是唯一的，也就是说感知机模型可以有多个解。

几何解释

感知机模型是线性分类模型，感知机模型的假设空间是定义在特征空间中的所有线性分类模型，即函数集合{f|f(x)=w·x+b}。

线性方程 $wx+b=0$ 对应于特征空间 $R^n$ 中的一个超平面 $S$ ，其中 $w$ 是超平面的法向量，b是超平面的截踞。这个超平面把特征空间划分为两部分。位于两侧的点分别为正负两类。超平面S称为分离超平面，如下图：

image

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

相关阅读更多精彩内容

统计学习方法之感知机
【概述】 1、感知机模型特征：感知机对应于输入空间中将实例划分为正负两类的分离超平面，属于判别模型。 2、感知机策...
sealaes阅读 8,360评论 2赞 3
知错能改的感知机(Perceptron)
感知机（perceptron）是二类分类的线性分类模型，其输入为实例的特征向量，输出为实例的类别，取+1和-1二值...
多了去的YangXuLei阅读 5,179评论 0赞 3

机器学习感知机（统计学习-李航）
感知机概述感知机是二类分类的线性分类模型，其输入为实例的特征向量，输出为实例的类别，取+1和-1二值。感知机学...
_Joe阅读 10,702评论 2赞 7
【算法周】哆啦A梦，我想要个“感知机”
欢迎大家关注公众号【哈希大数据】感知机可以说是最古老的分类方法之一了，在1957年就已经提出。今天看来它的分类模型...
哈希大数据阅读 3,339评论 0赞 0
行动也跟风吗？职场老鸟8年经验分享
我有个超自律的朋友朋友A在一家大型的外企互联网公司工作，时间自由，工作压力一般。所以A可以自由安排自己所有的时间...
艾米要奋进阅读 2,662评论 0赞 7

友情链接更多精彩内容

赞1赞

赞赏

手机看全文