分类 - 简书

分类

K-近邻

步骤:
1、初始化距离为最大值
2、计算未知样本和每个训练样本的距离dist
3、得到目前k个最邻近样本中的最大距离maxdist
4、如果dist小于maxdist，则将该训练样本作为K-最邻近样本
5、重复步骤2～4，直到未知样本和所有训练样本的距离都算完
6、统计K个最邻近样本中每个类别出现的次数
7、选择出现频率最大的类别作为未知样本的类别

贝叶斯分类

贝叶斯定理能够告诉我们如何利用新证据修改已有看法。
原理：对于给出的待分项，求解在此项出现的条件下各个类别出现的概率，哪个最大，就认为此待分项属于哪个类别。
步骤：
1、设x = {a1,a2,...am}为一个待分项类，而每个a为x的一个特征属性
2、有类别集合C = {y1,y2,...yn}
3、计算P(y1|x)，P(y2|x),...P(yn|x)
4、如果P(yk|x) = max{P(y1|x)，P(y2|x),...P(yn|x)},则x属于yk

神经网络模型

神经网络通常需要训练，训练的过程就是网络进行学习的过程，训练改变了网络节点的连接权的值使其具有分类功能，经过训练的网络就可以用于对象的识别。
步骤：
1、令D={(x,y),i=1,2,...n}是训练样例集。
2、用随机值初始化权值向量w
3、对每个训练样例（x，y）计算预测输出y
4、对每个权值w更新权值wj = wj+r（yi-yik）xij
5、重复步骤3，4直至满足终止条件

逻辑斯蒂

判别分析原理

支持向量机

SVM：构建了一个分割两类的超平面，在构建过程中，SVM算法试图使两类之间的分割达到最大化。

决策树

最后编辑于：2018.09.06 18:53:26

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

分类

分类