分类

K-近邻

步骤:
1、初始化距离为最大值
2、计算未知样本和每个训练样本的距离dist
3、得到目前k个最邻近样本中的最大距离maxdist
4、如果dist小于maxdist,则将该训练样本作为K-最邻近样本
5、重复步骤2~4,直到未知样本和所有训练样本的距离都算完
6、统计K个最邻近样本中每个类别出现的次数
7、选择出现频率最大的类别作为未知样本的类别

贝叶斯分类

贝叶斯定理能够告诉我们如何利用新证据修改已有看法。
原理:对于给出的待分项,求解在此项出现的条件下各个类别出现的概率,哪个最大,就认为此待分项属于哪个类别。
步骤:
1、设x = {a1,a2,...am}为一个待分项类,而每个a为x的一个特征属性
2、有类别集合C = {y1,y2,...yn}
3、计算P(y1|x),P(y2|x),...P(yn|x)
4、如果P(yk|x) = max{P(y1|x),P(y2|x),...P(yn|x)},则x属于yk

神经网络模型

神经网络通常需要训练,训练的过程就是网络进行学习的过程,训练改变了网络节点的连接权的值使其具有分类功能,经过训练的网络就可以用于对象的识别。
步骤:
1、令D={(x,y),i=1,2,...n}是训练样例集。
2、用随机值初始化权值向量w
3、对每个训练样例(x,y)计算预测输出y
4、对每个权值w更新权值wj = wj+r(yi-yik)xij
5、重复步骤3,4直至满足终止条件

逻辑斯蒂
判别分析原理
支持向量机

SVM:构建了一个分割两类的超平面,在构建过程中,SVM算法试图使两类之间的分割达到最大化。

决策树
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容