【NO.1】KNN-算法

KNN（K-nearest-neighbor）-K最近邻算法

1、算法简介

1）已知训练样本（分类）；

2）对测试样本，基于某种距离度量找出训练样本中与其距离最近的K个样本；

3）基于K个训练样本中出现概率最高的类别作为测试样本的分类结果；

2、针对算法可以优化的内容：

1）距离度量方式：

2）K值得选取：

3、存在的问题：

1）高维样本空间下的样本稀疏、距离计算困难，这种情况下导致的维数灾难，引出了降维

2）降维效果的衡量，通常对比降维后学习器的性能是否优于降维前的性能，如果性能有所提升，通常称降维起到了效果

4、降维方法介绍

1)主成分分析（Principal Component Analysis）

2)核主成分分析（Kernelized Principal Componet Analysis）

基于核技巧对线性降维方法进行核化

3) 流行学习（借鉴拓扑流形概念）ff

a、等度量映射（涉及：Isomap算法）：高维空间往低维空间映射

b、局部线性嵌入（Locally Linear Embedding）

5、度量学习　

学习一个合适的距离度量

6、代码实现

待补充

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。