登录注册写文章

机器学习读书笔记 — KNN

爱秋刀鱼的猫

机器学习读书笔记 — KNN

1.KNN
kNN是一种分类的算法，这个算法的思路非常简单。对于给定的训练数据集，对于新输入的实例，在训练数据集中找打与该实例最临近的k个实例，在这k个实例里面，多数属于某一类的话，就把这个实例归于某一类。

如果k=3 ，那么从所有的点里面找到离新输入的实例最近的三个点。如下图所示。那么在这三个点里面，多数的点属于三角类。那么就认为新输入的点属于三角类。

image.png

如果k=5，那么从所有的点里面找到离新输入的实例最近的五个点。如下图所示，那么在这三个点里面，多数的点属于圆圈类。那么就认为新输入的点属于圆圈类。

image.png

KNN的算法本身是比较简单的，对于上面的例子，选择k=3还是k=5是一个完全不同的结果。KNN算法的核心在于选择合适的k值。

kd树
knn在计算的时候，需要计算待分类的样本点到所有样本的距离之后，才能找到最近的前k个点。最简单的办法就是线性扫描，这样做的缺点是计算开销比较大。解决的办法就是使用kd树（k-dimensional树的简称）的方法。

构建kd树

搜索kd树

参考文献

李航《统计学习方法》

最后编辑于：2018.04.24 11:27:54

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

机器学习算法核心思想总结
一.朴素贝叶斯 1.分类理论朴素贝叶斯是一种基于贝叶斯定理和特征条件独立性假设的多分类的机器学习方法，所...
wlj1107阅读 3,212评论 0赞 5
分类算法之K最近邻算法(KNN)的python实现
分类算法之K最近邻算法(KNN)的Python实现 KNN的定义所谓K近邻算法，即是给定一个训练数据集，对新的输...
盗梦者_56f2阅读 3,373评论 0赞 2
【统计学习方法读书笔记与算法实现】2-KNN算法
KNN算法的基本思路：给定一个训练数据集，对于新的输入实例，在训练数据集中找到与该实例最邻近的k个实例，这k个实...
Macroholica阅读 354评论 0赞 1
这辈子从来没有工作过，只干自己喜欢的事！
这辈子从来没有工作过，只干自己喜欢的事！
大智行者阅读 222评论 0赞 0
我该打心底里长大了并赋予行为
我一名大二的大学生，今年21岁了。可是周围的人，却说我的行为举止甚至脑子实在是不像一个成年人，当然我对那些说法不以...
蓝绿海阅读 108评论 0赞 0

1赞2赞

赞赏

手机看全文