登录注册写文章

KNN

行走中的3卡

KNN

KNN算法通俗解释（K-近邻算法）

image.png

图片中展示的是KNN算法，这是一个机器学习中最基础、最直观的算法之一。让我用最通俗的方式解释它：

核心思想：近朱者赤，近墨者黑

KNN算法的核心思想非常简单：物以类聚。判断一个新数据属于哪一类，就看它周围最近的K个邻居是哪一类。

生活类比：搬新房子

想象你要搬到一个新小区，想知道这个小区是"富人区"还是"普通区"。你不会做复杂计算，只需要看周围最近的几户邻居：

看最近的5户人家（K=5）
统计这5户是什么类型
如果3户是富人，2户是普通家庭 → 判定为富人区
如果1户是富人，4户是普通家庭 → 判定为普通区

算法的5个简单步骤

第1步：存储数据

把所有已知的数据点都保存起来
比如一大堆已分类的红点和蓝点，存储在"内存"里

第2步：计算距离

来了一个新数据点（比如绿色的点）
计算这个新点到所有已知点的距离
距离就像地图上的直线距离

第3步：找K个最近的邻居

从所有已知点中，选出距离新点最近的K个
K是你自己设定的数字，比如3、5、7等

第4步：投票

看这K个最近邻居各自是什么类别
统计每个类别有多少票

第5步：宣布结果

哪个类别票数最多，新点就属于哪个类别

K值的影响（很关键！）

图片中展示了K=1、K=3、K=5的不同效果：

K=1（太敏感）

只看最近的1个邻居
问题：如果恰好遇到一个离群点（错误数据），就会跟着错
比喻：只听一个人意见，容易被忽悠

K=3（中等）

看3个最近邻居
问题：可能会遇到2比1的情况
比喻：听3个人意见，相对靠谱一点

K=5（更稳健）

看5个最近邻居
优点：不太受个别异常点影响
比喻：听5个人意见，投票更民主

K值太大（太保守）

如果K值太大，比如等于总数据量的一半
问题：就失去分类的意义了
比喻：听所有人的意见，最后结果是多数人的平均，失去了个性

算法的优缺点

优点

✅ 简单到不行：没有复杂的数学公式
✅ 不用训练：不需要提前学习，直接用数据就能分类
✅ 容易理解：就像生活常识一样自然

缺点

❌ 计算慢：每次都要算新点到所有点的距离
❌ 占内存：要把所有数据都存起来
❌ 对异常值敏感：如果有错误数据，会影响判断

实际应用场景

推荐系统：推荐相似的电影、商品
图像识别：识别图片里的物体
文本分类：判断一篇文章属于什么类别
异常检测：找出异常的信用卡交易

总结

KNN算法就是：找邻居、问邻居、听大多数邻居的话

不需要复杂的数学训练
就像我们生活中的"物以类聚"
关键是选择合适的K值
简单直观，但计算量大

这就是KNN算法的全部精髓！

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

相关阅读更多精彩内容

深入理解KNN扩展到ANN
一、KNN（K最近邻算法）原理一句话可以概括出KNN的算法原理：综合k个“邻居”的标签值作为新样本的预测值。更具...
算法进阶阅读 4,578评论 0赞 2
数据挖掘十大经典算法之KNN
一、knn介绍 1. K最近邻(k-Nearest Neighbor，KNN)分类算法，属于有监督学习中的分类算法...
我姓许啊阅读 627评论 0赞 0

机器学习-KNN
KNN 算法详解 KNN (K-Nearest Neighbors) 算法是一种简单、非参数化的监督学习算法，用于...
阿凡提说AI阅读 249评论 0赞 0
KNN算法常见问题总结
1 k近邻法（k-nearest neighbor, kNN）给定测试实例，基于某种距离度量找出训练集中与其最靠...
阡陌哥哥阅读 13,560评论 0赞 2
分类算法之K最近邻算法(KNN)的python实现
分类算法之K最近邻算法(KNN)的Python实现 KNN的定义所谓K近邻算法，即是给定一个训练数据集，对新的输...
盗梦者_56f2阅读 3,407评论 0赞 2

友情链接更多精彩内容

赞1赞

赞赏

手机看全文