k近邻算法基础

K-NN算法是最简单的分类算法,主要的思想是计算待分类样本与训练样本之间的差异性,并将差异按照由小到大排序,选出前面K个差异最小的类别,并统计在K个中类别出现次数最多的类别为最相似的类,最终将待分类样本分到最相似的训练样本的类中。与投票(Vote)的机制类似。

  1. 当k=3,对于一个新的点,k近邻算法就是找离这个新的点最近的一个点。


    image.png

    然后这三个点以自身属性进行投票,上图蓝色和红色比例是3:0,也就是说这个点更可能代表恶性肿瘤。


    image.png

    上图,蓝色和红色比例是1:2,说明更可能是良性肿瘤。
  2. kNN算法主要解决机器学习中分类问题,次要解决回归问题。


    image.png

    image.png

    image.png

    image.png

    image.png

    image.png

    image.png

    image.png

    image.png
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • https://developers.google.com/machine-learning/crash-cour...
    iOSDevLog阅读 7,801评论 1 11
  • KNN:K-Nearest Neighbor algorithm 本文转载自:http://blog.csdn.n...
    五秋木阅读 9,204评论 0 1
  • 注:题中所指的『机器学习』不包括『深度学习』。本篇文章以理论推导为主,不涉及代码实现。 前些日子定下了未来三年左右...
    我偏笑_NSNirvana阅读 40,473评论 12 145
  • 机器学习是做NLP和计算机视觉这类应用算法的基础,虽然现在深度学习模型大行其道,但是懂一些传统算法的原理和它们之间...
    在河之简阅读 20,795评论 4 65
  • 文章 濯堂 文章,简单地说就是说几句话而已,就是一句真话怎么说的问题。没有那么复杂,也不必搞得那么复杂。 ...
    濯堂阅读 2,915评论 3 3

友情链接更多精彩内容