K近邻(k-nearest neighbor, k-NN)算法笔记(二)-scikit-learn

写在前面的话:哈喽,大家早安、午安、晚安喽,欢迎大家指点,也希望我的内容可以温暖、帮助同在学习路上的人们~

正文开始~~


今天主要是学习一个机器学习非常强大的开源框架-Scikit-Learn,这个框架的入门可以查看莫烦视频莫烦 Scikit learn and Python 优雅学会机器学习这个视频浅显易懂,期待新作,谢谢。然后,着重学习并且学会利用scikit-learn的官网文档scikit-learn官网文档

上一篇K近邻(k-nearest neighbor, k-NN)算法笔记-Python(一)中的K-NN算法,主要是通过线性扫描、计算输入实例与每一个训练实例的距离等,但是这样在数据量很大的时,非常耗时,因此,为了提高K-NN搜索的效率,可以考虑使用特殊的结构存储训练数据,以减少计算距离的次数。今天主要谈谈其中的KD树(K-dimensional tree)。

再次申明:本文的理论知识来自Peter Harrington的《机器学习实战》和李航的《统计学习方法》,非常感谢这些优秀人物和优秀书籍


KD树简介:KD树是一种对k维空间中的实例点进行存储以便对其进行快速检索的树形数据结构,是二叉树。构造KD树相当于不断地用垂直于坐标轴的超平面将k维空间划分,构成一系列的k维超矩形区域。KD树的每个结点对应于一个k维超矩形区域。KD树不适合维度在20以上的数据。

K-NN搜索KD树:首先找到包含目标点的叶结点;然后从该叶结点出发,依次回退到父结点;不断查找与目标点最邻近的结点,当确定不可能存在更近的结点时终止。这样搜索就被限制在空间的局部区域上,效率大为提高。

接下来,我们将基于scikit-learn的KDTree模块来实现一次K-NN分类

scikit-learn里基于KDTree模型:KDTree(X, leaf_size=40, metric='minkowski',**kwargs),模型参数解释:X是样本特征值矩阵;leaf_size是指树的叶片大小,也就是叶子结点数目。leaf_size的大小不会影响查询结果,但是会影响查询的速度以及结构树的存储空间,默认为40;metric是定义测度点之间距离的方式,默认Default=’minkowski’ with p=2(也就是一般的欧几里得距离)

预热:先练习一下KDTree模型,见图1


图1 KDTree上手小栗子

接下来,我们依旧根据上一篇K近邻(k-nearest neighbor, k-NN)算法笔记-Python(一)中的数据集来分类。基于scikit-learn的KDTree来实现KNN算法的流程如下:

1、准备数据(获取数据并且归一化等),代码见图2

图2 获取数据以及归一化

2、基于KDTree模块进行KNN分类,代码见图3


图3 基于KDTree的KNN分类方法

3、测试该基于KDTree模块的KNN算法的有效性,代码见图4


图4 基于KDTree的KNN分类方法的有效性验证

以上就是基于scikit-learn的KDTree模块实现的KNN算法,从运行结果看,算法的有效性和效率都显著提升。

好哒,这部分内容先到这,请各位大牛拍砖,也希望我的内容可以帮助大家,还是那句话:如果对您有用,请不吝赐本菜鸟一杯咖啡钱哈,多谢多谢~~

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,377评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,390评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,967评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,344评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,441评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,492评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,497评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,274评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,732评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,008评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,184评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,837评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,520评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,156评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,407评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,056评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,074评论 2 352

推荐阅读更多精彩内容