第十章 k最近邻算法
最近邻居法
在模式识别领域中, 最近邻居法(KNN 算法, 又译 K-近邻算法) 是一种用于分类和回归的非参数统计方法。 在这两种情况下, 输入包括特征空间中的 k 个最接近的训练样本。
- 在 K-NN 分类中, 输出是一个分类族群。 一个对象的分类是由邻居的 "多数表决" 确定的, k 个最近邻居 (k为正整数, 通常较小) 中最常见的分类决定了赋予该对象的类别。 若 k = 1, 则该对象的类别直接由最近的一个节点赋予
- 在 K-NN 回归中, 输出的是该对象的属性值。 该值是其 k 个最近邻居的值的平均值
以上摘自维基百科
k最近邻算法
书中列出的一些例子, 在生活中也有很多缩影. 比如我想看什么电影, 就会去找也爱看悬疑片的朋友问问, 或者去网上搜索悬疑片有哪些好看的。 当然这只是我个人的理解(逃:
机器学习
OCR: 光学字符识别. 就是计算机可以自动识别照片中的文字
OCR 的第一步是查看大量的数字图像并提取特征, 这称为训练
创建垃圾邮件过滤器
使用的是一种简单算法----朴素贝叶斯分类器
书中还提到了预测股票市场, 不过很难。 因为未来不确定因素太多
小结
对 KNN 和机器学习有了一个大概的认识。
我也是学过机器学习的人了 哈哈哈︿( ̄︶ ̄)︿