机器学习

1.k-近邻算法

# coding=utf-8
from numpy import *
import operator


def createDataSet():
    group = array([[1.0, 1.1], [1.0, 1.0], [0, 0], [0, 0.1]])
    labels = ['A', 'A', 'B', 'B']
    return group, labels


def classify0(inX, dataSet, labels, k):
    # 数组长度
    dataSetSize = dataSet.shape[0]
    # （A-0）（B-0）
    diffMat = tile(inX, (dataSetSize, 1)) - dataSet
    # （A-0）*2 （B-0）*2
    sqDiffMat = diffMat ** 2
    # （A - 0）*2 +（B - 0）*2
    sqDistances = sqDiffMat.sum(axis=1)
    distances = sqDistances ** 0.5
    # 得到距离从小到大的索引
    sortedDistIndicies = distances.argsort()
    classCount = {}
    for i in range(k):
        # 获取从小到大的值的标签
        voteIlabel = labels[sortedDistIndicies[i]]
        classCount[voteIlabel] = classCount.get(voteIlabel, 0) + 1
    sortedClassCount = sorted(classCount.iteritems(), key=operator.itemgetter(1), reverse=True)
    return sortedClassCount[0][0]


group, labels = createDataSet()
classify0([0, 0], group, labels, 3)

最后编辑于：2017.12.09 15:13:59

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

友情链接更多精彩内容

赞1赞

赞赏

手机看全文

机器学习

相关阅读更多精彩内容

友情链接更多精彩内容