kNN

#k_Nearest Neighbor
from numpy import *
import operator
def createDataSet():
    group = array([[1.0,1.1],[1.0,1.0],[0,0],[0,0.1]])
    labels = ['A','A','B','B']
    return group,labels
def classify0(inX,dataSet,labels, k):
    dataSetSize = dataSet.shape[0]  ## 读取矩阵的行数，作为数据集的个数

    diffMat = tile(inX, (dataSetSize, 1)) - dataSet  #tile函数，将输入的inX重复为一个和dataset维度大小相同的矩阵

    sqDiffMat = diffMat**2
    sqDistances = sqDiffMat.sum(axis=1)
    distances = sqDistances**0.5
    sortedDistIndicies = distances.argsort()  #argsort() 将distances的元素从小到大排列 返回其对应的索引
    classCount = {}
    for i in range(k):  ##返回距离排名第i的标签
        voteIlabel = labels[sortedDistIndicies[i]]
        classCount[voteIlabel] = classCount.get(voteIlabel,0) + 1 ##得到索引

    sortedClassCount = sorted(classCount.iteritems(),key = operator.itemgetter(1,reverse=True))
    return sortedClassCount[0][0]

最后编辑于：2017.12.11 03:11:08

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

友情链接更多精彩内容

赞1赞

赞赏

手机看全文

kNN

相关阅读更多精彩内容

友情链接更多精彩内容