#k_Nearest Neighbor
from numpy import *
import operator
def createDataSet():
group = array([[1.0,1.1],[1.0,1.0],[0,0],[0,0.1]])
labels = ['A','A','B','B']
return group,labels
def classify0(inX,dataSet,labels, k):
dataSetSize = dataSet.shape[0] ## 读取矩阵的行数,作为数据集的个数
diffMat = tile(inX, (dataSetSize, 1)) - dataSet #tile函数,将输入的inX重复为一个和dataset维度大小相同的矩阵
sqDiffMat = diffMat**2
sqDistances = sqDiffMat.sum(axis=1)
distances = sqDistances**0.5
sortedDistIndicies = distances.argsort() #argsort() 将distances的元素从小到大排列 返回其对应的索引
classCount = {}
for i in range(k): ##返回距离排名第i的标签
voteIlabel = labels[sortedDistIndicies[i]]
classCount[voteIlabel] = classCount.get(voteIlabel,0) + 1 ##得到索引
sortedClassCount = sorted(classCount.iteritems(),key = operator.itemgetter(1,reverse=True))
return sortedClassCount[0][0]
kNN
最后编辑于 :
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
推荐阅读更多精彩内容
- from Distance import Distance cal=Distance() k=3 s=[["t1"...
- 1.算法描述 邻近算法,或者说K最近邻(kNN,k-NearestNeighbor)分类算法是数据挖掘分类技术中最...
- 目前常用的文本自动分类技术有基于统计学的分类技术,包括贝叶斯法、K一邻近算法等;基于机器学习的分类技术,包括决策树...