这几日在看大名鼎鼎的Machine Learn in Action,刚刚看完kNN算法部分,为了分析和巩固,现做个总结。
import numpy as np def kNNclassify0(inX,train_set,train_labels,k): rownumbers = train_set.shape[0] inX1 = inx.tile(inX , [rownumbers,1]) distance1 = inX1 - train_set distance2 = distance1**2 distance3 =distance2.sum(axis=1) sortedIndex = distance3.argsort() classcount = {} for i in range(k): labels = train_labels[sortedIndex[i]] classcount[labels] = classcount.get(labels,o)+1 sortedclasscount = sorted(classcount.iteritems(),key=operator.itemgetter(1),reverse=True) return sortedclasscount[0][0]
这是kNN分类器的主体部分,输入一个待分类的inX(包括各种features,但是不确定label),一个已经有确定label的各个对象的feature集,以及k。结果输出inX属于哪个label。
原文:http://www.cnblogs.com/amoxine/p/6285616.html