机器学习笔记——K-means

时间：2014-07-16 20:04:13 阅读：275 评论：0 收藏：0 [点我收藏+]

K-means是一种聚类算法，其要求用户设定聚类个数k作为输入參数，因此，在执行此算法前，须要预计须要的簇的个数。

如果有n个点，须要聚到k个簇中。K-means算法首先从包括k个中心点的初始集合開始，即随机初始化簇的中心。随后，算法进行多次迭代处理并调整中心位置，知道达到最大迭代次数或中性收敛于固定点。

bubuko.com,布布扣

k-means聚类实例。选择三个随机点用作聚类中心(左上)，map阶段(右上)将每一个点赋给离其近期的簇。在reduce阶段(左下)，取相互关联的点的均值，作为新的簇的中心位置，得到本轮迭代的终于布局(右下)。在每一轮迭代结束后，终于布局将被反馈给相同的循环过程，直到聚类中心的位置不再移动。

使用weka进行聚类：

	public static void main(String[] args) throws Exception {
		// 读入样本数据  
		Instances data = new Instances(new BufferedReader(new FileReader("E:\\Weka-3-6\\data\\contact-lenses.arff")));
		// 实例化化聚类算法
		SimpleKMeans kmeans = new SimpleKMeans();
		//true if missing values are to be replaced
		kmeans.setPreserveInstancesOrder(true);
		//设置聚类要得到的类别数量  
		kmeans.setNumClusters(2);
		//開始进行聚类  
		kmeans.buildClusterer(data);
		// 打印聚类结果  
		int[] assignments = kmeans.getAssignments();
		int i=0;
		for(int clusterNum : assignments) {
		    System.out.printf("Instance %d -> Cluster %d\n", i++, clusterNum);
		}
	}

机器学习笔记——K-means,布布扣,bubuko.com

机器学习笔记——K-means

原文：http://www.cnblogs.com/hrhguanli/p/3837059.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)