K-Means算法

时间：2019-09-15 16:37:00 阅读：86 评论：0 收藏：0 [点我收藏+]

K-Means聚类算法不用给出数据集的聚类标签，因此它是一种无监督学习算法，在没有十分明显的分类界限的聚类问题中十分有用。
在聚类问题中我们考虑如下数据集$\{x^{(1)},\cdots x^{(n)})\}$，我们想要将这些数据点划分到几个集群中，使用K-Means聚类算法的步骤如下：

目标

\[ \begin{align} \underset{\mu}{min} \underset{C}{min} \sum_{i=1}^{K} \sum_{x \in C_i}|x-\mu_{i}|^2 \end{align} \]

随机选取K个点 $ u_{1},u_{2} \dots,u_{k} $ 作为聚类中心，其中K表示聚类个数，该参数由人为设定。

对于每一个样本$i$，将样本分配给最近的聚类中心(分配依据：该样本到每个聚类中心的欧式距离)：
\[ \begin{align} c^{i}=arg \underset{j}{min} ||x^{(i)}-u_j||^2 \end{align} \]
对于每一个聚类$j$，用类内样本的质心更新聚类中心：
\[ \begin{align} u_{j}=\dfrac{\sum_{i=1}^n 1 \cdot \{c^{(i)}=j \}x^{(i)}}{\sum_{i=1}^n 1 \cdot \{c^(i)=j \} } \end{align} \]

当样本和类的所属关系不再改变时结束算法执行。

技术分享图片

原文：https://www.cnblogs.com/jeapwu/p/11522210.html

踩

(0)

评论一句话评论（0）

分享档案

更多>