首页 > 编程语言 > 详细

无监督学习包含算法

时间:2021-02-19 17:07:22      阅读:19      评论:0      收藏:0      [点我收藏+]
  • 聚类
    • K-means(K均值聚类)
  • 降维
    • PCA

K-means原理

我们先来看一下一个K-means的聚类效果图

技术分享图片

 

 

K-means聚类步骤

  • 1、随机设置K个特征空间内的点作为初始的聚类中心
  • 2、对于其他每个点计算到K个中心的距离,未知的点选择最近的一个聚类中心点作为标记类别
  • 3、接着对着标记的聚类中心之后,重新计算出每个聚类的新中心点(平均值)
  • 4、如果计算得出的新中心点与原中心点一样,那么结束,否则重新进行第二步过程

我们以一张图来解释效果

技术分享图片

 

 

K-meansAPI

  • sklearn.cluster.KMeans(n_clusters=8,init=‘k-means++’)
    • k-means聚类
    • n_clusters:开始的聚类中心数量
    • init:初始化方法,默认为‘k-means ++’
    • labels_:默认标记的类型,可以和真实值比较(不是值比较)

案例:k-means对Instacart Market用户聚类

分析

  • 1、降维之后的数据
  • 2、k-means聚类
  • 3、聚类结果显示
data_new

技术分享图片

 

 

#预估器流程
from sklearn.cluster import KMeans

estimator = KMeans(n_clusters=3)
estimator.fit(data_new)

技术分享图片

 

 

y_predict = estimator.predict(data_new)
y_predict[:300]

技术分享图片

 

 

#模型评估 - 轮廓系数
from sklearn.metrics import silhouette_score

silhouette_score(data_new, y_predict)

技术分享图片

 

无监督学习包含算法

原文:https://www.cnblogs.com/a155-/p/14416743.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!