sklearn聚类模型：基于密度的DBSCAN；基于混合高斯模型的GMM

时间：2019-03-13 15:24:33 阅读：677 评论：0 收藏：0 [点我收藏+]

1 sklearn聚类方法详解

2 对比不同聚类算法在不同数据集上的表现

技术分享图片

3 用scikit-learn学习K-Means聚类

技术分享图片

4 用scikit-learn学习DBSCAN聚类（基于密度的聚类）

5 DBSCAN密度聚类算法

技术分享图片

6 混合高斯模型Gaussian Mixture Model(GMM)

技术分享图片

#===============================================

从左到右依次为： k-means聚类， DBSCAN聚类， GMM聚类

技术分享图片

对应代码：

# kmeans聚类
from sklearn.cluster import KMeans
estimator = KMeans(n_clusters=2)#构造聚类器
y_pred =estimator.fit_predict(X_train_2)#聚类

clr = [‘b‘ if i==0 else ‘y‘ if i==1 else ‘r‘ for i in y_pred]
plt.scatter(X_train[:,0],X_train[:,1],c=clr)


# DBSCAN（Density-Based Spatial Clustering of Application with Noise）基于密度的空间聚类算法
from sklearn.cluster import DBSCAN
dbs1 = DBSCAN(eps=0.5, # 邻域半径 
min_samples=5 ) # 最小样本点数，MinPts
y_pred = dbs1.fit_predict(X_train_2) #训练集的标签

clr = [‘b‘ if i==0 else ‘y‘ if i==1 else ‘r‘ for i in y_pred]
plt.scatter(X_train_2[:,0],X_train_2[:,1],c=clr)


#混合高斯模型Gaussian Mixture Model(GMM)聚类
from sklearn import mixture
clf = mixture.GaussianMixture(n_components=2,covariance_type=‘full‘)
clf.fit(X_train_2) #.fit_predict
y_pred = clf.predict(X_train_2)

#预测
clr = [‘b‘ if i==0 else ‘y‘ if i==1 else ‘r‘ for i in y_pred]
plt.scatter(X_train_2[:,0],X_train_2[:,1],c=clr)

sklearn聚类模型：基于密度的DBSCAN；基于混合高斯模型的GMM

原文：https://www.cnblogs.com/andylhc/p/10523213.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)