首页 > 其他 > 详细

seaborn的pairplot

时间:2020-07-09 16:54:49      阅读:74      评论:0      收藏:0      [点我收藏+]

pairplot:pair是成对的意思,即是说这个用来展现变量两两之间的关系,线性、非线性、相关等等

使用鸢尾花数据画图

#两种导入方式,这次是直接从sklearn.datasets导入
import pandas as pd 
from sklearn import datasets
import seaborn as sns
import matplotlib.pyplot as plt
%matplotlib inline
sns.set_style(white,{font.sans-serif:[simhei,Arial]})  #解决中文不能显示问题

iris=datasets.load_iris()
iris_data= pd.DataFrame(iris.data,columns=iris.feature_names)
iris_data[species]=iris.target_names[iris.target]
iris_data.head(3).append(iris_data.tail(3))   #前面三条+后面三条
iris_data.rename(columns={"sepal length (cm)":"萼片长",
                     "sepal width (cm)":"萼片宽",
                     "petal length (cm)":"花瓣长",
                     "petal width (cm)":"花瓣宽",
                     "species":"种类"},inplace=True)
kind_dict = {
    "setosa":"山鸢尾",
    "versicolor":"杂色鸢尾",
    "virginica":"维吉尼亚鸢尾"
}
iris_data["种类"] = iris_data["种类"].map(kind_dict)

画变量之间关系的图

#全部变量都放进去
sns.pairplot(iris_data)

技术分享图片

 

可以看到对角线上是各个属性的直方图(分布图),而非对角线上是两个不同属性之间的相关图,
从图中我们发现,花瓣的长度和宽度之间以及萼片的长短和花瓣的长、宽之间具有比较明显的相关关系

 

#kind:用于控制非对角线上图的类型,可选‘scatter‘与‘reg‘
#diag_kind:用于控制对角线上的图分类型,可选‘hist‘与‘kde‘

sns.pairplot(iris_data,kind=reg,diag_kind=ked)
sns.pairplot(iris_data,kind=reg,diag_kind=hist)

技术分享图片

 

 

 技术分享图片

 

#hue:针对某一字段进行分类
sns.pairplot(iris_data,hue=种类)

 

技术分享图片

经过hue分类后的pairplot中发现,不论是从对角线上的分布图还是从分类后的散点图,
都可以看出对于不同种类的花,其萼片长、花瓣长、花瓣宽的分布差异较大,换句话说,
这些属性是可以帮助我们去识别不同种类的花的。
比如,对于萼片、花瓣长度较短,花瓣宽度较窄的花,那么它大概率是山鸢尾

 

#vars:研究某2个或者多个变量之间的关系vars,
#x_vars,y_vars:选择数据中的特定字段,以list形式传入需要注意的是,x_vars和y_vars要同时指定

sns.pairplot(iris_data,vars=["萼片长","花瓣长"])
sns.pairplot(iris_data,x_vars=["萼片长","花瓣宽"],y_vars=["萼片宽","花瓣长"]) 

技术分享图片

 

 技术分享图片

 

seaborn的pairplot

原文:https://www.cnblogs.com/cgmcoding/p/13274481.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!