从sklearn包自带的数据集中读出鸢尾花数据集data
data=iris[‘data‘] data
运行结果
查看data类型,包含哪些数据
from sklearn.datasets import load_iris iris = load_iris() iris.keys()
运行结果
a2=iris[‘target‘] a2
a4=iris[‘feature_names‘] a4
取出所有花的花萼长度(cm)的数据
data=iris[‘data‘] x=data[:,2] x
取出某朵花的四个特征及其类别。
d=iris.data[0] print(d)
[ 5.1 3.5 1.4 0.2]
生成新的数组,每个元素包含四个特征+类别
Setasa=[] Versicolor=[] Virginica=[]#将所有花的特征和类别分成三组,每组50个 for a in range(0,150): if iris.target[a]==0: data1=iris.data[a].tolist() data1.append("Setosa") Setasa.append(data1) elif iris.target[a] ==1: data1=iris.data[a].tolist() data1.append("Versicolor") Versicolor.append(data1) else: data1=iris.data[a].tolist() data1.append("Virginica") Virginica.append(data1)
生成新的数组,每个元素包含四个特征+类别
result=numpy.array([Setasa,Versicolor,Virginica]) result
运行结果
计算鸢尾花花瓣长度的最大值,平均值,中值,均方差。
print("最大值:",np.max(iris.data[:,1]), "平均值:",np.mean(iris.data[:,1]), "中值:",np.median(iris.data[:,1]), "均方差:",np.std(iris.data[:,1]))
运行结果
最大值: 4.4 平均值: 3.054 中值: 3.0 均方差: 0.432146580071
显示鸢尾花某一特征的曲线图,散点图。
import matplotlib.pyplot as plt plt.plot(iris.data[:,0],iris.data[:,1]) plt.show()
plt.scatter(iris.data[:,0],iris.data[:,1]) plt.show()
原文:https://www.cnblogs.com/DSJ666/p/9911747.html