1. 安装scipy,numpy,sklearn包
#加载numpy包
import numpy
#加载sklearn包
from sklearn.datasets import load_iris
2. 从sklearn包自带的数据集中读出鸢尾花数据集data
#读出鸢尾花数据集data data=load_iris()
3.查看data类型,包含哪些数据
#查看data类型 print(type(data)) #查看数据内容 print(data.keys())
运行结果:
4.取出鸢尾花特征和鸢尾花类别数据,查看其形状及数据类型
#鸢尾花的四个特征 data_feature= data.feature_names iris_data=data.data print(data_feature) print(iris_data) #鸢尾花的三个类别 data_target =data.target_names print(data_target) iris_data=data.target print(iris_data) #数据类型 type(iris_data)
运行结果:
5.取出所有花的花萼长度(cm)的数据
sepal_length=numpy.array(list(len[0] for len in data[‘data‘])) print(sepal_length)
运行结果:
6.取出所有花的花瓣长度(cm)+花瓣宽度(cm)的数据
#鸢尾花花瓣长度的数据 petal_length=numpy.array(list(len[2] for len in data[‘data‘])) print(petal_length) #鸢尾花花瓣宽度的数据 petal_width=numpy.array(list(len[3] for len in data[‘data‘])) print(petal_width)
运行结果:
7.取出某朵花的四个特征及其类别。
#取出某朵花的四个特征 print(data.data[0]) #取出某朵花的类别 print(data.target_names[0])
运行结果:
8.将所有花的特征和类别分成三组,每组50个
#定义三个列表来存放不同类型花朵的类别 setosa_data = [] versicolor_data = [] virginica_data = [] #
for i in range(0,150): #生成为setosa类的鸢尾花花数据 if data.target[i] == 0: data1 = data.data[i].tolist() data1.append(‘setosa‘) setosa_data.append(data1) #生成为versicolor类的鸢尾花数据 elif data.target[i] == 1: data1 = data.data[i].tolist() data1.append(‘versicolor‘) versicolor_data.append(data1) #剩下的为virginica类的鸢尾花数据 else: data1 = data.data[i].tolist() data1.append(‘virginica‘) virginica_data.append(data1)
9.生成新的数组,每个元素包含四个特征+类别
#生成新的数组,每个元素包含四个特征+类别 newdata=(setosa_data ,versicolor_data,virginica_data) print(newdata)
运行结果:
原文:https://www.cnblogs.com/LinYxin/p/9786796.html