1.数据解释
id:运动者编号
diet:饮食(low fat 低脂、no fat 无脂)
pulse:脉搏
time:运动的时间
kind:运动的种类
2.导入数据
3.查看数据集
1.运动者脉搏强弱是否与运动种类有关?
2.运动者脉搏强弱是否与运动时间长短有关?
3.运动者脉搏强弱是否与饮食习惯有关?
1.检查是否存在缺失值
由返回的结果可以看出数据集是完整的,没有缺失的情况
2.查看字段数据类型
使用dtale库对exercise数据集进行可视化分析
import dtale exercise = pd.read_csv(‘F:\\PYTHON\\seaborn-data\\exercise.csv‘) dtale.show(exercise, ignore_duplicate=True)
因为第一列对于数据集分析没有实质性的意义,所以我自行的将第一列删除了
通过dtale的chart方法对字段之间的关系进行展示
以上图中展示了时间长短对不同运动者的脉搏变化图、不同饮食方式对运动者脉搏的影响、 不同时间和不同种类运动方式对于脉搏的影响、不同饮食习惯对脉搏的影响
import seaborn as sns sns.boxplot(x="id", y = "pulse",data = exercise, orient="v")
sns.boxplot(x="kind", y = "pulse",data = exercise, orient="v")
sns.boxplot(x="time", y = "pulse",data = exercise, orient="v")
以上图片是不同运动者的脉搏箱式图、 运动方式对于脉搏影响的箱式图、时间对于脉搏影响的箱式图
import seaborn as sns import matplotlib.pyplot as plt sns.pairplot(exercise) plt.show()#成对关系的影响
seaborn绘制数据之间成对的关系只有不同运动者和脉搏之间的关系,数据集的相关性图只显示了不同运动者和脉搏之间的相关性,应该是数据集的问题,暂时还没有找到较好的解决办法
随着运动的时间增长大多数人的脉搏都会增加;饮食习惯食用无脂食物的人在睡觉、走路时脉搏变化和食用低脂食物的人脉搏变化差不多,但是在跑步时食用无脂食物的人的脉搏变化明显大于食用低脂食物的人脉搏变化;在其他条件相同时,每个人的体质会影响脉搏变化;跑步这类运动更容易引起脉搏变化。所以说,我们要合理的安排自己的饮食,注重体育锻炼,加强自身的身体素质。
原文:https://www.cnblogs.com/wenyan1123/p/14897945.html