首页 > 其他 > 详细

对csv数据的相关操作

时间:2021-03-12 16:57:19      阅读:27      评论:0      收藏:0      [点我收藏+]

1.读取csv文件,获取其最大,小,平均值。

import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
data = pd.read_csv(rF:\catering_sale.csv)
print(data)
print("最大值\n",data.max())
print("最小值\n",data.min())
print("平均值\n",data.mean())



             日期      销量
0    2015-03-01    51.0
1    2015-02-28  2618.2
2    2015-02-27  2608.4
3    2015-02-26  2651.9
4    2015-02-25  3442.1
5    2015-02-24  3393.1
6    2015-02-23  3136.6
7    2015-02-22  3744.1
8    2015-02-21  6607.4
9    2015-02-20  4060.3
10   2015-02-19  3614.7
11   2015-02-18  3295.5
12   2015-02-16  2332.1
13   2015-02-15  2699.3
14   2015-02-14     NaN
15   2015-02-13  3036.8
16   2015-02-12   865.0
17   2015-02-11  3014.3
18   2015-02-10  2742.8
19   2015-02-09  2173.5
20   2015-02-08  3161.8
21   2015-02-07  3023.8
22   2015-02-06  2998.1
23   2015-02-05  2805.9
24   2015-02-04  2383.4
25   2015-02-03  2620.2
26   2015-02-02  2600.0
27   2015-02-01  2358.6
28   2015-01-31  2682.2
29   2015-01-30  2766.8
..          ...     ...
171  2014-08-31  3494.7
172  2014-08-30  3691.9
173  2014-08-29  2929.5
174  2014-08-28  2760.6
175  2014-08-27  2593.7
176  2014-08-26  2884.4
177  2014-08-25  2591.3
178  2014-08-24  3022.6
179  2014-08-23  3052.1
180  2014-08-22  2789.2
181  2014-08-21  2909.8
182  2014-08-20  2326.8
183  2014-08-19  2453.1
184  2014-08-18  2351.2
185  2014-08-17  3279.1
186  2014-08-16  3381.9
187  2014-08-15  2988.1
188  2014-08-14  2577.7
189  2014-08-13  2332.3
190  2014-08-12  2518.6
191  2014-08-11  2697.5
192  2014-08-10  3244.7
193  2014-08-09  3346.7
194  2014-08-08  2900.6
195  2014-08-07  2759.1
196  2014-08-06  2915.8
197  2014-08-05  2618.1
198  2014-08-04  2993.0
199  2014-08-03  3436.4
200  2014-08-02  2261.7

[201 rows x 2 columns]

最大值
日期 2015-03-01
销量 9106.44
dtype: object
最小值
日期 2014-08-02
销量 22
dtype: object
平均值
销量 2755.2147
dtype: float64

 

2.统计样本个数和缺失变量

print("缺失值个数:",data[销量].isnull().sum())
print("样本个数:",data[销量].shape[0])

缺失值个数: 1
样本个数: 201

 

3.绘制箱式图判断异常

plt.rcParams[font.sans-serif] = [KaiTi] # 指定默认字体
plt.rcParams[axes.unicode_minus] = False # 解决保存图像是负号-显示为方块的问题
fig,axes = plt.subplots()
data.boxplot(column=销量,ax=axes)
axes.set_ylabel(values of data)
fig.savefig(p1.png)

技术分享图片

对csv数据的相关操作

原文:https://www.cnblogs.com/jk18/p/14524335.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!