首页 > 其他 > 详细

第十六节 pandas数据特征的分析探索

时间:2020-03-25 09:14:48      阅读:76      评论:0      收藏:0      [点我收藏+]
import pandas as pd
pd.options.display.max_rows = 10  # 设置显示行数

df1 = pd.read_csv(rE:\anacondatest\PythonData\PM25\Beijing_2009_HourlyPM25_created20140709.csv, encoding=gbk)

# 数值变量的基本描述
df1.describe(include=all)  # include希望分析哪些变量,如果指定多列,放入一个列表中

# 分类变量的频数统计
pd.value_counts(df1.类型, sort=False)
df1.总分.value_counts(bins=10)  # 对总分进行分段统计

# 交叉表/数据透视表
df1.pivot_table(index=[所在省份, 主管部门], columns=类型, values=总分, aggfunc=sum)

# 常用的假设检验方法
‘‘‘
单样本t检验
两独立样本t检验
配对t检验
单因素方差分析
卡方检验
相关分析
回归分析
非参数以检验方法
‘‘‘

 

第十六节 pandas数据特征的分析探索

原文:https://www.cnblogs.com/kogmaw/p/12563509.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!