常用的数据分析函数
#统计每列所有属性的个数 df.value_counts(ascending = True/False,bins = 1) """ ascending为False从大到小 bins 对于很多离散的数据而,可以设置区间 """ #连续属性离散化分箱函数pd.cut() ages = [1,2,3,4] bins = [1,1,1] ages_bin = pd.cut(ages,bins) #pivot数据透视表 example_p = df.pivot(index=‘‘,columns=‘‘,values=‘Amount‘).sum(axis=1) new_example_p = df.pivot(index = ‘‘,columns=‘‘,values=‘‘,aggfunc=‘max‘) """ aggfunc:表示将数据进行处理,max/count/mean/sum """ example_pivot = df.pivot_table(columns=‘地区‘,values=‘评分人数‘,aggfunc=‘sum‘) example_pivot 地区 东区 中西区 九龙城 其他地区 南区 屯门 沙田 油尖旺 湾仔 离岛 荃湾 葵青 观塘 评分人数 23102 19075 11047 5774 9573 6326 25006 258848 58144 52307 19427 598 5008
#groupby
#将评分人数按照地区进行分组
原文:https://www.cnblogs.com/jiaxinHuang/p/13235606.html