首页 > 其他 > 详细

Datawhale - Pandas(下)--task03分类数据

时间:2020-06-28 01:01:38      阅读:105      评论:0      收藏:0      [点我收藏+]

数据的分类,在数据分析里很常见,学到这里,感觉是把excel里函数和编程融合在一起了,很方便。

 

一、分类的创建、分类类别的更改

1、可以用series创建,用Dataframe 和内置的Categorical来创建,或者利用cut函数创建(默认使用区间类型为标签)

pd.Series(["a", "b", "c", "a"], dtype="category")
0    a
1    b
2    c
3    a
dtype: category
Categories (3, object): [a, b, c]
 
temp_df = pd.DataFrame({‘A‘:pd.Series(["a", "b", "c", "a"], dtype="category"),‘B‘:list(‘abcd‘)})
temp_df.dtypes
A    category
B      object
dtype: object
 
cat = pd.Categorical(["a", "b", "c", "a"], categories=[‘a‘,‘b‘,‘c‘])
pd.Series(cat)
0    a
1    b
2    c
3    a
dtype: category
Categories (3, object): [a, b, c]
pd.cut(np.random.randint(0,60,5), [0,10,30,60])
[(10, 30], (0, 10], (10, 30], (30, 60], (30, 60]]
Categories (3, interval[int6

NOTE:一个分类变量包括三个部分,元素值(values)、分类类别(categories)、是否有序(order);从上面可以看出,使用cut函数创建的分类变量默认为有序分类变量

二、对分类数据的排序

三、分类数据的比较

Datawhale - Pandas(下)--task03分类数据

原文:https://www.cnblogs.com/haiyanli/p/13200619.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!