Pandas分组运算（groupby）

时间：2019-07-08 20:13:20 阅读：197 评论：0 收藏：0 [点我收藏+]

1. groupby()

import pandas as pd
df = pd.DataFrame([[1, 1, 2], [1, 2, 3], [2, 3, 4]], columns=["A", "B", "C"])
print(df)

技术分享图片

g = df.groupby(‘A‘).mean()   # 按A列分组(groupby)，获取其他列的均值
print(g)

技术分享图片

m = df.groupby(‘A‘)
n = m[‘B‘].mean()
print(n)

技术分享图片

2. 聚合方法size()和count()

size跟count的区别： size计数时包含NaN值，而count不包含NaN值

import pandas as pd 
import numpy as np

df = pd.DataFrame({"Name":["Alice", "Bob", "Mallory", "Mallory", "Bob" , "Mallory"],
                   "City":["Seattle", "Seattle", "Portland", "Seattle", "Seattle", "Portland"],
                   "Val":[4,3,3,np.nan,np.nan,4]})
print(df)

技术分享图片

count()

a = df.groupby(["Name", "City"], as_index=False)[‘Val‘].count()
print(a)

技术分享图片

size()

b = df.groupby(["Name", "City"])[‘Val‘].size().reset_index(name=‘Size‘)
print(b)

技术分享图片

来自：https://blog.csdn.net/m0_37870649/article/details/80979809

Pandas分组运算（groupby）

原文：https://www.cnblogs.com/keye/p/11153427.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)