在爬取大量的数据之后,需要对数据进行分组的处理,于是就使用了groupby,但是我需要的并不是分组之后数据的聚合分析,我需要的是原生的某些数据。但是却找不到网上的相关案例。于是,我就自己尝试的进行。终于找到了去找原生数据的方法了。
1、先看一个简单和基础的
for i in pd[pd[‘备注‘] == 1].groupby([‘model_id‘]): print(i) break #结果是一个有分组名称和分组数据形成的数组
2、再看一个清晰一些的
for groupname,group_df in pd[pd[‘备注‘] == 1].groupby([‘model_id‘]): print(groupname,group_df) break #结果是一个有分组名称和分组数据
3、然后实现寻找分组中的某个数据,并使用字典进行保存
for groupname,group_df in pd[pd[‘备注‘] == 1].groupby([‘model_id‘]): pf_id_list = [] ps_id_list = [] item = {} for i in group_df[‘pf_id‘]: print(i) pf_id_list.append(str(int(i))) for j in group_df[‘ps_id‘]: ps_id_list.append(str(int(j))) for m in range(len(pf_id_list)): item[pf_id_list[m]] = ps_id_list[m] print(pf_id_list,ps_id_list) print(group_df) print(item) break
ok,到此结束,实现需求。
原文:https://www.cnblogs.com/caomengqi/p/15105055.html