首页 > 其他 > 详细

pandas 技巧

时间:2019-11-01 11:36:35      阅读:81      评论:0      收藏:0      [点我收藏+]

 

find index of top 3 largest values of each column:

 

df1.apply(lambda s: pd.Series(s.nlargest(3).index))

 

map dataframe column

df["ItemIdx"] = df["question"].map(lambda x: itemMap.get(x,np.NaN))

 

load a dictionay from a save pkl file

with open ("l.pkl","rb") as f:
    itemMap= pickle.lead(f)

 

find the startpoint of each session (after sorted):

offset = np.zeros(df["sessinId"].nunique()+1,dtype=np.int32)
offset[1:] = df.groupby(‘sessinId‘).size().cumsum()

 

pandas 技巧

原文:https://www.cnblogs.com/pocahontas/p/11775756.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!