首页 > 其他 > 详细

Pandas练习(一)

时间:2020-10-13 21:26:39      阅读:57      评论:0      收藏:0      [点我收藏+]

Pandas练习(一)

题目要求:文档链接

# 导入模块
import numpy as np
import pandas as pd
from pandas import DataFrame,Series
# 导入数据
df_tb1=pd.read_csv("data/baby_trade.csv")
df_tb2=pd.read_csv("data/baby_info.csv")
date=df_tb2[‘birthday‘].astype(‘str‘)#转换类型
year=df_tb2[‘birthday‘].astype(‘str‘).apply(lambda x:x[0:4])#截取前4列
year.astype(‘int‘)#转换成int类型
age=year.astype(‘int‘).apply(lambda x: 2020-x)#现在时间减去出生日期
df_tb2[‘age‘]=age#添加新的一列
df_tb2

技术分享图片

# 合并数据  左连接
df_tb2=pd.merge(df_tb2,df_tb1,how=‘left‘)
df_tb2

技术分享图片

day=df_tb2[‘day‘].astype(‘str‘)#转换类型
type(day)#查看类型
day=df_tb2[‘day‘].astype(‘str‘).apply(lambda x:x[0:4])
day
day.astype(‘int‘)
df_tb2[‘2013~2015年销售量‘]=day
df_tb2

技术分享图片

df_tb2.groupby(‘2013~2015年销售量‘).sum().sort_values(by=‘2013~2015年销售量‘, ascending=False).head(3)[‘buy_mount‘]#分组求和排序

技术分享图片

num=df_tb2[‘gender‘].value_counts().values#对gender分组求和
num=np.unique(num)#删除重复
num=np.append(num,955)#新增一列为总数量
num=DataFrame(num,index=[‘未知‘,‘男‘,‘女‘,‘总数量‘])
num.T#横向输出

技术分享图片

ages=df_tb2[‘age‘].value_counts().sort_index().values
ages=np.append(ages,955)
ages=DataFrame(ages,index=[‘五岁‘,‘六岁‘,‘七岁‘,‘八岁‘,‘九岁‘,‘十岁‘,‘十一岁‘,‘十二岁‘,‘十三岁‘,‘十四岁‘,‘十五岁‘,‘十六岁‘,‘十七岁‘,‘十八岁‘,‘三十六岁‘,‘总数量‘])
ages.T

技术分享图片

Pandas练习(一)

原文:https://www.cnblogs.com/James-221/p/13810925.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!