首页 > 其他 > 详细

pandas 生成新的Dataframe

时间:2021-02-24 14:01:42      阅读:17      评论:0      收藏:0      [点我收藏+]

选择某些列

import pandas as pd

# 从Excel中读取数据,生成DataFrame数据
# 导入Excel路径和sheet name
df = pd.read_excel(excelName, sheet_name=sheetName)

# 读取某些列,生成新的DataFrame
newDf = pd.DataFrame(df, columns=[column1, column2, column3])

选择某些列和行

# 读取某些列,并根据某个列的值筛选行
newDf = pd.DataFrame(df, columns=[column1, column2, column3])[(df.column1 == value1) & (df.column2 == value2)]

添加新的列

# 第一种直接赋值
df["newColumn"] = newValue

# 第二种用concat组合两个DataFrame
pd.concat([oldDf, newDf])

更改某一列的值

# 第一种,replace
df["column1"] = df["column1"].replace(oldValue, newValue)

# 第二种,map
df["column1"] = df["column1"].map({oldValue: newValue})

# 第三种,loc
# 将column2 中某些行(通过column1中的value1来过滤出来的)的值为value2
df.loc[df["column1"] == value1, "column2"] = value2

补全缺失值

# fillna填充缺失值
df["column1"] = df["column1"].fillna(value1)

参考链接:https://www.cnblogs.com/jiangxinyang/p/9672785.html

pandas 生成新的Dataframe

原文:https://www.cnblogs.com/leoych/p/14440857.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!