首页 > 编程语言 > 详细

python--学习笔记8 数据规整化,清理、转换、合并、重塑

时间:2019-01-23 10:07:39      阅读:181      评论:0      收藏:0      [点我收藏+]

合并数据集

pandas.merge可根据一个或多个键将不同的DataFrame中的行连接起来。

pandas.concat可以沿着一条轴将多个对象堆叠到一起。

combine_first可以将重复数据编接在一起,用一个对象中的值去填充另一个对象中的缺失值,有点像数据库中的全外连接。

 

数据集的合并(merge)或连接(join)运算时通过一个或多个键将行链接起来的。这些运算时关系型数据库的核心。

1 import pandas as pd
2 from pandas import DataFrame
3 
4 df1 = DataFrame({key:[b,b,a,c,a,a,b],data1:range(7)})
5 df2 = DataFrame({key:[a,b,d],data2:range(3)})
6 pd.merge(df1,df2 ,on =key)

如果两个对象的列名不同,也可以通过 left_on,right_on来分别指定。

默认merge做的是Inner连接,也可以用 how=‘outer‘取外连接,左外 ‘left‘ 右外 ‘ right ‘等。


 

轴向连接

连接 concatenation,绑定 binding 或者堆叠 stacking。Numpy有一个用于合并原始Numpy数组的concatenation函数:

python--学习笔记8 数据规整化,清理、转换、合并、重塑

原文:https://www.cnblogs.com/yzhnm/p/10307111.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!