首页 > 编程语言 > 详细

Python数据分析重要库Pandas:数据清洗后的数据整合

时间:2020-10-05 15:21:27      阅读:25      评论:0      收藏:0      [点我收藏+]

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。

技术分享图片

 

Pandas合并数据

组合或合并数据时,pandas 有几个不同选项。在 Jupyter的Notebook中,创建两个新的数据帧并合并数据。可以使用 append() 来合并这些数据帧。【案例】将城市名,人口和面积的两组数据合并。

技术分享图片

 

A..append()

技术分享图片

 

技术分享图片

 

技术分享图片

 

import pandas as pd
data = {‘city‘:[‘London‘,‘Manchester‘,‘Birmingham‘,‘Leeds‘,‘Glasgow‘],
        ‘population‘: [9787426,  2553379,2440986,1777934,1209143],
        ‘area‘:[1737.9,630.3,598.9,487.8,  368.5 ]}
cities = pd.DataFrame(data)
data2 = {‘city‘:[‘Liverpool‘,‘Southampton‘],
        ‘population‘: [864122,  855569],
        ‘area‘:[199.6,   192.0]}
cities2 = pd.DataFrame(data2)
cities = cities.append(cities2)
cities

其操作是“data1 = data1.append(data2)” 将data2连接到data1的尾部。再赋值给data1。要注意data1和data2应具有相同的结构。

B..concat()

frames = [cities, cities2]
df = pd.concat(frames)
df

像其在ndarray上的同级函数一样numpy.concatenate(),pandas.concat()采用同类对象的列表或字典。

技术分享图片

 

frames = [cities, cities2]
df = pd.concat(frames, keys=[‘x‘, ‘y‘])
df

加入关键字keys参数进行不同数据来源的区分。

技术分享图片

 

然后可以根据数据来源直接查看定位所需的数据。

df.loc[‘y‘]
技术分享图片

 

以上文章来源于源一学园,作者 房媛

转载地址

https://blog.csdn.net/fei347795790?t=1

Python数据分析重要库Pandas:数据清洗后的数据整合

原文:https://www.cnblogs.com/hhh188764/p/13769932.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!