首页 > 其他 > 详细

数据分析入门——pandas

时间:2019-08-03 19:13:29      阅读:61      评论:0      收藏:0      [点我收藏+]

一、介绍

  Pandas是一个开源的,BSD许可的库(基于numpy),为Python编程语言提供高性能,易于使用的数据结构和数据分析工具。

  官方中文文档:https://www.pypandas.cn/docs/

  本次演示使用数据来自github:https://github.com/jakevdp/PythonDataScienceHandbook/tree/master/notebooks/data

二、快速入门

  1.导入

  技术分享图片

  2.重点数据结构

    主要是series和dataframe

     所以一般情况下我们导入的是数据分析的三剑客:

      numpy Series DataFrame:(如果只导入pd,那就正常使用pd.Series即可了)

from pandas import Series,DataFrame

三、Series

  Series是Pandas中的一维数据结构,类似于Python中的列表和Numpy中的Ndarray,不同之处在于:Series是一维的,能存储不同类型的数据,有一组索引与元素对应。也就是加了索引的一维数据结构(索引不一定是0 1 2 3的数字)

  技术分享图片

  1.创建

    1)通过列表或者numpy数组进行创建,默认索引是0 1 2 3这样的整数索引。示例如上图

      想要指定索引,可以设置index参数:(创建的时候指定也是可以的)

      技术分享图片

      特别地,使用ndarray创建的series是引用,对series的改变会影响ndarray

    2)由字典创建

      技术分享图片

 

      

数据分析入门——pandas

原文:https://www.cnblogs.com/jiangbei/p/11295683.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!