首页 > 其他 > 详细

动手学数据分析 PART1

时间:2021-07-14 10:17:05      阅读:12      评论:0      收藏:0      [点我收藏+]

本部分旨在了解数据的载入与初步观察,为下部分了解pandas建立基础,本部分重点在于记忆基本的载入、查看等命令。

1.1.1 任务一:导入numpy和pandas

技术分享图片

 

 更新numpy、pandas库的方式:

打开cmd

conda update conda:更新anaconda的管理工具conda

conda update anaconda:更新anaconda版本

python --version:查看python版本

conda update python:更新python版本

pip list:查看python所有的包及版本

pip show pip:来查看是python及其第三方库的管理工具pip的版本号

python -m pip install --upgrade pip:更新pip版本

pip install+库名:安装库

pip uninstall +库名:删除库

pip show +包名:查看包的版本

pip install --upgrade 包名:升级包

pip install --upgrade numpy

pip install --upgrade pandas:升级包!

1.1.2 任务二:载入数据

(1) 使用相对路径载入数据
(2) 使用绝对路径载入数据

技术分享图片

 

 

1.1.3 任务三:每1000行为一个数据模块,逐块读取

技术分享图片

 

逐块读取的含义是将海量大数据分成好几块进行处理。

应用场景一般有两种: 

1.使用pandas处理函数大数据时,如果直接使用pandas的read_csv()方法去读取这个csv文件,那服务器的内存是会吃不消的,因此用chunksize分而取之。

2.我们只需要读取其中的一部分数据,而不需要读取全部数据的时候。

1.1.4 任务四:将表头改成中文,索引改为乘客ID [对于某些英文资料,我们可以通过翻译来更直观的熟悉我们的数据]

技术分享图片

 

 

1.2.1 任务一:查看数据的基本信息

技术分享图片

 

 

1.2.2 任务二:观察表格前10行的数据和后15行的数据

技术分享图片

 

 技术分享图片

 

 

1.2.4 任务三:判断数据是否为空,为空的地方返回True,其余地方返回False

技术分享图片

1.3.1 任务一:将你加载并做出改变的数据,在工作目录下保存为一个新文件train_chinese.csv

技术分享图片

 

动手学数据分析 PART1

原文:https://www.cnblogs.com/todaywillbeAC/p/15009051.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!