NumPy是Python科学计算的基础包。它提供了以下功能:
除了为Python提供快速的数组处理能力,NumPy在数据分析方面还有另外一个主要作用,即作为在算法之间传递数据的容器。对于数值型数据,NumPy数组在存储和处理数据时要比内置的Python数据结构高效得多。此外,由低级语言编写的库可以直接操作NumPy数组中的数据,无需进行任何数据复制工作。
pandas提供了使我们能够快速便捷地处理结构化数据的大量数据结构和函数。很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。例如,pandas中的对象之一DataFrame,它是一个面向列的二维表结构,且含有行标和列标:
pandas兼具NumPy高性能的数组计算功能以及电子表格和关系型数据库灵活的数据处理功能。它提供了复杂精细的索引功能,以便更为便捷地完成重塑、切片和切块、聚合以及选取数据子集等操作。pandas将是数据处理的主要工具。
对于金融行业的用户,pandas提供了大量适用于金融数据的高性能时间序列功能和工具。
matplotlib是最流行的用于绘制数据图表的Python库。它跟IPython结合的很好,因而提供了一种非常好用的交互式数据绘图环境。绘制的图表也是交互式的,可以利用绘图窗口中的工具栏放大图表中的某个区域或对整个图表进行平移浏览。
IPython是Python科学计算标准工具集的组成部分,它将其他所有的东西联系在一起。它为交互式和探索式计算提供了一个强壮而高效的环境。它是一个增强的Python控制台,目的是提高编写、测试、调试代码的效率。它主要用于交互式数据处理和利用matplotlib对数据进行可视化处理。
SciPy是一组专门解决科学计算中各种标准问题域的包的集合,主要包括:
NumPy和SciPy的有机结合完全可以替代MATLAB的计算功能。
原文:https://www.cnblogs.com/yszd/p/13995035.html