python是一门胶水语言,python程序能够以多种方式轻易地与其他语言的组件“粘接”在一起。
1.python数据分析常用类库
①IPython
ipython是python科学计算标准工具集的组成部分,同时是一个增强的python shell,目的是提高编写、测试、调试python代码的速度。
②NumPy
NumPy是一个python科学计算的基础包,它主要提供:
(1)快速高效的多维数组对象ndarray
(2)对数组执行元素级计算以及直接对数组执行数学运算的函数
(3)线性代数运算等等
还可作为算法之间传递数据的容器
③SciPy
一组专门解决科学计算中各种标准问题域的模块的集合,可用于插值、积分、优化、处理图像和特殊函数等。
④pandas
是python的数据分析核心库,为时间序列分析提供了很好的支持。提供了一系列能够快速、便捷地处理结构化数据的数据结构和函数。
⑤Matplotlib
2D绘图库
⑥scikit-learn
是一个简单有效的数据挖掘和数据分析工具。基本模块有数据预处理、模型选择、分类、聚类、数据降维和回归6个。
⑦Spyder
强大的交互式Python语言开发环境,提供高级的代码编辑、交互测试和调试等特性。