Python 数据结构

标准数据类型

Python 3 中有六个标准的数据类型:

Number(数字)

String(字符串)

List(列表)

Tuple(元组)

Set(集合)

Dictionary(字典)

Python 3 的六个标准数据类型中:

不可变数据(3 个):Number(数字)、String(字符串)、Tuple(元组);

可变数据(3 个):List(列表)、Dictionary(字典)、Set(集合)。


NumPy 数据结构

NumPy(Numerical Python)是高性能科学计算和数据分析的基础包 主要包含 ndarray(N-dimensional array object) ufunc(universal function object)两种数据结构

multidimensional array of objects of all the same type(list of lists)

和list 相比存储更紧凑,读写更快,可进行向量和矩阵运算




Scipy   Scipy 在numpy arrays 的基础上提供大量的科学计算函数和工具。


Pandas 数据结构

pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。

Series: Series可以运用ndarray或字典的几乎所有索引操作和函数,融合了字典和ndarray的优点。

DataFrame :DataFrame是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔值等)。DataFrame既有行索引也有列索引,它可以被看做由Series组成的字典(共用同一个索引)。

DataFrame可以通过类似字典的方式或者.columnname的方式将列获取为一个Series。行也可以通过位置或名称的方式进行获取。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容