Pandas中的数据结构（1）：Series

Series是一个一维的带有标记的数组，它可以储存任何类型的数据。

对于Series，它的参数index是一个轴标签的list，对于不同类型的数据，index的类型可能不同：

1）ndarray：

如果数据的类型是ndarry，则数据的数量应该与index的数量相等。如果没有输入index参数，则会自动生成形如[0, ..., len(data) - 1]的index list。

例：

ndarry的index

注：pandas支持重复的index

2）dict：

Series可以根据dict实例化：

根据dict实例化series

如果指定了index但是没有输入值，则pandas将会自动用NaN补齐：

自动补齐缺省值

3）标量：

如果数据是一个标量，则在生成Series时自动复制此标量给所有的index：

自动复制标量

Series的特性与ndarray相似，并且它对于大部分的numpy函数是合法参数。但是类似切片的操作也会同时将index切片。

切片操作

Series与固定大小的dict有相似的特性，你可以通过key获取value。

两个有不同label的Series也可以进行运算：

Name属性：

Series可以拥有一个name属性，name属性会在很多情况下被自动赋值，修改name属性可以使用rename方法。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。