Pandas中的数据结构(1):Series

Series是一个一维的带有标记的数组,它可以储存任何类型的数据。

对于Series,它的参数index是一个轴标签的list,对于不同类型的数据,index的类型可能不同:

1)ndarray:

如果数据的类型是ndarry,则数据的数量应该与index的数量相等。如果没有输入index参数,则会自动生成形如[0, ..., len(data) - 1]的index list。

例:

ndarry的index

注:pandas支持重复的index

2)dict:

Series可以根据dict实例化:

根据dict实例化series

如果指定了index但是没有输入值,则pandas将会自动用NaN补齐:

自动补齐缺省值

3)标量:

如果数据是一个标量,则在生成Series时自动复制此标量给所有的index:

自动复制标量



Series的特性与ndarray相似,并且它对于大部分的numpy函数是合法参数。但是类似切片的操作也会同时将index切片。

切片操作

Series与固定大小的dict有相似的特性,你可以通过key获取value。

两个有不同label的Series也可以进行运算:




Name属性:

Series可以拥有一个name属性,name属性会在很多情况下被自动赋值,修改name属性可以使用rename方法。


©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容