本篇笔记为原书第七章节的内容。
- MultiIndex DataFrames
DataFrame多重索引
多重索引可看作是一包含多重标签的一索引对象(多级标签用元组对象来表示)。
元组是不可变数据结构,即创建后其数据是不可改变。
-
行列都为多重索引
-
从csv表格文件读取数据
- 查看dataframe的索引值:df.index
- 查看dataframe的索引名:df.index.names
- 查看dataframe的列索引值:df.columns
-
查看dataframe的列索引名:df.columns.names
- 取得多重索引的具体值 get_level_values()
neighborhoods_df.index.get_level_values('City') #取得city列的索引值
neighborhoods_df.columns.get_level_values('Category') #取得category的值
多重索引排序
-
sort_index()
-
参数level可以指定是对某索引列数据进行排序处理(支持多值)
-
参数axis可指定对列索引进行排序处理
-
读取数据
-
指定列名(注意层级关系)
-
loc()读取数据,支持行列索引切片组合进行数据提取
iloc()通过位置进行数据读取
-
xs()指定层级进行数据读取
索引操作 (具体查阅手册帮助)
- reorder_levels(order=new_order)
- reset_index()
- set_index()