1、索引
2、关于复合操作
也可以把他们搞成一个函数
3、iloc的索引,关键的一点是 他是基于位置的索引
4、query方法
在pandas中,支持把字符串形式的查询表达式传入query方法来查询数据,其表达式的执行结果必须返回布尔列表。
在进行复杂索引时,由于这种检索方法无需像普通方法一样重复使用Dataframe的名字来引用列名,一般而言会使代码长度在不降低可读性的前提下有所减少
5、query方法中使用@引入外部变量
6、多级索引
多级索引中的loc索引器:关键的点是--多级索引中的单个元素以元组为单位的,所以,文章最开始的loc方法和iloc方法是适用的!!!
7、多级索引的构造
三种方法:from_tuples, from_arrays, from_product
8、索引的交换和删除
交换
swaplevel:只可以交换两个层
reorder_level:可以交换任意层
删除
droplevel: table.droplevel()
9、map
map 可以更灵活地对索引属性进行修改
10、reset_index
hhhhhhhh,其实我还是最常用这个函数了。。。之前总是全套reset_index()
11、关于索引的部分运算
由于集合的元素是互异的,但是索引中可能有相同的元素,先用 unique 去重后再进行运算。
12、isin函数的利用
isin函数是针对Series的方法!!!!!!!
使用的时候应该是 df.col.isin.....