1. Reindexing(重新索引)
在series上调用reindex能更改index,如果没有对应index的话会引入缺失数据
2. Dropping Entries from an Axis (按轴删除记录)
对于series,drop回返回一个新的object,并删去你制定的axis的值
列处理:drop列的话,设定axis=1或axis='columns':
data.drop('two', axis=1)
data.drop(['two', 'four'], axis='columns')
3. Indexing, Selection, and Filtering(索引,选择,过滤)
series indexing(obj[...]) 相当于numpy的array indexing, 而且除了整数,还可以使用series的index
这里有好多具体的方法,我感觉可以用的时候再过来看和总结。。。。
4. Integer Indexes(整数索引)
5. Arithmetic and Data Alignment (算数和数据对齐)
pandas一个有用的feature就是,不同index的obejct之间的算数计算。如果两个object相加,但他们各自的index并不相同,最后结果得到的index是这两个index的合集
这种数据对齐的方式(internal data alignment)引入了很多缺失值在没有对应的位置上。这些缺失值会被用在之后的算数计算中。
即使原本有值的位置,因为另一个object中不存在这个index或column,会再相加后的object中变成NaN
在DataFrame中,数据对齐同时发生在行和列上
因为'c'和'e'列都不在两个DataFrame里,所有全是缺失值。对于行,即使有相同的,但列不一样的话也会是缺失值。
如果两个DataFrame相加,而且没有column和row,结果会全是null
使用fill_value可以将NaN替换成两个object中有的那个位置的值。
Operations between DataFrame and Series (DataFrame和Series之间的操作)
6. Operations between DataFrame and Series (DataFrame和Series之间的操作)
numpy的ufuncs(element-wise数组方法)也能用在pandas的object上
7. Sorting and Ranking (排序)
按row或column index来排序的话,可以用sort_index方法,会返回一个新的object