数据结构
Series
个人的理解,Series可以视作一组字典,key&value 对应 index&value。
如同字典,Series可以通过index(Key值)进行索引,此外,它依旧保留了通过位置进行选取的能力。
Series计算时,会自动根据索引对齐。
Series对象本身及索引都有一个name属性。
DataFrame
DataFrame的每一行每一列都是一个Series。书上P120末尾介绍了两种在DataFrame中选取出Series的方式,不建议尝试用frame2.year这种方式,因为在column名为python关键字时,他不会认为你是选取列,会报错。
DataFrame的索引方式,书上只有ix。此外还有loc和iloc方法。
loc方法根据index和column的名字选取,iloc根据index和column的位置进行选取。
ix即两者的结合体。当ix使用数字进行索引时,优先按loc方式进行索引。
Series的运算会根据index对齐,同样的,在赋值时,也会进行对齐操作,无索引的填入NA。
新建列使用同样的索引赋值方式, 关键字del用于删除列。
书上有句话说通过索引方式返回的是相应数据的视图,这个很好理解,看赋值的形式就明白。通过copy方式可以显式地复制。