1.pandas的数据结构介绍
1.1Series
series类似于一维数组的对象,由一组数据以及与之相关的数据标签即索引组成。
series的字符串:索引在左,值在右,如果不为数据指定索引,则会自动创建一个0—N-1的整数型索引
numpy数组运算都会保留索引和值之间的链接
可以将series看成是一个定长的有序字典,因为它是索引值到数据值的一个映射
sdata中跟states索引相匹配的3个值会被找出来并放到相应的位置上,但california所对应的sdata找不到,所以其结果就为NaN(not a number)
1.2 DataFrame
dataframe是一个表格型的数据结构,含有一组有序的列,每列可以使不同的值类型。
dataframe既有行索引也有列索引,可以被看做由series组成的字典
dataframe里面的数据是以一个或多个二位块存放的
1.3 索引对象
pandas的索引对象负责管理轴标签和其他元数据,index对象不可修改
2.基本功能
2.1重新索引
reindex:创建一个适应新索引的新对象