DataFrame是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔值等),DataFrame既有行索引也有列索引。
建DataFrame, 传入一个由等长列表或NumPy数组组成的字典:
data = {'state': ['Ohio', 'Ohio', 'Ohio', 'Nevada', 'Nevada', 'Nevada'],
'year': [2000, 2001, 2002, 2001, 2002, 2003],
'pop': [1.5, 1.7, 3.6, 2.4, 2.9, 3.2]}
frame = pd.DataFrame(data)
特别大的DataFrame,head方法会选取前五行
如果指定了列序列,则DataFrame的列就会按照指定顺序进行排列
将DataFrame的列获取为一个Series
行也可以通过位置或名称的方式进行获取
可以给那个空的”debt”列赋上一个标量值或一组值
如果赋值的是一个Series,就会精确匹配DataFrame的索引,所有的空位都将被填上缺失值
为不存在的列赋值会创建出一个新列。关键字del用于删除列。
如果嵌套字典传给DataFrame,pandas就会被解释为:外层字典的键作为列,内层键则作为行索引
对DataFrame进行转置(交换行和列)
设置了DataFrame的index和columns的name属性,则这些信息也会被显示出来
values属性也会以二维ndarray的形式返回DataFrame中的数据
如果DataFrame各列的数据类型不同,则值数组的dtype就会选用能兼容所有列的数据类型: