pandas的数据结构

from pandas import  Series, DataFrame
import pandas as pd

1. pandas的两个主要数据结构:Series和DataFrame

  • Series
    类似于一维数组对象,它由一组数据(各种NumPy数据类型)以及一组与之相关的标签(即索引)组成,例如:
1. obj=Series([4,7,-5,3])  #仅由一数组构成的Series对象

in[1]: obj
out[1]:
索引值        值
  0           4
  1           7
  2          -5
  3           3
2. obj2=Series([4,7,-5,3],index=['d','b','a','c'])  #由一数组和索引值构成的Series对象
    or states=['d','b','a','c'];  nvalue=[4,7,-5,3]; obj2=Series(nvalue,states)

in[2]: obj2
out[2]:
索引值        值
  d           4
  b           7
  a          -5
  c           3
3. sdata={'Ohio':3500,'Texac':71000,'Oregon':16000,'Utah':5000}  #由字典构成的Series对象
   obj3=Series(sdata)  

in[3]: obj3
out[3]:
索引值        值
Ohio          4
Texac         7
Oregon       -5
Utah          3
  • DataFrame
    定义:表格型的数据结构,既有行索引,也有列索引,类似于Series的二维数据结构
1. data={'state':['Ohio','Ohio','Ohio','Nevada','Nevada'],
                  'year':[2000,2001,2002,2003,2004]
                   'pop':[1.5, 1.7, 3.6, 2.4, 2.9]}

in[4]: obj4
out[4]:
索引值     pop   state  year
0         1.5    Ohio  2000
1         1.7    Ohio  2001
2         3.6    Ohio  2002
3         2.4    Nevada  2003
4         2.9    Nevada  2004
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。