from pandas import Series, DataFrame
import pandas as pd
1. pandas的两个主要数据结构:Series和DataFrame
-
Series
类似于一维数组对象,它由一组数据(各种NumPy数据类型)以及一组与之相关的标签(即索引)组成,例如:
1. obj=Series([4,7,-5,3]) #仅由一数组构成的Series对象
in[1]: obj
out[1]:
索引值 值
0 4
1 7
2 -5
3 3
2. obj2=Series([4,7,-5,3],index=['d','b','a','c']) #由一数组和索引值构成的Series对象
or states=['d','b','a','c']; nvalue=[4,7,-5,3]; obj2=Series(nvalue,states)
in[2]: obj2
out[2]:
索引值 值
d 4
b 7
a -5
c 3
3. sdata={'Ohio':3500,'Texac':71000,'Oregon':16000,'Utah':5000} #由字典构成的Series对象
obj3=Series(sdata)
in[3]: obj3
out[3]:
索引值 值
Ohio 4
Texac 7
Oregon -5
Utah 3
-
DataFrame
定义:表格型的数据结构,既有行索引,也有列索引,类似于Series的二维数据结构
1. data={'state':['Ohio','Ohio','Ohio','Nevada','Nevada'],
'year':[2000,2001,2002,2003,2004]
'pop':[1.5, 1.7, 3.6, 2.4, 2.9]}
in[4]: obj4
out[4]:
索引值 pop state year
0 1.5 Ohio 2000
1 1.7 Ohio 2001
2 3.6 Ohio 2002
3 2.4 Nevada 2003
4 2.9 Nevada 2004
最后编辑于 :
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。