Pandas有两种数据结构:Series和DataFrame。
首先要引入Pandas库和Numpy库
form pandas import Series,DataFrame
import pandas as pd
import numpy as np
1.1 Series
Series是一种类似于一维数组的对象,它是由一级数据以及一组与之相关的数据标签(即索引)组成。
1.1.1 创建Series的三种方法
1.通过list来创建Series
s1 = pd.Series([1,2,3,4])
2.通过numpy array来创建Series
s2=pd.Series(np.arange(10))
3.通过字典来创建Series
s3 = pd.Series({'1':1,"2":2,'3':3})
通常,我们希望创建的Series带有一个可以对各个数据点进行标记的索引:
s4= Series([4,5,8,1],index = ['D','A','C','F'])
1.1.2 Series的索引
Series的数据表现形式为:索引在左边,值在右边。
由于我们没有为数据指定索引,Pandas会自动生成一个0到N-1(N为数据的长度)的整数索引。可以通过Series的values和index属性来获取其数组表示形式的索引和对象
In [1]:
obj = Series([1,2,3,4,5])
obj
Out[1]:
0 1
1 2
2 3
3 4
4 5
dtype: int64
可以通过索引的方式选取Series中的单个或一组值:
obj2['A']
obj2[['C','F']]
1.1.3 Series的常用方法和属性
未完待续……