Series
一、何为Series?
- Series是一种类似于一维数组的对象,它由一组数据(各种Numpy数据类型)以及一组与之相关的数据标签(即索引)组成
二、如何创建Series?
import pandas as pd
obj = pd.Series([4,7,-5,3])
obj2 = pd.Series([4,7,-5,3],index=['d','b','a','c'])
obj3 = pd.Series({'zhang':35, 'li':67, 'wang':78})
obj4 = pd.Series({'zhang':35, 'li':67, 'wang':78},index=['li','zhao','wang'])
-
obj4
:索引匹配并生成新的Series;近似于从Python字典中生成由某些特定键组成的子字典;可用于查找
三、Series的属性
-
values
属性:obj.values
-
index
属性:obj.index
-
name
属性:obj.name
,obj.index.name
四、Series的选取
- 基于索引选取:
obj2.loc['a']
(推荐)、obj2['a']
、obj2.loc[['a','d','b']]
(推荐)、obj2[['a','d','b']]
、obj2.loc['d':'a']
(推荐)、obj2['d':'a']
- 基于位置选取:
obj2.iloc[2]
(推荐)、obj2[2]
、obj2.iloc[[2,0,1]]
(推荐)、obj2[[2,0,1]]
、obj2.iloc[:2]
(推荐)、obj2[:2]
- 基于内容选取:
obj2[obj2 < 5]
五、Series的运算
- Series在算术计算时会根据索引自动对齐;可以忽略数据顺序的影响
六、Series检测缺失值的实例方法
obj4.isnull()
obj4.notnull()
七、Series赋值就地修改索引
obj.index = ['zhang','li','wang','zhao']