python可以将boolean类型的值做加法运算 True + True == 2
pandas与numpy的使用方法类似,numpy是array,而pandas是series。
a = pd.Series([1, 2, 3, 4])
b = pd.Series([1, 2, 1, 2])
print a[0]
print a + b
print a * 2
print a >= 3
print a[a >= 3]
pandas可以将一个list当做另一个list的索引组成一个series,如employment = pd.Series(employment_values, index=countries),如果不指定,则默认索引是其所在位置0,1,2...
获取最大值所在的索引employment .argmax(),用employment .loc[employment .argmax()]获取其value
与numpy array不同,pandas的series的向量运算是根据索引去匹配运算的,如下
s1 = pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd'])
s2 = pd.Series([10, 20, 30, 40], index=['b', 'd', 'a', 'c'])
print s1 + s2
s1 = pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd'])
s2 = pd.Series([10, 20, 30, 40], index=['c', 'd', 'e', 'f'])
print s1 + s2
可以使用add方法填补缺失值
s1 = pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd'])
s2 = pd.Series([10, 20, 30, 40], index=['c', 'd', 'e', 'f'])
print s1.add(s2, fill_value=0)