Ser---
什么是pandas?
pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。
- series 系列
定义个一个只有一列的数据
series = pd.Series(['Dave', 'Cheng-Han', 'Udacity', 42, -1789710578])
print series
认帮你从0开始标记排序
运行结果:
0 Dave
1 Cheng-Han
2 Udacity
3 42
4 -1789710578
定义个指定角标的列
series = pd.Series(['Dave', 'Cheng-Han', 359, 9001],
index=['Instructor', 'Curriculum Manager',
'Course Number', 'Power Level'])
print series
运行结果:
Instructor Dave
Curriculum Manager Cheng-Han
Course Number 359
Power Level 9001
从指定的位置取值
series = pd.Series(['Dave', 'Cheng-Han', 359, 9001],
index=['Instructor', 'Curriculum Manager',
'Course Number', 'Power Level'])
print series['Instructor']
print series[['Instructor', 'Curriculum Manager', 'Course Number']]
运行结果:
Dave
Instructor Dave
Curriculum Manager Cheng-Han
Course Number 359
直接对数据做运算操作:
cuteness = pd.Series([1, 2, 3, 4, 5], index=['Cockroach', 'Fish', 'Mini Pig',
'Puppy', 'Kitten'])
print cuteness > 3 #判断列中值是否比3大
print ""
print cuteness[cuteness > 3] #找出列中比3大的项
运行结果:
#判断列中值是否比3大
Cockroach False
Fish False
Mini Pig False
Puppy True
Kitten True
#找出列中比3大的项
Puppy 4
Kitten 5