【1】模块功能
pandas模块主要用于数据预处理及数据清洗。
【2】Serise数据结构
1、Series(x):将容器x转换成Serise结构
print(Series([1,2,3]))
print(Series({'a':1,'b':2,'c':3}))
2、【Series对象的操作】
obj = Series([1,2,3],index=['a','b','c'])
(1)obj.index:获取obj对象的索引
print(obj.index)
(2)obj.values:获取obj对象的值
print(obj.values)
(3)obj['index']:获取obj对象索引(index)值
print(obj[''a])
obj['a'] = 6 #给对应的索引赋值。
print(obj)
(4)'index' in obj:判断index索引是否在obj的索引
print('a' in obj)
(5)obj.reindex([index]):指定index的顺序
print(obj.reindex(range(6),method='ffill&bfill',fill_value=?)
(6)obj.dropna():删除缺失值
print(obj.dropna())
【3】Dataframe数据结构
1、Dataframe(x):将字典转换成Dataframe格式
print(Dataframe({'city':['beijing','shanghai'],'year':[2016,2017],'pop':[10000,23333]},columns=[''year,'pop','city']))
2、【Dateframe对象的操作】
(1)frame_obj['column']:获取字段(column)对应的值
print(frame_obj['year'])
frame_obj['column'] = 100
(2)frame_obj.T:dataframe结构转置
print(frame_obj.T)
(3)frame_obj.dropna(how='all'&NA,axis=1&NA):删除缺失值
print(frame_obj.dropna(how='all',axis=1))
(4)frame_obj.fillna(value,inplace=True&False):填充缺失值
print(frame_obj.fillna(0,inplace=True))