python_pandas模块

【1】模块功能

pandas模块主要用于数据预处理及数据清洗。

【2】Serise数据结构

1、Series(x):将容器x转换成Serise结构

print(Series([1,2,3]))

print(Series({'a':1,'b':2,'c':3}))

2、【Series对象的操作】

obj = Series([1,2,3],index=['a','b','c'])

(1)obj.index:获取obj对象的索引

print(obj.index)

(2)obj.values:获取obj对象的值

print(obj.values)

(3)obj['index']:获取obj对象索引(index)值

print(obj[''a])

obj['a'] = 6 #给对应的索引赋值。

print(obj)

(4)'index' in obj:判断index索引是否在obj的索引

print('a' in obj)

(5)obj.reindex([index]):指定index的顺序

print(obj.reindex(range(6),method='ffill&bfill',fill_value=?)

(6)obj.dropna():删除缺失值

print(obj.dropna())

【3】Dataframe数据结构

1、Dataframe(x):将字典转换成Dataframe格式

print(Dataframe({'city':['beijing','shanghai'],'year':[2016,2017],'pop':[10000,23333]},columns=[''year,'pop','city']))

2、【Dateframe对象的操作】

(1)frame_obj['column']:获取字段(column)对应的值

print(frame_obj['year'])

frame_obj['column'] = 100

(2)frame_obj.T:dataframe结构转置

print(frame_obj.T)

(3)frame_obj.dropna(how='all'&NA,axis=1&NA):删除缺失值

print(frame_obj.dropna(how='all',axis=1))

(4)frame_obj.fillna(value,inplace=True&False):填充缺失值

print(frame_obj.fillna(0,inplace=True))

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容