Python pandas包要点笔记

Pandas包是我使用最频繁的几个python包之一, 功能强大, 虽然由于项目的原因, 可能会使用R里面的tidyverse来实现同样的功能, 但pandas包也不能忽略.

同学习numpy一样, 学习pandas包的几个技巧无非也就是, 如何创建, 如何索引, 如何切片, 如何针对行和列进行操作, 当然由于Dataframe这个格式的存在, 数据的聚合, 新增列, 删除列, 删除重复等等操作也不可忽略. 并且当Python包和其它可视化包联用的时候, 功能也会变得无比强大, 也就是我们常说的一行代码出图.

太简单的使用方法也就不说了, 下面笔记中涉及到的一些函数, 要么真的真的用的很频繁, 要么用的不多,但是比较有用.

import pandas as pd

#Series部分
pd.Series.value_count()
pd.Series.describe() 
pd.Series.mean() 
pd.Series.sort_values(ascending=False)
pd.Series.map()

#DataFrame部分 
df.groupby("val")
df.get_group("group_val")

未完待续...

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容