20、pandas的透视表pivot_table

透视表pivot_table()是非常强大的汇总运算函数。在SQL语句和excel中透视表也是非常普遍的。

pivot_table()的主要参数有：

pivot_table()的主要参数

源数据：

源数据

使用pivot_table()进行透视表操作：

使用pivot_table()进行操作

values是要进行汇总、统计等运算的列，可以是多个（list格式）；

index是作为新表的列名，可以是多个（list格式）；

columns是作为新表的列名，可以是多个（list格式）；

aggfunc是做汇总的统计运算方法，常用的简单运算都可以，也可以是多种方法（每个不同的列指定一种方法），这样就可以免去了多次使用透视表在进行合并的麻烦。

使用多种计算方法：

分别使用sum和len进行计算

# 有趣的是多个汇总方法如果用aggfunc=['sum','count']，就会报错。而如果用numpy库的方法就正常（没有count函数）。

在不同的列使用不同的运算方法，可以使用字典的形式表明汇总方法：

用字典的形式表明汇总方法

不过这个跟excel的透视表相比还是缺少了一个汇总行，我们可以使用margins=True来添加行列合计：

使用margins=True来添加行列合计

还可以使用margins_name=' '来修改汇总行列的名称，当然了也可以使用rename()来修改：

margins_name=' '来修改汇总行列的名称

fill_value = 0是用来填充缺失值、空值。

dropna=True是跳过整行都是空缺值的行。

这样我们就把pivot_table()的参数都介绍了，pivot_table是经常使用的一个函数，结合简单的计算函数一起使用会有很好的效果。

我们还可以把经过pivot_table()处理过的数据导出到电脑的excel文件里：

导出到电脑的excel文件里

导出后的文件

最后编辑于：2017.12.28 17:20:38

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。