10.1.2 分组

1. 分组,透视,交叉

image.png

2. 分组

多层级的数据逻辑


image.png

导入英雄数据:


image.png

image.png

image.png

分组:

第一步:groupby,拿到一个对象。

image.png

通过对象的groups的属性可以拿到一个字典


image.png

第二步:将对象做一个聚合,所有能聚合的都会进行聚合

image.png

第三步:想拿到某些字段,做列访问,或者列表访问

image.png

image.png

多分组:第一步:

image.png

image.png

第二步:聚合

image.png

第三步:分组做不同的聚合

键值对的值怎么写:函数名,用字符串表示就可以了。


image.png

image.png

3.透视表 pd.pivot_table

image.png
image.png

参数说明:data:要操作的对象(表),values:要查看的值,index:要把哪一列分组作为行,columns:把哪一个作为列展示, aggfunc:聚合的函数,对观察的vlues值做什么操作。

image.png

结果:
image.png

因为远程没有刺客,所以最右上方是NaN空值。

69个英雄


image.png

透视表做不同列的聚合函数


image.png

透视表增加行方向和列方向的统计:margins = True


image.png

image.png

4.交叉表 pd.crosstab()

image.png

留意操作对象,没有data,那index=data.role_main等。不能直接用字符串。
需要给两列数据,看两列之间的关系。

方法一:

image.png

image.png

image.png

交叉表等同于数据表,统计个数:


image.png

image.png

方法二:
hero.crosstab

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容