Python分组分析简单实例

分组分析是指根据字段分组,将分析对象划分成不同的部分,以进行对比分析各组之间的差异性的一种分析方法。

常用的统计指标:计数、求和、平均值

分组统计函数:

groupby(by=[分组列1,分组列2,...])[统计列1,统计列2,...].agg({统计列别名1:统计函数1,统计列别名2:统计函数2,...})

参数说明:

by:用于分组的列

中括号:用于统计的列

agg:统计别名显示统计值的名称,统计函数用于统计数据

常用统计函数:size计数,sum求和,mean均值

但是当我使用这个函数时,系统报错

FutureWarning: using a dict on a Series for aggregation is deprecated and will be removed in a future version

或者

FutureWarning: using a dict with renaming is deprecated and will be removed in a future version return super(DataFrameGroupBy, self).aggregate(arg, *args, **kwargs)

这是由于Python升级不再使用这个函数语法了。

经修改

PyCharm

正常运行。

原始数据

data

分组统计后:

aggResult
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • pyspark.sql模块 模块上下文 Spark SQL和DataFrames的重要类: pyspark.sql...
    mpro阅读 9,826评论 0 13
  • pyspark.sql module Module context Spark SQL和DataFrames中的重...
    盗梦者_56f2阅读 5,638评论 0 19
  • 包(lib)、模块(module) 在Python中,存在包和模块两个常见概念。 模块:编写Python代码的py...
    清清子衿木子水心阅读 3,894评论 0 27
  • 我是日记星球的114号星宝宝,这是我的第50篇日记。 精力,就是做事的能力,包括身体的、情感的、思想的和精神的四种...
    书香天使阅读 2,744评论 5 5
  • 你 还是那么机灵伶俐 还是那么聪慧过人 还是那么才华横溢 只是 多年后的你 为何还是 披着虚伪的外衣 曾经是那么信...
    蓬莱紫阅读 235评论 9 6

友情链接更多精彩内容