生信技巧每日分享day25-Pandas中dataframe的groupby方法

Pandas中的groupby方法是一种强大的数据聚合工具,可以对数据进行分组、聚合和转换等操作。下面是一些groupby的例子:

  • 创建一个示例数据集
import pandas as pd
data = {'Animal': ['Dog', 'Cat', 'Dog', 'Cat', 'Dog', 'Cat', 'Dog', 'Dog'],
        'Name': ['Max', 'Tiger', 'Rocky', 'Kitty', 'Molly', 'Lucy', 'Buddy', 'Charlie'],
        'Age': [3, 4, 2, 1, 5, 6, 4, 2],
        'Weight': [25, 15, 20, 10, 30, 18, 22, 28]}

df = pd.DataFrame(data)
  1. 按Animal列分组并计算平均值
grouped = df.groupby('Animal').mean()
print(grouped)

输出结果:

         Age  Weight
Animal             
Cat      3.5    14.3
Dog      3.5    24.2
  1. 按Animal列分组并计算每组的大小
# 按Animal列分组并计算每组的大小
grouped = df.groupby('Animal').size()

print(grouped)

输出结果:

AnimalCat    4
Dog    4
dtype: int64
  1. 定义一个自定义函数,用于计算每个组的最大年龄和最小体重之和
def my_func(group):
    return group['Age'].max() + group['Weight'].min()

# 按Animal列分组并应用自定义函数
grouped = df.groupby('Animal').apply(my_func)

print(grouped)

输出结果:

Animal
Cat    11
Dog    25
dtype: int64
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容