import pandas as pd
import numpy as np
# 创建一个 DataFrame 对象
ipl_data = {'Team': ['Riders', 'Riders', 'Devils', 'Devils', 'Kings',
'kings', 'Kings', 'Kings', 'Riders', 'Royals', 'Royals', 'Riders'],
'Rank': [1, 2, 2, 3, 3,4 ,1 ,1,2 , 4,1,2],
'Year': [2014,2015,2014,2015,2014,2015,2016,2017,2016,2014,2015,2017],
'Points':[876,789,863,673,741,812,756,7988,64,701,804,690]}
df = pd.DataFrame(ipl_data)
print (df)
# 将数据拆分组
print (df.groupby('Team'))
# 查看分组
print (df.groupby('Team').groups)
# 多列分组
print (df.groupby(['Team','Year']).groups)
grouped = df.groupby('Year')
# 迭代遍历分组
for name,group in grouped:
print (name)
print (group)
# 获取一个分组
print('Get group 2014: ')
print (grouped.get_group(2014))
# 聚合
print('Group agg: test mean ')
print (grouped['Points'].agg(np.mean))
# 多个聚合函数
agg = grouped['Points'].agg([np.sum, np.mean, np.std])
print (agg)
# 过滤
filter = df.groupby('Team').filter(lambda x: len(x) >= 3)
print (filter)
groupby
©著作权归作者所有,转载或内容合作请联系作者
- 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
- 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
- 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
推荐阅读更多精彩内容
- 最近收到一个需求:开发了一个报名功能,因为一些特殊原因,用户可以重复报名,但是要在前端标记出来哪些用户是重复报名的...
- 【创星者品牌学院】每日一讲 创建品牌,尤其是像成为强势品牌,需要从消费者开始,从消费者普遍关心的四个基本问题开始:...