上文讲解了如何解决pivot_table处理之后的多重索引问题,原文链接:https://www.jianshu.com/p/867aba9cef87
本文介绍另一种方法,解决方法如下:
df_1为数据源,包含5列,amount列为数值列,用于聚合;
创建数据透视表,index=['group_series', 'buy_no'],columns=['xmonth'],NA值用0填充,结果如下:
# 创建透视表df_1_out2
df_1_out2=pd.pivot_table(df_1, index=['group_series', 'buy_no'], columns=['xmonth'], values=['amount'], aggfunc='sum', fill_value=0)
# 查看列索引
df_1_out2.columns
# 对多重列索引进行处理
df_1_out2.columns =[s1 +'_'+ s2 for (s1,s2) in df_1_out2.columns.tolist()]
# 查看效果
df_1_out2.columns