Pandas之cut函数完成数据分组

一、cut函数介绍

cut(Series,bins,right = True,labels = null )
Series:需要分组的数据【数据框的某列数据】
bins:分组的划分数组【列表】
right:分组的时候右边是否闭合,默认闭区间
labels:分组的自定义标签

实现步骤

1、数据准备
df = pd.read_excel("PycharmProjects/untitled/this/ant-learn-pandas/testforpandas/data1.xlsx",engine = "openpyxl")
print(df.head())
image.png
2、对人均GDP分组
bins = [min(df["人均GDP"]) - 1,2000,4000,6000,8000,max(df["人均GDP"]) + 1]
print(bins)

df["人均GDP分组"] = pd.cut(df.人均GDP,bins)
print(df)
image.png
3、自定义标签
#自定义标签
labels = ["2000一下","2001~4000","4001~6000","6001~8000","8000以上"]
df["人均GDP分组"] = pd.cut(df.人均GDP,bins,labels = labels)
print(df)
image.png
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容