Python 去重,统计,lambda函数

一、去重

df.drop_duplicates('item_name')

去重后

去重后计数

方法一:

df.drop_duplicates('item_name').count()

结果:50

方法二:

df['item_name'].nunique()

结果:50

附:nunique()和unique()的区别:

unique()是以 数组形式(numpy.ndarray)返回列的所有唯一值(特征的所有唯一值)

nunique()即返回的是唯一值的个数

比如:df['item_name'].unique()

二、lambda函数

要求:将下表中经验列将按周统计的转换为经验不限,保留学历

原表df1

df1['经验'] = df1['经验'].apply(lambda x: '经验不限'+ x[-2:] if '周' in x else x)

#解释:将‘5天/周6个月’变成‘经验不限’,然后保留学历‘本科’

方法二:定义函数

 def dataInterval(ss):

    if '周' in ss:

        return '经验不限'+ ss[-2:]

    return ss

 df1['经验'] = df1['经验'].apply(dataInterval)

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容