Python 清除重复值

from pandas import read_csv

df = read_csv('D://PDA//4.3//data.csv')

df


df表

#找出行重复的位置

dIndex = df.duplicated()

#根据某些列,找出重复的位置

dIndex = df.duplicated('id')

dIndex = df.duplicated(['id', 'key'])

#根据返回值,把重复数据提取出来

df[dIndex]


id  key          value

4  1251147    品牌          Apple

5  1251147  商品名称  苹果iPad mini 3


#直接删除重复值

#默认根据所有的列,进行删除

newDF = df.drop_duplicates()


#当然也可以指定某一列,进行重复值处理

newDF = df.drop_duplicates('id')


最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容