Python 清除重复值

from pandas import read_csv

df = read_csv('D://PDA//4.3//data.csv')

df表

#找出行重复的位置

dIndex = df.duplicated()

#根据某些列，找出重复的位置

dIndex = df.duplicated('id')

dIndex = df.duplicated(['id', 'key'])

#根据返回值，把重复数据提取出来

df[dIndex]

id key value

4 1251147 品牌 Apple

5 1251147 商品名称苹果iPad mini 3

#直接删除重复值

#默认根据所有的列，进行删除

newDF = df.drop_duplicates()

#当然也可以指定某一列，进行重复值处理

newDF = df.drop_duplicates('id')

最后编辑于：2017.12.10 02:09:06

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

赞1赞

赞赏

手机看全文