pandas使用技巧【18】找到和移除重复行

简介: 本文介绍如何找到和移除重复行。
  1. duplicated()方法
  • 查看列是否重复
dataframe.colname.duplicated()
  • 查看整行是否重复
dataframe.duplicated()
  • 查看subset是否重复
dataframe.duplicated(subset = [])
  1. drop_duplicats()方法
    用于丢弃重复项
dataframe.drop_duplicats()
  1. 参数keep
    keep可以为first和last,表示是选择最前一项还是最后一项保留。
dataframe.duplicated(keep = "first")
dataframe.duplicated(keep = "last")

也可以设置布尔类型,当设为False时候,重复项将都被显示。

dataframe.duplicated(keep = "False")

附上小哥哥的视频链接Data analysis in Python with pandas
Youtube 🔗
哔哩哔哩 🔗

本系列文章列表
pandas使用技巧总览

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容