Stata+Python+R系列5:重复值处理

日常处理数据时会使用Stata、Python和R,但疏于梳理总结,常会犯迷糊或是忘记命令。趁着学校尚未允许返校,有着整块时间可做小结,边干边精进。

由于各软件命令众多,以下仅为自己常用的一些,欢迎大家补充和交流~

友情提示:命令参数比较多,建议大家使用时多看帮助文档,添加合适的参数。

一、Stata

*1.查看重复值情况
duplicates list xxx
duplicates report xxx
duplicates tag xxx, gen(tag1)

*外部命令
unique xxx

*2.删除重复值
duplicates drop xxx, force

二、Python

#1.查看缺失值情况
data.duplicated(xxx)

#2.删除重复值
#列表
list(set(xxx))

#pandas序列、数据框
data.drop_duplicates() 

三、R

#1.查看缺失值情况
duplicated(data$A)

#2.删除重复值
data[!duplicated(data$A),]  

unique(data$A) 

dplyr::distinct(data,A) 
重复值处理.png
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 日常处理数据时会使用Stata、Python和R,但疏于梳理总结,常会犯迷糊或是忘记命令。趁着学校尚未允许返校,有...
    凡有言说阅读 1,979评论 1 1
  • 日常处理数据时会使用Stata、Python和R,但疏于梳理总结,常会犯迷糊或是忘记命令。趁着学校尚未允许返校,有...
    凡有言说阅读 634评论 0 0
  • 日常处理数据时会使用Stata、Python和R,但疏于梳理总结,常会犯迷糊或是忘记命令。趁着学校尚未允许返校,有...
    凡有言说阅读 439评论 0 0
  • 日常处理数据时会使用Stata、Python和R,但疏于梳理总结,常会犯迷糊或是忘记命令。趁着学校尚未允许返校,有...
    凡有言说阅读 640评论 1 1
  • 重楼有月, 同拂新霜。 梧桐影转, 白发轻簪。 原竟忘贫, 露滴芙蓉愁。 旧赏烟霄远, 空瘦损、向谁道。 谁无一轴诗。
    李波波阅读 386评论 1 19