删除重复

使用列表删除重复

input_file = open("infile.txt")
out_file = open("outfile.txt","w")
unique = []
for line in input_file:
    if line not in unique:
        output_file.write(line)
        unique.append(line)
output_file.close()

如果不关心记录的顺序,还可以使用集合删除重复,可以将数据全部读进一个集合

input_file = open("infile.txt")
output_file = open("outfile.txt","w")
unique = set(input_file)
for line in unique:
    output_file.write(line)

在本例中,通过将行读取至集合unique = set(input_file)的办法,将输入文件的行添加到名为unique的集合,集合是唯一元件的无序基和,因此与集合中的现有文件行完全相同多个行就不会被添加进去了

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 说明: ArrayList 是Java中最常用的集合类型之一。它允许灵活添加多个null元素,重复的元素,并保...
    颠颠大王阅读 894评论 0 1
  • Excel里边有个删除重复数据的功能;PowerQuery也有同样的功能。 但是Excel的去重功能,最好是扩展选...
    PowerQuery阅读 10,936评论 0 2
  • 在sql的使用中,我们总是碰到需要删除重复数据的情况,但是又不能全部删除完,必须要保留至少一个重复的数据。重复的记...
    456又阅读 10,900评论 0 0
  • 马鞭草 淡淡的花蕊,透出诱人的美 蝶愿为你起舞,也会为你着迷 金秋里盛开着,依然妩媚 生命里流动着典雅 笑看风清云...
    兰如纯阅读 240评论 0 0
  • 微风拂过,夜半微凉…一缕微光代替月亮洒下它的光芒;身影在月光的隐射下显得清晰自如…也许真是:“似此星辰非昨夜,为谁...
    桃子仙阅读 193评论 0 0