linux中文件取交、并、差集

假如有这么两个文件test1和test2:


test1
test2

单纯的两个文件取交并差集,可以用awk或者comm等实现,但是有更简单的方法。

取交集:

sort test1 test2 | uniq -d  

uniq -d是指输出重复行。

取并集:

sort test1 test2 | uniq

取差集:

sort test1 test2 | uniq -u  

uniq -u是指的输出出现1次的行。

取并集可以考虑awk,也很简单:

awk '!a[$0]++' test1 test2

欢迎关注!

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。