一、收集文本统计数据wc
计数单词总数,行总数,字节总数和字符总数
可以对文件或STDIN中的数据运行
[root@localhost] wc 1.test
行数 字数 字节数
常用选项
-l 只计数行数
-w 只计数单词总数
-c 只计数字节总数
-m 只计数字符总数
-L 显示文件中最长行的长度
二、文本排序sort
把整理过的文本显示在STDOUT,不改变原始文件
sort [options] file(s)
常用选项
-r 执行反方向(由上至下)整理
-R 随机排序
-n 执行按数字大小整理
-f 选项忽略(fold)字符串中的字符大小写
-u 选项(独特,unique)删除输出中的重复行 去重
-t c 选项使用c作为字段界定符
uniq命令
uniq命令:从输入中删除前后相接的重复行
uniq [OPTION]...[FILE]...
-c:显示每行出现的次数
-d:仅显示重复过的行
-u:仅显示不曾重复的行
注:连续且完全相同方为重复
常和sort命令一起配合使用:
sort userlist.txt | uniq -c
比较文件diff
diff [OPTION] file