1 查找文件夹占用大小
df 是disk free的缩写,是用来查看文件系统空间使用情况的
df -h
du 是disk usage的缩写,可以用来查看每个文件的占用空间以及递归的计算文件夹占用空间
du -ah --max-depth=1 / | sort -nr
du常用的选项
-h:以人类可读的方式显示
-a:显示目录占用的磁盘空间大小,还要显示其下目录和文件占用磁盘空间的大小
-s:显示目录占用的磁盘空间大小,不要显示其下子目录和文件占用的磁盘空间大小
-c:显示几个目录或文件占用的磁盘空间大小,还要统计它们的总和
--apparent-size:显示目录或文件自身的大小
-l :统计硬链接占用磁盘空间的大小
-L:统计符号链接所指向的文件占用的磁盘空间大小
2 wc 命令
用来统计文件的字符数 字节数 行数
使用模式 wc [option] {filename} 或者结合管道使用
-c 统计字节数。
-l 统计行数。
-m 统计字符数。这个标志不能与 -c 标志一起使用。
-w 统计字数。一个字被定义为由空白、跳格或换行字符分隔的字符串。
-L 打印最长行的长度。
-help 显示帮助信息
--version 显示版本信息
3 grep 命令
grep 是用来进行检索的操作
usage : grep [OPTION]... PATTERN [FILE]...
-n 显示行号
-r 递归的搜索文件夹
-d --directories=ACTION 如何处理遇到的文件夹 三个选择,read recurse skip
-d=skip
-d=read
-d=recurse
简单的查询某个字符串
检索目录下所有文件
4 awk
awk是行处理器 依次对每行进行处理
usage: awk '{[pattern] action}' {filenames}
awk
-F F是field缩写 表示使用哪个分隔符 默认是空格
awk里使用的正则不支持非贪婪匹配
$0表示当前行
$1 表示被分隔符分隔后的数组中的第一个
简单的打印
使用正则处理
awk '{match($0,/"name":("[^"]*")/,a); if(a[1] != "") print a[1]}' python
match(s,r,a)用r正则去匹配s串,将结果放到a数组里
如果a[1]不是空 那么打印即可
5 sort
以行为单位对文本内容进行排序
-u 去除重复行
-b 忽略每行前面开始出的空格字符。
-c 检查文件是否已经按照顺序排序。
-d 排序时,处理英文字母、数字及空格字符外,忽略其他的字符。
-f 排序时,将小写字母视为大写字母。
-i 排序时,除了040至176之间的ASCII字符外,忽略其他的字符。
-m 将几个排序好的文件进行合并。
-M 将前面3个字母依照月份的缩写进行排序。
-n 依照数值的大小排序。
-o<输出文件> 将排序后的结果存入指定的文件。
-r 以相反的顺序来排序。
-t<分隔字符> 指定排序时所用的栏位分隔字符。
+<起始栏位>-<结束栏位> 以指定的栏位来排序,范围由起始栏位到结束栏位的前一栏位。
--help 显示帮助。
--version 显示版本信息