Bash的基础特性
程序是由指令和数据组合而成。
程序的编程风格有过程式和对象式;
过程式:以指令为中心,数据服务于指令。
对象式:以数据为中心,指令服务于数据。
程序的执行方式 是运行计算机二进制指令。
编程语言有低级语言和高级语言之分,其中低级语言包括汇编语言,高级语言分为编译型和解释型语言。
编译型高级语言,通过编译器来对目标代码进行编写运行,如:C C++ JAVA
解释型高级语言,通过解释器来对机器代码进行编写运行,如:shell python perl
过程式编程分为:顺序执行、循环执行、选择执行
数据存储方式有数值和字符两大类。
编程程序语言有强类型和弱类型之分,强类型字符串与数值之间不能运算,弱类型是把所有要存储的数据都当成字符,不支持浮点数。
grep / sed / awk
grep是文本过滤(模式:pattern)工具,有grep / egrep / fgrep。
sed是文本编辑工具,Stream editor。
awk是Linux上实现gawk的文本报告生成器。
grep Global search REgular expression and print out the line.
作用是:文本搜索工具,根据用户指定的“模式”对目标文本逐行进行匹配检查,打印匹配到的行。
模式:是指由正则表达式字符及文本字符所编写的过滤条件。
REGEXP:是由一类特殊字符及文本字符所编写的模式,其中有些字符不表示字符字面意义,而表示控制或通配的功能。
grep [OPTIONS] PATTERN [FILE...]
--color=auto
-v 显示不能被pattern匹配到的行
-i 忽略字符大小写
-o 仅显示匹配到的字符串
-q 静默模式,不输出任何信息
-A 显示匹配到字符的后几行,如grep -A 2 root,表示显示root后两行的信息
-B 显示匹配到字符的前几行
-C 表示匹配到字符的前后各几行
-E 使用ERE
基本正则表达式元字符
字符匹配:
. 匹配任意单个字符
[] 指定范围内的任意单个字符
[^] 指定范围外的任意单个字符
[:digit:] 任意数字,0-9
[:lower:] 任意小写字母
[:upper:] 任意大写字母
[:alpha:] 大小写字母
[:alnum:] 任意数字或字母
[:space:] 空格
[:punct:] 标点符号
匹配次数:
* 匹配前面的字符任意次,如grep "r*t" /etc/passwd
.* 任意长度的任意字符,如grep "r.*t" /etc/passwd
\? 匹配前面字符0或1次,即前面可有可无,如grep 'r\?' /etc/passwd
\+ 匹配其前面字符至少一次,grep 'r\+' /etc/passwd
\{m\} 匹配前面字符m次,grep 'o\{2\}' /etc/passwd
\{m,n} 匹配前面字符至少m次,最多n次,grep '\o{2,2}' /etc/passwd
\{0,n} 最少匹配0次
\{m,\} 最少匹配m次,最多不限制
位置锚定
^ 行首锚定
$ 行尾锚定
^$ 空格空行
^[[:space:]]*$ 空行
< 词首锚定,用于单词模式左侧
> 词尾锚定
<PATTERN> 匹配整个单词
分组:将一个或多个字符捆绑在一起,当作一个整体进行处理。
后向引用:引用前面的分组括号中的模式所匹配的字符。
分组括号中的模式匹配到的内容会被正则表达式引擎记录于内部的变量中,这些变量的命令方式为:\1,\2,\3...
如:\(ab\+\(xy\)*\)
\1 ab\+\(xy\)
\2 xy
显示/proc/meminfo文件中以大小写s开头的行。
grep -i "^s" /proc/meminfo
grep "^[sS]" /proc/meminfo
显示/etc/passwd中不以/bin/bash结尾的行。
grep -v '/bin/bash$' /etc/passwd
显示/etc/passwd文件中ID号最大的用户名
sort -t: -k3 -n /etc/passwd |cut -d: -f1 |tail -1