3-20

什么是正则表达式？

作用和特殊字符一样。

正则表达式是为处理大量的字符串及文本而定义的一套规则和方法。

开发者假设"@"代表“I am”，

"!"代表“oldboy”，

则执行echo "@!"的结果就是输出“I am oldboy”。

2、提高效率，快速获取到想要的内容。

3、适用于三剑客命令 grep（egrep）,sed,awk 以行为单位处理。

易混淆事项

1、和通配符区别。

2、开发人员正则，一般是Perl兼容正则表达式。

3、Linux系统三剑客正则表达式******。

环境准备：

export LC_ALL=C

分类：

1、BRE grep

2、ERE egrep

.代表任意一个字符。

？匹配前一个字符。

a{n,m} 匹配前一个字符最少n次，最多m次

a{n,} 匹配前一个字符最少n次

a{n} 匹配前一个字符正好n次

a{,m} 匹配前一个字符最多m次

(0)(0) \1 \2 第一个括号第二个括号

egrep -o "(e)(s)\1\2" oldboy.txt ===== egrep -o "eses" oldboy.txt

Linux三剑客

awk sed grep

sed Sed是操作、过滤和转换文本内容的强大工具。

常用功能有对文件实现快速增删改查（增加、删除、修改、查询），

其中查询的功能中最常用的2大功能是过滤（过滤指定字符串）和取行（取出指定行）。

sed [选项] [sed内置命令字符] [文件]

选项：

-n 取消默认sed的输出，常与sed内置命令的p连用※

-i 直接修改文件内容，而不是输出到终端。

如果不使用-i选项sed只是修改在内存中的数据，并不会影响磁盘上的文件※

sed的内置命令字符说明

s 替换

g 全局global

p 打印print

d 删除delete

问题1：输出oldboy.txt的第2-3行内容※。

sed -n '2,3p' oldgirl.txt

问题2：过滤出含有oldboy字符串的行※。

sed -n '/oldboy/p' oldgirl.txt

问题3：删除含有oldboy字符串的行※。

sed '/oldboy/d' oldgirl.txt sed /oldboy/d oldgirl.txt

问题4：将文件中的oldboy字符串全部替换为oldgirl※。

vim替换： :%s#oldboy#oldgirl#g s

ed 's#想替换啥#用啥替换#g' oldgirl.txt

sed 's#oldboy#oldgirl#g' oldgirl.txt

修改文件： sed -i 's#oldboy#oldgirl#g' oldgirl.txt

问题5：将文件中的oldboy字符串全部替换为oldgirl，同时将QQ号码49000448改为31333741。

sed -e 's#oldboy#oldgirl#g' -e 's#49000448#31333741#g' oldgirl.txt I

删除指定行 sed -i '3d' oldgirl.txt

sed -i '5,8d' oldgirl.txt

练习sed 正则是贪婪匹配模式，人性是贪婪的。

方法1：

[root@oldboyedu ~/test]# ifconfig eth0|sed -n 2p|sed 's#^.*inet ##g'|sed 's# netm.*$##g' 10.0.0.201

方法:要取一个目标，删除目标两边的，就得到了目标：先匹配上，然后在删除

[root@oldboyedu ~]# ifconfig eth0|sed -n 2p|sed 's#^.*inet ##g'|sed 's# netm.*$##g' 10.0.0.201

[root@oldboyedu ~]# ifconfig eth0|sed -n 2p|sed -e 's#^.*inet ##g' -e 's# netm.*$##g' 10.0.0.201

[root@oldboyedu ~]# ifconfig eth0|sed -ne 's#^.*inet ##g' -e 's# netm.*$##gp' 10.0.0.201

[root@oldboyedu ~]# ifconfig eth0|sed -nr '2s#^.*inet (.*) netm.*$#\1#gp' 10.0.0.201

考试：ip add的输出取出IP。

[root@oldboyedu ~]# ip add|sed -rn 's#^.*net (.*)/24.*$#\1#gp' 10.0.0.201

三剑客自身有特长的。

grep 过滤查找内容。筛子 sed 取行，替换，删除，追加

awk 取列

cut 按列切割

-d 指定分隔符

-f指定哪列，多列用逗号

awk语法：

awk [option] 'pattern{action}' file ... awk [参数] '条件{动作}' 文件 ...

参数: -F 指定分隔符打印第一列：

[root@oldboyedu ~]# awk -F ":" '{print $1}' oldboyedu.txt

列：$1第一列

$2第二列以此类推....

$0 整行

$NF 最后一列

倒数第一列 $(NF-1) 倒数第二列

练习：打印 1 2 和最后一列。

[root@oldboyedu ~]# awk -F ":" '{print $1,$2,$NF}' oldboyedu.txt

问题1：取test.txt文件的第2行到第3行的内容。

[root@oldboyedu ~]# awk 'NR>1&&NR<4' oldboyedu.txt [root@oldboyedu ~]# awk 'NR==2,NR==3' oldboyedu.txt

问题2：过滤出含有root字符串的行※。

[root@oldboyedu ~]# awk '/root/' oldboyedu.txt

问题3：删除含有root字符串的行※。

[root@oldboyedu ~]# awk '/^[^r]/' oldboyedu.txt [^r] 非r ^[^r] 以非r字符卡头

问题4：取文件的第一列、第三列和最后一列内容，并打印行号※。

[root@oldboyedu ~]# awk -F ":" '{print NR,$1,$3,$NF}' oldboyedu.txt

问题5：取出Linux中执行ifconfig eth0后对应的IP地址（只能输出IP地址）。

[root@oldboyedu ~]# ifconfig eth0|awk 'NR==2{print $2}'

问题6：过滤文件中第一列内容匹配root的字符串，把符合的行的最后一列输出

awk -F ":" '$1~/root/ {print $NF}' test.txt ~匹配

推荐阅读更多精彩内容