什么是正则表达式?
作用和特殊字符一样。
正则表达式是为处理大量的字符串及文本而定义的一套规则和方法。
开发者 假设"@"代表“I am”,
"!"代表“oldboy”,
则执行echo "@!"的结果就是输出“I am oldboy”。
2、提高效率,快速获取到想要的内容。
3、适用于三剑客命令 grep(egrep),sed,awk 以行为单位处理。
易混淆事项
1、和通配符区别。
2、开发人员正则,一般是Perl兼容正则表达式。
3、Linux系统三剑客正则表达式******。
环境准备:
export LC_ALL=C
分类:
1、BRE grep
2、ERE egrep
.代表任意一个字符。
? 匹配前一个字符。
a{n,m} 匹配前一个字符最少n次,最多m次
a{n,} 匹配前一个字符最少n次
a{n} 匹配前一个字符正好n次
a{,m} 匹配前一个字符最多m次
(0)(0) \1 \2 第一个括号 第二个括号
egrep -o "(e)(s)\1\2" oldboy.txt ===== egrep -o "eses" oldboy.txt
Linux三剑客
awk sed grep
sed Sed是操作、过滤和转换文本内容的强大工具。
常用功能有对文件实现快速增删改查(增加、删除、修改、查询),
其中查询的功能中最常用的2大功能是过滤(过滤指定字符串)和取行(取出指定行)。
sed [选项] [sed内置命令字符] [文件]
选项:
-n 取消默认sed的输出,常与sed内置命令的p连用※
-i 直接修改文件内容,而不是输出到终端。
如果不使用-i选项sed只是修改在内存中的数据,并不会影响磁盘上的文件※
sed的内置命令字符说明
s 替换
g 全局global
p 打印print
d 删除delete
问题1:输出oldboy.txt的第2-3行内容※。
sed -n '2,3p' oldgirl.txt
问题2:过滤出含有oldboy字符串的行※。
sed -n '/oldboy/p' oldgirl.txt
问题3:删除含有oldboy字符串的行※。
sed '/oldboy/d' oldgirl.txt sed /oldboy/d oldgirl.txt
问题4:将文件中的oldboy字符串全部替换为oldgirl※。
vim替换: :%s#oldboy#oldgirl#g s
ed 's#想替换啥#用啥替换#g' oldgirl.txt
sed 's#oldboy#oldgirl#g' oldgirl.txt
修改文件: sed -i 's#oldboy#oldgirl#g' oldgirl.txt
问题5:将文件中的oldboy字符串全部替换为oldgirl,同时将QQ号码49000448改为31333741。
sed -e 's#oldboy#oldgirl#g' -e 's#49000448#31333741#g' oldgirl.txt I
删除指定行 sed -i '3d' oldgirl.txt
sed -i '5,8d' oldgirl.txt
练习sed 正则是贪婪匹配模式,人性是贪婪的。
方法1:
[root@oldboyedu ~/test]# ifconfig eth0|sed -n 2p|sed 's#^.*inet ##g'|sed 's# netm.*$##g' 10.0.0.201
方法:要取一个目标,删除目标两边的,就得到了目标: 先匹配上,然后在删除
[root@oldboyedu ~]# ifconfig eth0|sed -n 2p|sed 's#^.*inet ##g'|sed 's# netm.*$##g' 10.0.0.201
[root@oldboyedu ~]# ifconfig eth0|sed -n 2p|sed -e 's#^.*inet ##g' -e 's# netm.*$##g' 10.0.0.201
[root@oldboyedu ~]# ifconfig eth0|sed -ne 's#^.*inet ##g' -e 's# netm.*$##gp' 10.0.0.201
[root@oldboyedu ~]# ifconfig eth0|sed -nr '2s#^.*inet (.*) netm.*$#\1#gp' 10.0.0.201
考试:ip add的输出取出IP。
[root@oldboyedu ~]# ip add|sed -rn 's#^.*net (.*)/24.*$#\1#gp' 10.0.0.201
三剑客自身有特长的。
grep 过滤查找内容。筛子 sed 取行,替换,删除,追加
awk 取列
cut 按列切割
-d 指定分隔符
-f指定哪列,多列用逗号
awk语法:
awk [option] 'pattern{action}' file ... awk [参数] '条件{动作}' 文件 ...
参数: -F 指定分隔符 打印第一列:
[root@oldboyedu ~]# awk -F ":" '{print $1}' oldboyedu.txt
列:$1第一列
$2第二列 以此类推....
$0 整行
$NF 最后一列
倒数第一列 $(NF-1) 倒数第二列
练习:打印 1 2 和最后一列。
[root@oldboyedu ~]# awk -F ":" '{print $1,$2,$NF}' oldboyedu.txt
问题1:取test.txt文件的第2行到第3行的内容。
[root@oldboyedu ~]# awk 'NR>1&&NR<4' oldboyedu.txt [root@oldboyedu ~]# awk 'NR==2,NR==3' oldboyedu.txt
问题2:过滤出含有root字符串的行※。
[root@oldboyedu ~]# awk '/root/' oldboyedu.txt
问题3:删除含有root字符串的行※。
[root@oldboyedu ~]# awk '/^[^r]/' oldboyedu.txt [^r] 非r ^[^r] 以非r字符卡头
问题4:取文件的第一列、第三列和最后一列内容,并打印行号※。
[root@oldboyedu ~]# awk -F ":" '{print NR,$1,$3,$NF}' oldboyedu.txt
问题5:取出Linux中执行ifconfig eth0后对应的IP地址(只能输出IP地址)。
[root@oldboyedu ~]# ifconfig eth0|awk 'NR==2{print $2}'
问题6:过滤文件中第一列内容匹配root的字符串,把符合的行的最后一列输出
awk -F ":" '$1~/root/ {print $NF}' test.txt ~匹配