3-20

什么是正则表达式?

作用和特殊字符一样。

 正则表达式是为处理大量的字符串及文本而定义的一套规则和方法。

 开发者 假设"@"代表“I am”,

"!"代表“oldboy”,

则执行echo "@!"的结果就是输出“I am oldboy”。

2、提高效率,快速获取到想要的内容。

3、适用于三剑客命令 grep(egrep),sed,awk 以行为单位处理。

易混淆事项

1、和通配符区别。

 2、开发人员正则,一般是Perl兼容正则表达式。

3、Linux系统三剑客正则表达式******。

环境准备:

export LC_ALL=C

分类:

 1、BRE grep

2、ERE egrep

.代表任意一个字符。

? 匹配前一个字符。

 a{n,m} 匹配前一个字符最少n次,最多m次

a{n,} 匹配前一个字符最少n次

 a{n} 匹配前一个字符正好n次

a{,m} 匹配前一个字符最多m次

(0)(0)   \1    \2                第一个括号 第二个括号

 egrep -o "(e)(s)\1\2" oldboy.txt ===== egrep -o "eses" oldboy.txt

Linux三剑客

awk            sed               grep

sed Sed是操作、过滤和转换文本内容的强大工具。

常用功能有对文件实现快速增删改查(增加、删除、修改、查询),

其中查询的功能中最常用的2大功能是过滤(过滤指定字符串)和取行(取出指定行)。

sed           [选项] [sed内置命令字符] [文件]

选项:

 -n 取消默认sed的输出,常与sed内置命令的p连用※

 -i 直接修改文件内容,而不是输出到终端。

如果不使用-i选项sed只是修改在内存中的数据,并不会影响磁盘上的文件※

sed的内置命令字符说明

s 替换

 g 全局global

p 打印print

d 删除delete

问题1:输出oldboy.txt的第2-3行内容※。

sed -n '2,3p' oldgirl.txt

问题2:过滤出含有oldboy字符串的行※。

 sed -n '/oldboy/p' oldgirl.txt

问题3:删除含有oldboy字符串的行※。

 sed '/oldboy/d' oldgirl.txt sed /oldboy/d oldgirl.txt

问题4:将文件中的oldboy字符串全部替换为oldgirl※。

 vim替换: :%s#oldboy#oldgirl#g s

ed 's#想替换啥#用啥替换#g' oldgirl.txt

 sed 's#oldboy#oldgirl#g' oldgirl.txt

修改文件: sed -i 's#oldboy#oldgirl#g' oldgirl.txt

问题5:将文件中的oldboy字符串全部替换为oldgirl,同时将QQ号码49000448改为31333741。

sed -e 's#oldboy#oldgirl#g' -e 's#49000448#31333741#g' oldgirl.txt I

删除指定行 sed -i '3d' oldgirl.txt

sed -i '5,8d' oldgirl.txt

练习sed 正则是贪婪匹配模式,人性是贪婪的。

方法1:

 [root@oldboyedu ~/test]# ifconfig eth0|sed -n 2p|sed 's#^.*inet ##g'|sed 's# netm.*$##g' 10.0.0.201

 方法:要取一个目标,删除目标两边的,就得到了目标: 先匹配上,然后在删除

 [root@oldboyedu ~]# ifconfig eth0|sed -n 2p|sed 's#^.*inet ##g'|sed 's# netm.*$##g' 10.0.0.201

[root@oldboyedu ~]# ifconfig eth0|sed -n 2p|sed -e 's#^.*inet ##g' -e 's# netm.*$##g' 10.0.0.201

[root@oldboyedu ~]# ifconfig eth0|sed -ne 's#^.*inet ##g' -e 's# netm.*$##gp' 10.0.0.201

[root@oldboyedu ~]# ifconfig eth0|sed -nr '2s#^.*inet (.*) netm.*$#\1#gp' 10.0.0.201

考试:ip add的输出取出IP。

 [root@oldboyedu ~]# ip add|sed -rn 's#^.*net (.*)/24.*$#\1#gp' 10.0.0.201

三剑客自身有特长的。

grep 过滤查找内容。筛子 sed 取行,替换,删除,追加

 awk 取列

cut 按列切割

-d 指定分隔符

-f指定哪列,多列用逗号

awk语法:

 awk [option] 'pattern{action}' file ... awk [参数] '条件{动作}' 文件 ...

参数: -F 指定分隔符 打印第一列:

 [root@oldboyedu ~]# awk -F ":" '{print $1}' oldboyedu.txt

列:$1第一列

$2第二列 以此类推....

$0 整行

$NF 最后一列

 倒数第一列 $(NF-1) 倒数第二列

练习:打印 1 2 和最后一列。

 [root@oldboyedu ~]# awk -F ":" '{print $1,$2,$NF}' oldboyedu.txt

问题1:取test.txt文件的第2行到第3行的内容。

 [root@oldboyedu ~]# awk 'NR>1&&NR<4' oldboyedu.txt [root@oldboyedu ~]# awk 'NR==2,NR==3' oldboyedu.txt

问题2:过滤出含有root字符串的行※。

 [root@oldboyedu ~]# awk '/root/' oldboyedu.txt

问题3:删除含有root字符串的行※。

 [root@oldboyedu ~]# awk '/^[^r]/' oldboyedu.txt [^r] 非r ^[^r] 以非r字符卡头

问题4:取文件的第一列、第三列和最后一列内容,并打印行号※。

 [root@oldboyedu ~]# awk -F ":" '{print NR,$1,$3,$NF}' oldboyedu.txt

 问题5:取出Linux中执行ifconfig eth0后对应的IP地址(只能输出IP地址)。

 [root@oldboyedu ~]# ifconfig eth0|awk 'NR==2{print $2}'

问题6:过滤文件中第一列内容匹配root的字符串,把符合的行的最后一列输出

 awk -F ":" '$1~/root/ {print $NF}' test.txt ~匹配

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 首先需要了解一下类的加载过程。类加载器的任务是根据一个类的全限定名来读取此类的二进制字节流到JVM中,然后转换为一...
    凯玲之恋阅读 11,289评论 0 2
  • 流景匆匆江自去,闻倦秋声,宿露餐风旅,怕见翠峰环碧树,更残照落英无数。 新月淡柳伤日暮,游目凭高,草色烟光乳,图画...
    晴鹤1阅读 1,729评论 7 7
  • 2006年,陈决定买房,首付了10万,余下是贷款。拿着购房合同问我,小吕怎么样,我心里苦笑,明知道不会有结...
    知知知LV阅读 669评论 0 0