Day15-Linux正则表达式与三剑客awk实践

1、为何要使用正则表达式

1)给定一个正则表达式和另一个字符串,我们可以达到如下目的

2)给定的字符串是否符合正则表达式的过滤逻辑(称作“匹配”)

3)可以通过正则表达式,从字符串中获取我们想要的特定部分

4)取出文件中正确的身份证号码

5)帮我们快速过滤

2、正则表达式分类

1)POSIX规范将正则表达式分为两种

2)基本正则表达式(BRE,basic regular expression)

3)扩展正则表达式(ERE,extended regular expression)————高级功能

4) BRE和ERE的区别仅仅是元字符的不同,BRE(基础正则表达式)只承认的元字符有^ $ . [] *其他字符识别为普通字符

5)ERE(扩展正则表达式)则添加了() {} ?+ |等

6)只有在用反斜线“\”进行转义的情况下,字符(){} 才会BRE被当作元字符处理,而ERE中,任何元字符前面加上反斜杠反而会使其被当作普通字符来处理

3、正则与通配符区别

1)通配符

作用:查找文件名

支持的命令:Linux大部分命令都支持     以.txt 结尾的文件

2)正则

作用:在文件中过滤内容

支持的命令:三剑客sed,grep,awk            python  java

4、基础正则

1)正则表达式:为处理大量的字符串而定义的一套规则和方法,通过定义这些特殊符号的辅助,系统管理员可以快速过滤,替换或输出需要的字符串

环境:

[root@oldboyedu ~/test]# cat oldgirl.txt

I am oldboy teacher!

I like badminton ball ,billiard ball and chinese chess!

our site is http://www.oldboyedu.com

my qq num is 49000448.

问题1:输出oldboy.txt的第2-3行内容※。

[root@oldboyedu ~/test]# sed -n '2,3p' oldgirl.txt 

I like badminton ball ,billiard ball and chinese chess!

our site is http://www.oldboyedu.com

[root@oldboyedu ~/test]# head -3 oldgirl.txt |tail -2

I like badminton ball ,billiard ball and chinese chess!

our site is http://www.oldboyedu.com

问题2:过滤出含有oldboy字符串的行※。

[root@oldboyedu ~/test]# sed -n '/oldboy/p' oldgirl.txt 

I am oldboy teacher!

our site is http://www.oldboyedu.com

[root@oldboyedu ~/test]# grep oldboy oldgirl.txt

I am oldboy teacher!

our site is http://www.oldboyedu.com

问题3:删除含有oldboy字符串的行※。

[root@oldboyedu ~/test]# sed '/oldboy/d' oldgirl.txt 

I like badminton ball ,billiard ball and chinese chess!

my qq num is 49000448.

[root@oldboyedu ~/test]# grep -v "oldboy" oldgirl.txt

I like badminton ball ,billiard ball and chinese chess!

my qq num is 49000448.

问题4:将文件中的oldboy字符串全部替换为oldgirl※。

[root@oldboyedu ~/test]# sed 's#oldboy#oldgirl#g' oldgirl.txt

I am oldgirl teacher!

I like badminton ball ,billiard ball and chinese chess!

our site is http://www.oldgirledu.com

my qq num is 49000448.

vim替换:

问题5:将文件中的oldboy字符串全部替换为oldgirl,同时将QQ号码49000448改为31333741。

[root@oldboyedu ~/test]# sed -e 's#oldboy#oldgirl#2' -e 's#49000448#31333741#g' oldgirl.txt

I am oldboy teacher!

I like badminton ball ,billiard ball and chinese chess!

our site is http://www.oldboyedu.com

my qq num is 31333741.

问题6:在oldboy.txt文件的第2行后追加文本。

[root@oldboyedu ~/test]# sed '2a I teacher linux.' oldgirl.txt 

I am oldboy teacher!

I like badminton ball ,billiard ball and chinese chess!

I teacher linux.

our site is http://www.oldboyedu.com

my qq num is 49000448.

[root@oldboyedu ~/test]# cat oldgirl.txt 

I am oldboy teacher!

I like badminton ball ,billiard ball and chinese chess!

our site is http://www.oldboyedu.com

my qq num is 49000448.

[root@oldboyedu ~/test]# sed -i '2a I teacher linux.' oldgirl.txt 

[root@oldboyedu ~/test]# cat oldgirl.txt 

I am oldboy teacher!

I like badminton ball ,billiard ball and chinese chess!

I teacher linux.

our site is http://www.oldboyedu.com

my qq num is 49000448.

[root@oldboyedu ~/test]# sed '2i I teacher linux.i' oldgirl.txt 

I am oldboy teacher!

I teacher linux.i

I like badminton ball ,billiard ball and chinese chess!

I teacher linux.

our site is http://www.oldboyedu.com

my qq num is 49000448.

问题1:取出Linux中执行ifconfig eth0后对应的IP地址(只能输出IP地址)。

方法1:

[root@oldboyedu ~/test]# ifconfig eth0|sed -n 2p|sed 's#^.*inet ##g'|sed 's#  netm.*$##g'

10.0.0.201

三剑客自身有特长的。

grep 过滤查找内容。筛子

sed  取行,替换,删除,追加

awk  取列

cut 按列切割

-d 指定分隔符 -f指定哪列,多列用逗号

[root@oldboyedu ~]# cat a.txt 

1 2 3 4 5 6 7 8 9 10

[root@oldboyedu ~]# cut -d" " -f1,3,5 a.txt 

1 3 5

[root@oldboyedu ~]# cut -d" " -f3-5 a.txt 

3 4 5

练习

[root@oldboyedu ~]# sed -n '1,5p' /etc/passwd >oldboyedu.txt

[root@oldboyedu ~]# cat oldboyedu.txt

root:x:0:0:root:/root:/bin/bash

bin:x:1:1:bin:/bin:/sbin/nologin

daemon:x:2:2:daemon:/sbin:/sbin/nologin

adm:x:3:4:adm:/var/adm:/sbin/nologin

lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin

[root@oldboyedu ~]# cut -d":" -f3,4 /etc/passwd

0:0

1:1

2:2

[root@oldboyedu ~]# cat b.txt 

oldboy 49000448

[root@oldboyedu ~]# cut -c1-6,8- b.txt 

oldboy4900044

awk语法:

awk  [option]   'pattern{action}' file ...

awk   [参数]      '条件{动作}'    文件 ...

参数:

-F 指定分隔符

打印第一列:

[root@oldboyedu ~]# awk -F ":" '{print $1}' oldboyedu.txt 

root

bin

daemon

adm

lp

[root@oldboyedu ~]# awk -F ":" '{print $3,$5}' oldboyedu.txt 

0 root

1 bin

2 daemon

3 adm

4 lp

列:$1第一列 $2第二列 以此类推....

$0  整行

$NF 最后一列 倒数第一列

$(NF-1) 倒数第二列

[root@oldboyedu ~]# awk -F ":" '{print $NF}' oldboyedu.txt 

/bin/bash

/sbin/nologin

/sbin/nologin

/sbin/nologin

/sbin/nologin

[root@oldboyedu ~]# awk -F ":" '{print $0}' oldboyedu.txt 

root:x:0:0:root:/root:/bin/bash

bin:x:1:1:bin:/bin:/sbin/nologin

daemon:x:2:2:daemon:/sbin:/sbin/nologin

adm:x:3:4:adm:/var/adm:/sbin/nologin

lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin

练习:打印 1 2 和最后一列。

[root@oldboyedu ~]# awk -F ":" '{print $1,$2,$NF}' oldboyedu.txt 

root x /bin/bash

bin x /sbin/nologin

daemon x /sbin/nologin

adm x /sbin/nologin

lp x /sbin/nologin

问题1:取test.txt文件的第2行到第3行的内容。

[root@oldboyedu ~]# awk 'NR>1&&NR<4' oldboyedu.txt 

bin:x:1:1:bin:/bin:/sbin/nologin

daemon:x:2:2:daemon:/sbin:/sbin/nologin

[root@oldboyedu ~]# awk 'NR==2,NR==3' oldboyedu.txt 

bin:x:1:1:bin:/bin:/sbin/nologin

daemon:x:2:2:daemon:/sbin:/sbin/nologin

问题2:过滤出含有root字符串的行※。

[root@oldboyedu ~]# awk '/root/' oldboyedu.txt

root:x:0:0:root:/root:/bin/bash

[root@oldboyedu ~]# awk /root/ oldboyedu.txt

root:x:0:0:root:/root:/bin/bash

[root@oldboyedu ~]# 

[root@oldboyedu ~]# awk "/root/" oldboyedu.txt

root:x:0:0:root:/root:/bin/bash

问题3:删除含有root字符串的行※。

[root@oldboyedu ~]# awk '/^[^r]/' oldboyedu.txt

bin:x:1:1:bin:/bin:/sbin/nologin

daemon:x:2:2:daemon:/sbin:/sbin/nologin

adm:x:3:4:adm:/var/adm:/sbin/nologin

lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin

[^r]  非r

^[^r] 以非r字符卡头

问题4:取文件的第一列、第三列和最后一列内容,并打印行号※。

[root@oldboyedu ~]# awk -F ":" '{print NR,$1,$3,$NF}' oldboyedu.txt 

1 root 0 /bin/bash

2 bin 1 /sbin/nologin

3 daemon 2 /sbin/nologin

4 adm 3 /sbin/nologin

5 lp 4 /sbin/nologin

问题5:取出Linux中执行ifconfig eth0后对应的IP地址(只能输出IP地址)。

[root@oldboyedu ~]# ifconfig eth0|awk 'NR==2{print $2}'

10.0.0.201

C6

[root@oldboy ~]# ifconfig eth0

eth0      Link encap:Ethernet  HWaddr 00:0C:29:D0:87:20  

          inet addr:10.0.0.202  Bcast:10.0.0.255  Mask:255.255.255.0

          inet6 addr: fe80::20c:29ff:fed0:8720/64 Scope:Link

          UP BROADCAST RUNNING MULTICAST  MTU:1500  Metric:1

          RX packets:243 errors:0 dropped:0 overruns:0 frame:0

          TX packets:67 errors:0 dropped:0 overruns:0 carrier:0

          collisions:0 txqueuelen:1000 

          RX bytes:20674 (20.1 KiB)  TX bytes:8706 (8.5 KiB)

[root@oldboy ~]# ifconfig eth0|awk 'NR==2{print $2}'

addr:10.0.0.202

[root@oldboy ~]# ifconfig eth0|awk 'NR==2{print $2}'|awk -F ":" '{print $2}'

10.0.0.202

[root@oldboy ~]# ifconfig eth0|awk -F "[: ]+" 'NR==2{print $4}'

10.0.0.202

问题6:过滤文件中第一列内容匹配root的字符串,把符合的行的最后一列输出

awk -F ":" '$1~/root/ {print $NF}' test.txt 

~匹配

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容