2019-03-20 课堂笔记三剑客的练习与实践

3W1H

1、什么是正则表达式？

作用和特殊字符一样。

正则表达式是为处理大量的字符串及文本而定义的一套规则和方法。

开发者

假设"@"代表“I am”，"!"代表“oldboy”，

则执行echo "@!"的结果就是输出“I am oldboy”。

2、提高效率，快速获取到想要的内容。

3、适用于三剑客命令 grep（egrep）,sed,awk

以行为单位处理。

4、实践来讲解

易混淆事项

1、和通配符区别。

2、开发人员正则，一般是Perl兼容正则表达式。

3、Linux系统三剑客正则表达式******。

环境准备：

export LC_ALL=C

分类：

1、BRE grep

2、ERE egrep

[root@oldboyedu~/test]# grep "^I" oldboy.txt

I am oldboyteacher!

I teach linux.

I like badmintonball ,billiard ball and chinese chess!

[root@oldboyedu~/test]# ls /data

a.txt aa.txt b.txt c.txt f.txt test.txt

[root@oldboyedu~/test]# mkdir /data/oldboy

[root@oldboyedu~/test]# ls -l /data

total 0

-rw-r--r--. 1 rootroot 0 Oct 4 23:28 a.txt

-rw-r--r--. 1 rootroot 0 Oct 4 23:28 aa.txt

-rw-r--r--. 1 rootroot 0 Oct 4 23:28 b.txt

-rw-r--r--. 1 rootroot 0 Oct 4 23:38 c.txt

-rw-r--r--. 1 rootroot 0 Oct 4 23:38 f.txt

drwxr-xr-x. 2 rootroot 6 Oct 5 01:08 oldboy

-rw-r--r--. 1 rootroot 0 Oct 4 23:28 test.txt

[root@oldboyedu~/test]# ls -l /data|grep "^d"

drwxr-xr-x. 2 rootroot 6 Oct 5 01:08 oldboy

es? 匹配e es

es* 匹配e es ess

essssss essssssssss 更多s。

代表自身是 .代表任意一个字符。

匹配？匹配前一个字符。

e*s* 和e?s?

e* 空e ee eeeeeeeeee

s* 空s ss sssssssssssssssss

e*s* 空es e s ees essssss

e?s? 空e s es

e? 空e

s? 空s

=========================================

e+ e ee eee eeeee .........

e* 空e ee eeeeeeeeee .........

e? 空e

=========================================

a{n,m} 匹配前一个字符最少n次，最多m次

a{n,} 匹配前一个字符最少n次

a{n} 匹配前一个字符正好n次

a{,m} 匹配前一个字符最多m次

(0)===\1

(0)(0) \1 \2

第一个括号第二个括号

egrep -o"(e)(s)\1\2" oldboy.txt ===== egrep -o "eses" oldboy.txt

特殊预定义中括号表达式

[root@oldboyedu~/test]# egrep "[0-9]" oldboy.txt

my qq num is49000448.

not 4900000448.

[root@oldboyedu~/test]#

[root@oldboyedu~/test]# egrep "[[:digit:]]" oldboy.txt

my qq num is49000448.

not 4900000448.

[root@oldboyedu~/test]# egrep "[[:lower:]]" oldboy.txt

I am oldboyteacher!

I teach linux.

I like badmintonball ,billiard ball and chinese chess!

our site ishttp://www.oldboyedu.com

my qq num is49000448.

not 4900000448.

my god ,i am notoldbey,but OLDBOY!

[root@oldboyedu~/test]# egrep "[[:upper:]]" oldboy.txt

I am oldboyteacher!

I teach linux.

I like badmintonball ,billiard ball and chinese chess!

my god ,i am notoldbey,but OLDBOY!

[root@oldboyedu~/test]# egrep "\boldboy\b" oldboy.txt

I am oldboyteacher!

[root@oldboyedu~/test]# egrep "oldboy" oldboy.txt

I am oldboyteacher!

our site ishttp://www.oldboyedu.com

[root@oldboyedu~/test]# egrep -w "oldboy" oldboy.txt

I am oldboyteacher!

评书：三侠剑老好了。

侠客、剑客

Linux三剑客

awk sed grep

sed

Sed是操作、过滤和转换文本内容的强大工具。

常用功能有对文件实现快速增删改查（增加、删除、修改、查询），

其中查询的功能中最常用的2大功能是过滤（过滤指定字符串）和取行（取出指定行）。

sed [选项] [sed内置命令字符] [文件]

选项：

-n 取消默认sed的输出，常与sed内置命令的p连用※

-i 直接修改文件内容，而不是输出到终端。

如果不使用-i选项sed只是修改在内存中的数据，并不会影响磁盘上的文件※

sed的内置命令字符说明

s 替换

g 全局global

p 打印print

d 删除delete

I am oldboyteacher!

I like badmintonball ,billiard ball and chinese chess!

our site ishttp://www.oldboyedu.com

my qq num is49000448.

[root@oldboyedu~/test]# cat oldgirl.txt

I am oldboyteacher!

I like badmintonball ,billiard ball and chinese chess!

our site ishttp://www.oldboyedu.com

my qq num is49000448.

问题1：输出oldboy.txt的第2-3行内容※。

sed -n '2,3p'oldgirl.txt

问题2：过滤出含有oldboy字符串的行※。

sed -n '/oldboy/p'oldgirl.txt

问题3：删除含有oldboy字符串的行※。

sed '/oldboy/d'oldgirl.txt

sed /oldboy/doldgirl.txt

问题4：将文件中的oldboy字符串全部替换为oldgirl※。

vim替换：

:%s#oldboy#oldgirl#g

sed 's#想替换啥#用啥替换#g' oldgirl.txt

sed's#oldboy#oldgirl#g' oldgirl.txt

修改文件：

sed -i's#oldboy#oldgirl#g' oldgirl.txt

问题5：将文件中的oldboy字符串全部替换为oldgirl，同时将QQ号码49000448改为31333741。

sed -e's#oldboy#oldgirl#g' -e 's#49000448#31333741#g' oldgirl.txt I

环境：

[root@oldboyedu~/test]# cat oldgirl.txt

I am oldboyteacher!

I like badmintonball ,billiard ball and chinese chess!

our site ishttp://www.oldboyedu.com

my qq num is49000448.

问题1：输出oldboy.txt的第2-3行内容※。

问题2：过滤出含有oldboy字符串的行※。

问题3：删除含有oldboy字符串的行※。

问题4：将文件中的oldboy字符串全部替换为oldgirl※。

问题5：将文件中的oldboy字符串全部替换为oldgirl，同时将QQ号码49000448改为31333741。

问题6：在oldboy.txt文件的第2行后追加文本。

问题7：在oldboy.txt文件的第2行插入文本。

删除指定行

sed -i '3d'oldgirl.txt

sed -i '5,8d'oldgirl.txt

环境：

[root@oldboyedu~/test]# cat oldgirl.txt

I am oldboyteacher!

I like badmintonball ,billiard ball and chinese chess!

our site ishttp://www.oldboyedu.com

my qq num is49000448.

问题1：输出oldboy.txt的第2-3行内容※。

[root@oldboyedu~/test]# sed -n '2,3p' oldgirl.txt

I like badmintonball ,billiard ball and chinese chess!

our site ishttp://www.oldboyedu.com

[root@oldboyedu~/test]# head -3 oldgirl.txt |tail -2

I like badmintonball ,billiard ball and chinese chess!

our site ishttp://www.oldboyedu.com

问题2：过滤出含有oldboy字符串的行※。

[root@oldboyedu~/test]# sed -n '/oldboy/p' oldgirl.txt

I am oldboyteacher!

our site ishttp://www.oldboyedu.com

[root@oldboyedu~/test]# grep oldboy oldgirl.txt

I am oldboyteacher!

our site ishttp://www.oldboyedu.com

问题3：删除含有oldboy字符串的行※。

[root@oldboyedu~/test]# sed '/oldboy/d' oldgirl.txt

I like badmintonball ,billiard ball and chinese chess!

my qq num is49000448.

[root@oldboyedu~/test]# grep -v "oldboy" oldgirl.txt

I like badmintonball ,billiard ball and chinese chess!

my qq num is49000448.

问题4：将文件中的oldboy字符串全部替换为oldgirl※。

[root@oldboyedu~/test]# sed 's#oldboy#oldgirl#g' oldgirl.txt

I am oldgirlteacher!

I like badmintonball ,billiard ball and chinese chess!

our site ishttp://www.oldgirledu.com

my qq num is49000448.

vim替换：

问题5：将文件中的oldboy字符串全部替换为oldgirl，同时将QQ号码49000448改为31333741。

[root@oldboyedu~/test]# sed -e 's#oldboy#oldgirl#2' -e 's#49000448#31333741#g' oldgirl.txt

I am oldboyteacher!

I like badmintonball ,billiard ball and chinese chess!

our site ishttp://www.oldboyedu.com

my qq num is31333741.

问题6：在oldboy.txt文件的第2行后追加文本。

[root@oldboyedu~/test]# sed '2a I teacher linux.' oldgirl.txt

I am oldboyteacher!

I like badmintonball ,billiard ball and chinese chess!

I teacher linux.

our site ishttp://www.oldboyedu.com

my qq num is 49000448.

[root@oldboyedu~/test]# cat oldgirl.txt

I am oldboyteacher!

I like badmintonball ,billiard ball and chinese chess!

our site ishttp://www.oldboyedu.com

my qq num is49000448.

[root@oldboyedu~/test]# sed -i '2a I teacher linux.' oldgirl.txt

[root@oldboyedu~/test]# cat oldgirl.txt

I am oldboyteacher!

I like badmintonball ,billiard ball and chinese chess!

I teacher linux.

our site ishttp://www.oldboyedu.com

my qq num is49000448.

[root@oldboyedu~/test]# sed '2i I teacher linux.i' oldgirl.txt

I am oldboyteacher!

I teacher linux.i

I like badmintonball ,billiard ball and chinese chess!

I teacher linux.

our site ishttp://www.oldboyedu.com

my qq num is49000448.

问题1：取出Linux中执行ifconfig eth0后对应的IP地址（只能输出IP地址）。

练习sed

正则是贪婪匹配模式，人性是贪婪的。

方法1：

[root@oldboyedu~/test]# ifconfig eth0|sed -n 2p|sed 's#^.*inet ##g'|sed 's# netm.*$##g'

10.0.0.201

方法:要取一个目标，删除目标两边的，就得到了目标：

先匹配上，然后在删除

[root@oldboyedu~]# ifconfig eth0|sed -n 2p|sed 's#^.*inet ##g'|sed 's# netm.*$##g'

10.0.0.201

[root@oldboyedu~]# ifconfig eth0|sed -n 2p|sed -e 's#^.*inet ##g' -e 's# netm.*$##g'

10.0.0.201

[root@oldboyedu~]# ifconfig eth0|sed -ne 's#^.*inet ##g' -e 's# netm.*$##gp'

10.0.0.201

[root@oldboyedu~]# ifconfig eth0|sed -nr '2s#^.*inet (.*) netm.*$#\1#gp'

10.0.0.201

验证是否懂了的练习题：

stat /etc/hosts自行取其中的644

[root@oldboyedu~]# stat /etc/hosts

File: ‘/etc/hosts’

Size: 158 Blocks:8 IO Block: 4096 regular file

Device: 803h/2051d Inode: 16829878 Links: 1

Access:(0644/-rw-r--r--) Uid: ( 0/ root) Gid: ( 0/ root)

Access: 2020-10-0620:40:18.463001804 +0800

Modify: 2013-06-0722:31:32.000000000 +0800

Change: 2019-03-0411:15:49.426692303 +0800

Birth: -

[root@oldboyedu~]# stat /etc/hosts|sed -rn 's#^.*\(0(.*)/-.*$#\1#gp'

644

考试：ip add的输出取出IP。

[root@oldboyedu~]# ip add|sed -rn 's#^.*net (.*)/24.*$#\1#gp'

10.0.0.201

1、象棋，教学，比赛，活动

2、踢毽子，比赛。最牛的单人前三，小组前三。

三剑客自身有特长的。

grep 过滤查找内容。筛子

sed 取行，替换，删除，追加

awk 取列

cut 按列切割

-d 指定分隔符 -f指定哪列，多列用逗号

[root@oldboyedu~]# cat a.txt

1 2 3 4 5 6 7 8 910

[root@oldboyedu~]# cut -d" " -f1,3,5 a.txt

1 3 5

[root@oldboyedu~]# cut -d" " -f3-5 a.txt

3 4 5

练习

[root@oldboyedu~]# sed -n '1,5p' /etc/passwd >oldboyedu.txt

[root@oldboyedu~]# cat oldboyedu.txt

root:x:0:0:root:/root:/bin/bash

bin:x:1:1:bin:/bin:/sbin/nologin

daemon:x:2:2:daemon:/sbin:/sbin/nologin

adm:x:3:4:adm:/var/adm:/sbin/nologin

lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin

[root@oldboyedu~]# cut -d":" -f3,4 /etc/passwd

0:0

1:1

2:2

[root@oldboyedu~]# cat b.txt

oldboy 49000448

[root@oldboyedu~]# cut -c1-6,8- b.txt

oldboy4900044

awk语法：

awk [option] 'pattern{action}' file ...

awk [参数] '条件{动作}' 文件...

参数:

-F 指定分隔符

打印第一列：

[root@oldboyedu~]# awk -F ":" '{print $1}' oldboyedu.txt

root

bin

daemon

adm

[root@oldboyedu~]# awk -F ":" '{print $3,$5}' oldboyedu.txt

0 root

1 bin

2 daemon

3 adm

4 lp

列：$1第一列 $2第二列以此类推....

$0 整行

$NF 最后一列倒数第一列

$(NF-1) 倒数第二列

[root@oldboyedu~]# awk -F ":" '{print $NF}' oldboyedu.txt

/bin/bash

/sbin/nologin

[root@oldboyedu~]# awk -F ":" '{print $0}' oldboyedu.txt

root:x:0:0:root:/root:/bin/bash

bin:x:1:1:bin:/bin:/sbin/nologin

daemon:x:2:2:daemon:/sbin:/sbin/nologin

adm:x:3:4:adm:/var/adm:/sbin/nologin

lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin

练习：打印 1 2 和最后一列。

[root@oldboyedu~]# awk -F ":" '{print $1,$2,$NF}' oldboyedu.txt

root x /bin/bash

bin x/sbin/nologin

daemon x/sbin/nologin

adm x/sbin/nologin

lp x /sbin/nologin

问题1：取test.txt文件的第2行到第3行的内容。

[root@oldboyedu~]# awk 'NR>1&&NR<4' oldboyedu.txt

bin:x:1:1:bin:/bin:/sbin/nologin

daemon:x:2:2:daemon:/sbin:/sbin/nologin

[root@oldboyedu~]# awk 'NR==2,NR==3' oldboyedu.txt

bin:x:1:1:bin:/bin:/sbin/nologin

daemon:x:2:2:daemon:/sbin:/sbin/nologin

问题2：过滤出含有root字符串的行※。

[root@oldboyedu~]# awk '/root/' oldboyedu.txt

root:x:0:0:root:/root:/bin/bash

[root@oldboyedu~]# awk /root/ oldboyedu.txt

root:x:0:0:root:/root:/bin/bash

[root@oldboyedu~]#

[root@oldboyedu~]# awk "/root/" oldboyedu.txt

root:x:0:0:root:/root:/bin/bash

问题3：删除含有root字符串的行※。

[root@oldboyedu~]# awk '/^[^r]/' oldboyedu.txt

bin:x:1:1:bin:/bin:/sbin/nologin

daemon:x:2:2:daemon:/sbin:/sbin/nologin

adm:x:3:4:adm:/var/adm:/sbin/nologin

lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin

[^r] 非r

^[^r] 以非r字符卡头

问题4：取文件的第一列、第三列和最后一列内容，并打印行号※。

[root@oldboyedu~]# awk -F ":" '{print NR,$1,$3,$NF}' oldboyedu.txt

1 root 0 /bin/bash

2 bin 1/sbin/nologin

3 daemon 2/sbin/nologin

4 adm 3/sbin/nologin

5 lp 4/sbin/nologin

问题5：取出Linux中执行ifconfig eth0后对应的IP地址（只能输出IP地址）。

[root@oldboyedu~]# ifconfig eth0|awk 'NR==2{print $2}'

10.0.0.201

[root@oldboy ~]#ifconfig eth0

eth0 Link encap:Ethernet HWaddr 00:0C:29:D0:87:20

inet addr:10.0.0.202 Bcast:10.0.0.255 Mask:255.255.255.0

inet6 addr:fe80::20c:29ff:fed0:8720/64 Scope:Link

UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1

RX packets:243 errors:0 dropped:0overruns:0 frame:0

TX packets:67 errors:0 dropped:0overruns:0 carrier:0

collisions:0 txqueuelen:1000

RX bytes:20674 (20.1 KiB) TX bytes:8706 (8.5 KiB)

[root@oldboy ~]#ifconfig eth0|awk 'NR==2{print $2}'

addr:10.0.0.202

[root@oldboy ~]#ifconfig eth0|awk 'NR==2{print $2}'|awk -F ":" '{print $2}'

10.0.0.202

[root@oldboy ~]#ifconfig eth0|awk -F "[: ]+" 'NR==2{print $4}'

10.0.0.202

问题6：过滤文件中第一列内容匹配root的字符串，把符合的行的最后一列输出

awk -F":" '$1~/root/ {print $NF}' test.txt

~匹配

问题1：取test.txt文件的第2行到第3行的内容。

问题2：过滤出含有root字符串的行※。

问题3：删除含有root字符串的行※。

问题4：取文件的第一列、第三列和最后一列内容，并打印行号※。

问题5：取出Linux中执行ifconfig eth0后对应的IP地址（只能输出IP地址）。

问题6：过滤文件中第一列内容匹配root的字符串，把符合的行的最后一列输出

问题7：过滤下列test1.txt文件中第三列内容分数大于70，并且小于95的人名和性别。

命令笔记

cut 按列切割

-d 指定分隔符 -f指定列多列用逗号分隔

三剑客自身有特长的

grep 过滤查找内容，筛子

sed 取行，替换，删除，追加

awk 取列

参数

-F 指定分隔符

打印第一列

列：$1第一列$2第二列

$0 整行

$NF 最后一列

~匹配

2019-03-20 课堂笔记三剑客的练习与实践

2019-03-20 课堂笔记三剑客的练习与实践

相关阅读更多精彩内容

友情链接更多精彩内容

2019-03-20 课堂笔记 三剑客的练习与实践

相关阅读更多精彩内容

友情链接更多精彩内容

2019-03-20 课堂笔记三剑客的练习与实践