2019-03-20 课堂笔记 三剑客的练习与实践

3W1H

1、什么是正则表达式?

作用和特殊字符一样。

正则表达式是为处理大量的字符串及文本而定义的一套规则和方法。

开发者

假设"@"代表“I am”,"!"代表“oldboy”,

则执行echo "@!"的结果就是输出“I am oldboy”。


2、提高效率,快速获取到想要的内容。


3、适用于三剑客命令 grep(egrep),sed,awk

   以行为单位处理。

4、实践来讲解


易混淆事项

1、和通配符区别。

2、开发人员正则,一般是Perl兼容正则表达式。

3、Linux系统三剑客正则表达式******。


环境准备:


export LC_ALL=C


分类:

1、BRE  grep

2、ERE  egrep


[root@oldboyedu~/test]# grep "^I" oldboy.txt

I am oldboyteacher!

I teach linux.

I like badmintonball ,billiard ball and chinese chess!

[root@oldboyedu~/test]# ls /data

a.txt  aa.txt b.txt  c.txt  f.txt test.txt

[root@oldboyedu~/test]# mkdir /data/oldboy

[root@oldboyedu~/test]# ls -l /data

total 0

-rw-r--r--. 1 rootroot 0 Oct  4 23:28 a.txt

-rw-r--r--. 1 rootroot 0 Oct  4 23:28 aa.txt

-rw-r--r--. 1 rootroot 0 Oct  4 23:28 b.txt

-rw-r--r--. 1 rootroot 0 Oct  4 23:38 c.txt

-rw-r--r--. 1 rootroot 0 Oct  4 23:38 f.txt

drwxr-xr-x. 2 rootroot 6 Oct  5 01:08 oldboy

-rw-r--r--. 1 rootroot 0 Oct  4 23:28 test.txt

[root@oldboyedu~/test]# ls -l /data|grep "^d"

drwxr-xr-x. 2 rootroot 6 Oct  5 01:08 oldboy



es?   匹配e es

es*   匹配e es ess

essssss essssssssss 更多s。


?0

0?


代表 自身是 .代表任意一个字符。


匹配 ? 匹配前一个字符。



e*s* 和e?s?

e*  空e ee eeeeeeeeee

s*  空s ss sssssssssssssssss

e*s* 空es e s ees essssss


e?s? 空e s es

e? 空e

s? 空s

=========================================

e+     e ee eee eeeee  .........

e*  空e ee eeeeeeeeee .........

e?  空e

=========================================

a{n,m}    匹配前一个字符最少n次,最多m次

a{n,}  匹配前一个字符最少n次

a{n}   匹配前一个字符正好n次

a{,m} 匹配前一个字符最多m次



(0)===\1

(0)(0)    \1             \2

       第一个括号    第二个括号


egrep -o"(e)(s)\1\2" oldboy.txt ===== egrep -o "eses" oldboy.txt




特殊预定义中括号表达式

[root@oldboyedu~/test]# egrep "[0-9]" oldboy.txt

my qq num is49000448.

not 4900000448.

[root@oldboyedu~/test]#

[root@oldboyedu~/test]# egrep "[[:digit:]]" oldboy.txt

my qq num is49000448.

not 4900000448.

[root@oldboyedu~/test]# egrep "[[:lower:]]" oldboy.txt

I am oldboyteacher!

I teach linux.

I like badmintonball ,billiard ball and chinese chess!

our site ishttp://www.oldboyedu.com

my qq num is49000448.

not 4900000448.

my god ,i am notoldbey,but OLDBOY!

[root@oldboyedu~/test]# egrep "[[:upper:]]" oldboy.txt

I am oldboyteacher!

I teach linux.

I like badmintonball ,billiard ball and chinese chess!

my god ,i am notoldbey,but OLDBOY!   



[root@oldboyedu~/test]# egrep "\boldboy\b" oldboy.txt

I am oldboyteacher!

[root@oldboyedu~/test]# egrep "oldboy" oldboy.txt

I am oldboyteacher!

our site ishttp://www.oldboyedu.com

[root@oldboyedu~/test]# egrep -w "oldboy" oldboy.txt

I am oldboyteacher!


评书:三侠剑   老好了。

侠客、剑客



Linux三剑客

awk  sed grep


sed

Sed是操作、过滤和转换文本内容的强大工具。

常用功能有对文件实现快速增删改查(增加、删除、修改、查询),

其中查询的功能中最常用的2大功能是过滤(过滤指定字符串)和取行(取出指定行)。


sed [选项]  [sed内置命令字符]  [文件]


选项:

-n  取消默认sed的输出,常与sed内置命令的p连用※

-i   直接修改文件内容,而不是输出到终端。


如果不使用-i选项sed只是修改在内存中的数据,并不会影响磁盘上的文件※


sed的内置命令字符说明

s 替换

g 全局global

p 打印print

d 删除delete


I am oldboyteacher!

I like badmintonball ,billiard ball and chinese chess!

our site ishttp://www.oldboyedu.com

my qq num is49000448.



[root@oldboyedu~/test]# cat oldgirl.txt

I am oldboyteacher!

I like badmintonball ,billiard ball and chinese chess!

our site ishttp://www.oldboyedu.com

my qq num is49000448.


问题1:输出oldboy.txt的第2-3行内容※。

sed -n '2,3p'oldgirl.txt


问题2:过滤出含有oldboy字符串的行※。

sed -n '/oldboy/p'oldgirl.txt


问题3:删除含有oldboy字符串的行※。

sed '/oldboy/d'oldgirl.txt

sed /oldboy/doldgirl.txt


问题4:将文件中的oldboy字符串全部替换为oldgirl※。

vim替换:

:%s#oldboy#oldgirl#g

sed 's#想替换啥#用啥替换#g' oldgirl.txt


sed's#oldboy#oldgirl#g' oldgirl.txt

修改文件:

sed -i's#oldboy#oldgirl#g' oldgirl.txt


问题5:将文件中的oldboy字符串全部替换为oldgirl,同时将QQ号码49000448改为31333741。

sed -e's#oldboy#oldgirl#g' -e 's#49000448#31333741#g' oldgirl.txt I




环境:

[root@oldboyedu~/test]# cat oldgirl.txt

I am oldboyteacher!

I like badmintonball ,billiard ball and chinese chess!

our site ishttp://www.oldboyedu.com

my qq num is49000448.

问题1:输出oldboy.txt的第2-3行内容※。

问题2:过滤出含有oldboy字符串的行※。

问题3:删除含有oldboy字符串的行※。

问题4:将文件中的oldboy字符串全部替换为oldgirl※。

问题5:将文件中的oldboy字符串全部替换为oldgirl,同时将QQ号码49000448改为31333741。

问题6:在oldboy.txt文件的第2行后追加文本。

问题7:在oldboy.txt文件的第2行插入文本。




删除指定行

sed -i '3d'oldgirl.txt

sed -i '5,8d'oldgirl.txt



环境:

[root@oldboyedu~/test]# cat oldgirl.txt

I am oldboyteacher!

I like badmintonball ,billiard ball and chinese chess!

our site ishttp://www.oldboyedu.com

my qq num is49000448.

问题1:输出oldboy.txt的第2-3行内容※。

[root@oldboyedu~/test]# sed -n '2,3p' oldgirl.txt

I like badmintonball ,billiard ball and chinese chess!

our site ishttp://www.oldboyedu.com

[root@oldboyedu~/test]# head -3 oldgirl.txt |tail -2

I like badmintonball ,billiard ball and chinese chess!

our site ishttp://www.oldboyedu.com


问题2:过滤出含有oldboy字符串的行※。

[root@oldboyedu~/test]# sed -n '/oldboy/p' oldgirl.txt

I am oldboyteacher!

our site ishttp://www.oldboyedu.com

[root@oldboyedu~/test]# grep oldboy oldgirl.txt

I am oldboyteacher!

our site ishttp://www.oldboyedu.com


问题3:删除含有oldboy字符串的行※。

[root@oldboyedu~/test]# sed '/oldboy/d' oldgirl.txt

I like badmintonball ,billiard ball and chinese chess!

my qq num is49000448.

[root@oldboyedu~/test]# grep -v "oldboy" oldgirl.txt

I like badmintonball ,billiard ball and chinese chess!

my qq num is49000448.


问题4:将文件中的oldboy字符串全部替换为oldgirl※。

[root@oldboyedu~/test]# sed 's#oldboy#oldgirl#g' oldgirl.txt

I am oldgirlteacher!

I like badmintonball ,billiard ball and chinese chess!

our site ishttp://www.oldgirledu.com

my qq num is49000448.

vim替换:

问题5:将文件中的oldboy字符串全部替换为oldgirl,同时将QQ号码49000448改为31333741。

[root@oldboyedu~/test]# sed -e 's#oldboy#oldgirl#2' -e 's#49000448#31333741#g' oldgirl.txt

I am oldboyteacher!

I like badmintonball ,billiard ball and chinese chess!

our site ishttp://www.oldboyedu.com

my qq num is31333741.

问题6:在oldboy.txt文件的第2行后追加文本。

[root@oldboyedu~/test]# sed '2a I teacher linux.' oldgirl.txt

I am oldboyteacher!

I like badmintonball ,billiard ball and chinese chess!

I teacher linux.

our site ishttp://www.oldboyedu.com

my qq num is 49000448.

[root@oldboyedu~/test]# cat oldgirl.txt

I am oldboyteacher!

I like badmintonball ,billiard ball and chinese chess!

our site ishttp://www.oldboyedu.com

my qq num is49000448.

[root@oldboyedu~/test]# sed -i '2a I teacher linux.' oldgirl.txt

[root@oldboyedu~/test]# cat oldgirl.txt

I am oldboyteacher!

I like badmintonball ,billiard ball and chinese chess!

I teacher linux.

our site ishttp://www.oldboyedu.com

my qq num is49000448.

[root@oldboyedu~/test]# sed '2i I teacher linux.i' oldgirl.txt

I am oldboyteacher!

I teacher linux.i

I like badmintonball ,billiard ball and chinese chess!

I teacher linux.

our site ishttp://www.oldboyedu.com

my qq num is49000448.


问题1:取出Linux中执行ifconfig eth0后对应的IP地址(只能输出IP地址)。


练习sed

正则是贪婪匹配模式,人性是贪婪的。


方法1:

[root@oldboyedu~/test]# ifconfig eth0|sed -n 2p|sed 's#^.*inet ##g'|sed 's#  netm.*$##g'

10.0.0.201




方法:要取一个目标,删除目标两边的,就得到了目标:

先匹配上,然后在删除



[root@oldboyedu~]# ifconfig eth0|sed -n 2p|sed 's#^.*inet ##g'|sed 's#  netm.*$##g'

10.0.0.201

[root@oldboyedu~]# ifconfig eth0|sed -n 2p|sed -e 's#^.*inet ##g' -e 's#  netm.*$##g'

10.0.0.201

[root@oldboyedu~]# ifconfig eth0|sed -ne 's#^.*inet ##g' -e 's#  netm.*$##gp'

10.0.0.201

[root@oldboyedu~]# ifconfig eth0|sed -nr '2s#^.*inet (.*) netm.*$#\1#gp'

10.0.0.201


验证是否懂了的练习题:

stat /etc/hosts自行取其中的644


[root@oldboyedu~]# stat /etc/hosts

  File: ‘/etc/hosts’

  Size: 158           Blocks:8          IO Block: 4096   regular file

Device: 803h/2051d    Inode: 16829878    Links: 1

Access:(0644/-rw-r--r--)  Uid: (    0/   root)   Gid: (    0/   root)

Access: 2020-10-0620:40:18.463001804 +0800

Modify: 2013-06-0722:31:32.000000000 +0800

Change: 2019-03-0411:15:49.426692303 +0800

 Birth: -

[root@oldboyedu~]# stat /etc/hosts|sed -rn 's#^.*\(0(.*)/-.*$#\1#gp'

644


考试:ip add的输出取出IP。


[root@oldboyedu~]# ip add|sed -rn 's#^.*net (.*)/24.*$#\1#gp'

10.0.0.201



1、象棋,教学,比赛,活动

2、踢毽子,比赛。最牛的单人前三,小组前三。


三剑客自身有特长的。

grep 过滤查找内容。筛子

sed  取行,替换,删除,追加

awk  取列



cut 按列切割

-d 指定分隔符 -f指定哪列,多列用逗号

[root@oldboyedu~]# cat a.txt

1 2 3 4 5 6 7 8 910

[root@oldboyedu~]# cut -d" " -f1,3,5 a.txt

1 3 5

[root@oldboyedu~]# cut -d" " -f3-5 a.txt

3 4 5


练习

[root@oldboyedu~]# sed -n '1,5p' /etc/passwd >oldboyedu.txt

[root@oldboyedu~]# cat oldboyedu.txt

root:x:0:0:root:/root:/bin/bash

bin:x:1:1:bin:/bin:/sbin/nologin

daemon:x:2:2:daemon:/sbin:/sbin/nologin

adm:x:3:4:adm:/var/adm:/sbin/nologin

lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin

[root@oldboyedu~]# cut -d":" -f3,4 /etc/passwd

0:0

1:1

2:2


[root@oldboyedu~]# cat b.txt

oldboy 49000448

[root@oldboyedu~]# cut -c1-6,8- b.txt

oldboy4900044





awk语法:

awk  [option]  'pattern{action}' file ...

awk   [参数]      '条件{动作}'    文件...


参数:

-F 指定分隔符

打印第一列:

[root@oldboyedu~]# awk -F ":" '{print $1}' oldboyedu.txt

root

bin

daemon

adm

lp


[root@oldboyedu~]# awk -F ":" '{print $3,$5}' oldboyedu.txt

0 root

1 bin

2 daemon

3 adm

4 lp


列:$1第一列 $2第二列以此类推....

$0  整行

$NF 最后一列 倒数第一列

$(NF-1) 倒数第二列

[root@oldboyedu~]# awk -F ":" '{print $NF}' oldboyedu.txt

/bin/bash

/sbin/nologin

/sbin/nologin

/sbin/nologin

/sbin/nologin

[root@oldboyedu~]# awk -F ":" '{print $0}' oldboyedu.txt

root:x:0:0:root:/root:/bin/bash

bin:x:1:1:bin:/bin:/sbin/nologin

daemon:x:2:2:daemon:/sbin:/sbin/nologin

adm:x:3:4:adm:/var/adm:/sbin/nologin

lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin



练习:打印 1 2 和最后一列。

[root@oldboyedu~]# awk -F ":" '{print $1,$2,$NF}' oldboyedu.txt

root x /bin/bash

bin x/sbin/nologin

daemon x/sbin/nologin

adm x/sbin/nologin

lp x /sbin/nologin


问题1:取test.txt文件的第2行到第3行的内容。

[root@oldboyedu~]# awk 'NR>1&&NR<4' oldboyedu.txt

bin:x:1:1:bin:/bin:/sbin/nologin

daemon:x:2:2:daemon:/sbin:/sbin/nologin


[root@oldboyedu~]# awk 'NR==2,NR==3' oldboyedu.txt

bin:x:1:1:bin:/bin:/sbin/nologin

daemon:x:2:2:daemon:/sbin:/sbin/nologin



问题2:过滤出含有root字符串的行※。

[root@oldboyedu~]# awk '/root/' oldboyedu.txt

root:x:0:0:root:/root:/bin/bash

[root@oldboyedu~]# awk /root/ oldboyedu.txt

root:x:0:0:root:/root:/bin/bash

[root@oldboyedu~]#

[root@oldboyedu~]# awk "/root/" oldboyedu.txt

root:x:0:0:root:/root:/bin/bash


问题3:删除含有root字符串的行※。

[root@oldboyedu~]# awk '/^[^r]/' oldboyedu.txt

bin:x:1:1:bin:/bin:/sbin/nologin

daemon:x:2:2:daemon:/sbin:/sbin/nologin

adm:x:3:4:adm:/var/adm:/sbin/nologin

lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin

[^r]  非r

^[^r] 以非r字符卡头


问题4:取文件的第一列、第三列和最后一列内容,并打印行号※。

[root@oldboyedu~]# awk -F ":" '{print NR,$1,$3,$NF}' oldboyedu.txt

1 root 0 /bin/bash

2 bin 1/sbin/nologin

3 daemon 2/sbin/nologin

4 adm 3/sbin/nologin

5 lp 4/sbin/nologin


问题5:取出Linux中执行ifconfig eth0后对应的IP地址(只能输出IP地址)。

[root@oldboyedu~]# ifconfig eth0|awk 'NR==2{print $2}'

10.0.0.201


C6

[root@oldboy ~]#ifconfig eth0

eth0      Link encap:Ethernet  HWaddr 00:0C:29:D0:87:20 

          inet addr:10.0.0.202  Bcast:10.0.0.255  Mask:255.255.255.0

          inet6 addr:fe80::20c:29ff:fed0:8720/64 Scope:Link

          UP BROADCAST RUNNING MULTICAST  MTU:1500 Metric:1

          RX packets:243 errors:0 dropped:0overruns:0 frame:0

          TX packets:67 errors:0 dropped:0overruns:0 carrier:0

          collisions:0 txqueuelen:1000

          RX bytes:20674 (20.1 KiB)  TX bytes:8706 (8.5 KiB)


[root@oldboy ~]#ifconfig eth0|awk 'NR==2{print $2}'

addr:10.0.0.202

[root@oldboy ~]#ifconfig eth0|awk 'NR==2{print $2}'|awk -F ":" '{print $2}'

10.0.0.202


[root@oldboy ~]#ifconfig eth0|awk -F "[: ]+" 'NR==2{print $4}'

10.0.0.202


问题6:过滤文件中第一列内容匹配root的字符串,把符合的行的最后一列输出


awk -F":" '$1~/root/ {print $NF}' test.txt

~匹配


问题1:取test.txt文件的第2行到第3行的内容。

问题2:过滤出含有root字符串的行※。

问题3:删除含有root字符串的行※。

问题4:取文件的第一列、第三列和最后一列内容,并打印行号※。

问题5:取出Linux中执行ifconfig eth0后对应的IP地址(只能输出IP地址)。

问题6:过滤文件中第一列内容匹配root的字符串,把符合的行的最后一列输出

问题7:过滤下列test1.txt文件中第三列内容分数大于70,并且小于95的人名和性别。


命令笔记

cut  按列切割

-d  指定分隔符 -f指定列多列用逗号分隔

三剑客自身有特长的

grep 过滤查找内容,筛子

sed 取行,替换,删除,追加

awk  取列

参数

-F 指定分隔符

打印第一列

列:$1第一列$2第二列

$0  整行

$NF  最后一列

~匹配

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,496评论 6 501
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,407评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,632评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,180评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,198评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,165评论 1 299
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,052评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,910评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,324评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,542评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,711评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,424评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,017评论 3 326
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,668评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,823评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,722评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,611评论 2 353

推荐阅读更多精彩内容