正则表达式语法 Regular Expression

正则表达式语法 Regular Expression
vim grep sed awk perl java nginx apache mail垃圾邮件过滤。。。等等都使用正则

什么叫正则表达式:她是一种字符串的表达方式
Some one let the cat out of the bag! 什么意思?秘密泄露?

特点:
1.理解正则表达式类似理解算术表达式:
1+2 3*5 1+2*3 (1+2)*3

2.正则表达式像算术表达式一样也有优先级

构成:一个正则表达式描述了一种模式或字符序列(pattern)
1.除元字符之外的任意字符都是表示他字面意思的正则表达式
2.元字符(基本元字符、扩展元字符)

正则表达式的匹配过程:basic regular expression (rtgex)
 

基本元字符:
. 匹配除换行符之外的任意单个字符,awk中可以匹配换行符
例子:mkdir sed
[root@nas ~]# cd sed
[root@nas sed]# vim test.txt
1.  [root@nas sed]# sed ' s/./A/g' test.txt
AAAAAAAAAAA
AAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAA
[root@nas sed]# echo hello world > test.txt
2.  [root@nas sed]# sed ' s/./A/' test.txt
Aello world
3.  [root@nas sed]# sed ' s/o. /A/' test.txt
hello world
nice to meet you
hAare you han meimei

* 表示他的前置字符有零个或多个 a*
1.[root@nas sed]# vim test1.txt
[root@nas sed]# sed  ' s/ca*/A/' test1.txt
A
A
A
A
[root@nas sed]# cat test1.txt
c
ca
caaaa
caaaaaaaaaa
2.[root@nas sed]# cat test1.txt
c
ca
caaaa
caaaaaaaaaa
[root@nas sed]# sed  ' s/c.*/A/' test1.txt
A
A
A
A
.* 贪婪匹配 吃掉后面的所有的东西
[...] 匹配方括号中的任意一个字符,^为否定匹配, -表示字符的范围
^ 作为正则表达式的第一个字符,匹配行的开始。在awk中可以嵌入换行符
$ 作为正则表达式的最后一个字符,匹配行的结尾。在awk中可以嵌入换行符
\{n,m\} 匹配前置字符出现n和m之间的任意次数,\{n\}匹配出现n次。\{n,\}匹配至少出现n次
\ 转义字符
\<            词首定位符     /\<bin/      匹配以bin开头的单词
\>           词尾定位符     /fix\>/       匹配以fix结尾的单词

[root@wing ~]# echo wingabc wing | sed 's/\<wing/S/g'
Sabc S
[root@wing ~]# echo wingabc wing | sed 's/\<wing\>/S/g'
wingabc S

扩展元字符:
Extended Metacharacters (egrep and awk)
+ 匹配前面的正则表达式的一次出现或多次出现
? 匹配前面的正则表达式的零次出现或一次出现
| 可以匹配前面的或后面的正则表达式(替代方案)
() 对正则表达式分组
{n,m} 匹配出现的n到m次数, {n}匹配出现n次。{n,}匹配至少出现n次,大多数awk都不支持,用于POSIX egrep和POSIX awk

POSIX字符类:
表达式         功能                                          示例
[:alnum:]      字母与数字字符                         [[:alnum:]]+  
[:alpha:]       字母字符(包括大小写字母)            [[:alpha:]]{4}
[:blank:]       空格与制表符                           [[:blank:]]*
[:digit:]         数字字母                                   [[:digit:]]?
[:lower:]       小写字母                                     [[:lower:]]{5,}
[:upper:]      大写字母                                  [[:upper:]]+
[:punct:]      标点符号                                     [[:punct:]]
[:space:]      包括换行符,回车等在内的所有空白[[:space:]]+

编写正则表达式的3 个步骤:
1 知道要匹配的内容以及它如何出现在文本中。
2 编写一个模式来描述要匹配的内容
3 测试模式来查看它匹配的内容

模式匹配产生的结果:
Hits(命中)
这是我想匹配的行

Misses(未命中)
这是我不想匹配的行

Omissions(遗漏)
这是我不能匹配但想要匹配的行

False alarms(假警报)
这是我不想匹配的但却匹配了的行

正则表达式分类应用:
字符类
[Ww]hat
[root@localhost ~]# cat test.txt
how are you what ni hao  What
[root@localhost ~]# sed ' s/[Ww]hat/A/' test.txt
how are you A ni hao  What
[root@localhost ~]# sed ' s/[Ww]hat/A/g' test.txt
how are you A ni hao  A

\.H[12345]
[root@localhost ~]# cat test.txt 
how are you what ni hao  What
.H2h3
[root@localhost ~]# sed ' s/\.H[12345]/A/g' test.txt
how are you what ni hao  What
Ah3

字符的范围
[a-z]
[0-9]
[Cc]hapter[1-9]
[-+*/]
[0-1][0-9][-/][0-3][0-9][-/][0-9][0-9]

排除字符类
[^0-9]
[root@localhost ~]# sed ' s/\.H[12345]/A/g' test.txt
how are you what ni hao  What
Ah3
[root@localhost ~]# sed ' s/[^0-9]/A/g' test.txt
AAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AA2A3

重复出现的字符
10
50
100
500
1000
5000
[15]0*
[15]00*

字符的跨度
* 与 \{n,m\}
电话号码的匹配
[0-9]\{3\}-[0-9]\{7,8\}
[root@localhost ~]# sed -r  ' s/[0-9]{3}-[0-9]{7,8}/A/' test.txt
how are you what ni hao  What
.H2h3
150000000  150 1500 1000
15880310015
A
[root@localhost ~]# cat test.txt
how are you what ni hao  What
.H2h3
150000000  150 1500 1000
15880310015
158-5555015

分组操作
compan(y|ies)
注意:大多数sed 和grep 不能对圆括号()进行匹配,但是在egrep 和
awk 所有版本都是可以的
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,544评论 6 501
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,430评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,764评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,193评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,216评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,182评论 1 299
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,063评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,917评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,329评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,543评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,722评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,425评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,019评论 3 326
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,671评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,825评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,729评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,614评论 2 353

推荐阅读更多精彩内容