前言
网站开发中,正则匹配、正则表达式绝对是要经常用到的东西,之前写爬虫的时候看了一些正则表达式的东西,现在也忘得差不多了。正好最近写的功能里用到了几次的正则匹配,就借此机会来总结一下。这里为了加深印象,会对每个知识点配上实例进行说明。总结内容基本参考:
php正则表达式汇总1
php正则表达式汇总2
基础部分
行定位符(^与$)
行定位符是用来描述字符串的边界。“$”表示行结尾“”表示行开始如"de",表示以de开头的字符串 "de$",表示以de结尾的字符串。
实例1
文本内容:hello
正则表达式:^he
匹配结果:he
实例2
文本内容:hello
正则表达式:lo$
匹配结果:lo
单词定界符
我们在查找的一个单词的时候,如an是否在一个字符串”girl and boy”中存在,很明显如果匹配的话,an肯定是可以匹配字符串“gril and body”匹配到,怎样才能让其匹配单词,而不是单词的一部分呢?
这时候,我们可以使用单词定界符\b。 \ban\b 去匹配”gril and body”的话,就会提示匹配不到。
当然还有一个大写的\B,匹配非单词边界。’er\B’ 能匹配 “verb” 中的 ‘er’,但不能匹配 “never” 中的 ‘er’。
实例1
文本内容:girl and boy
正则表达式:\bboy\b
匹配结果:boy
实例2
文本内容:girl and boy
正则表达式:lo$
匹配结果:lo
选择字符(|) ,表示或
选择字符表示或的意思。如Aa|aA,表示Aa或者是aA的意思。注意使用”[]”与”|”的区别,在于”[]”只能匹配单个字符,而”|”可以匹配任意长度的字符串。在使用”[]”的时候,往往配合连接字符”-“一起使用,如[a-d],代表a或b或c或d。
经过尝试,似乎使用“|”进行或逻辑的匹配,只会匹配到一个符合条件的就停止,而不会匹配出全部。
实例1
文本内容:abcde
正则表达式:[a-b]
匹配结果:a, b
实例2
文本内容:abcbde
正则表达式:cb|bc
匹配结果:bc
排除字符,排除操作
正则表达式提供了””来表示排除不符合的字符,一般放在[]中。如[^1-5],该字符不是1~5之间的数字。
实例1
文本内容:abcdefg
正则表达式:[a-e]
匹配结果:f, g
限定符(?*+{n,m})
限定符主要是用来限定每个字符串出现的次数。
限定字符 | 含义 |
---|---|
? | 零次或一次 |
* | 零次或多次 |
+ | 一次或多次 |
{n} | n次 |
{n,} | 至少n次 |
{n,m} | n到m次 |
实例1
文本内容:aaaaaa
正则表达式:a{2,4}
匹配结果:aaaa, aa
实例2
文本内容:aaaaaa
正则表达式:a{2,4}
匹配结果:aaaa, aa
点号操作符(.)
匹配任意一个字符(不包含换行符)
表达式中的反斜杠(\)
表达式中的反斜杠有多重意义,如转义、指定预定义的字符集、定义断言、显示不打印的字符。
zhuan'yi
括号字符()
在正则表达式中小括号的作用主要有:
- 改变限定符如(|、* 、^)的作用范围
如(my|your)baby,如果没有”()”,|将匹配的是要么是my,要么是yourbaby,有了小括号,匹配的就是mybaby或yourbaby。