Regular Expression - 正则表达式
正则表达式描述了一种字符串匹配的模式(pattern),可以用来检查一个串是否含有某种子串、将匹配的子串做替换或者从某个串中取出符合某个条件的子串等。
正则表达式是由普通字符(例如:字符 a 到 z)以及特殊字符(称为"元字符")组成的文字模式。模式描述在搜索文本时要匹配的一个或多个字符串。正则表达式作为一个模板,将某个字符模式与所搜索的字符串进行匹配。
下面是几种基本的特殊字符以及它的含义:
-
^
和$
分别指出了一个字符串的开始和结束- "^BK.":表示所有以"BK"开头的字符串("BK001", "BK is a coder", "BK's Blog"等等, 其中"."表示任意字符,""在后面会提到)
- ".*a single dog$":表示所有以"a single dog"结尾的字符字符串("I'm a single dog"等等)
- "^iPhone$":表示开始和结束都是"iPhone"的字符串,这是唯一的,没有别的结果,去掉两旁的符号得到的结果一样
-
+
?
*
表示一个或N个字符重复出现的次数- "WoW+":表示一个字符串"Wo"后面跟着至少一个"W"([1, +∞]) , ("WoW", "WoWWWWW")
- "WoW*":表示一个字符串"Wo"后面跟着零个或若干个"W"([0, +∞]) , ("Wo", "WoW", "WoWWWW")
- "WoW?":表示一个字符串"Wo"后面跟着零个或者一个b[0, 1] , ("Wo", "WoW",只有这两种结果)
-
{}
表示一个字符串重复的具体范围,可以用来替代+
?
*
- "+":可以用"{1,}"表示;
- "*":可以用"{0,}"表示;
- "?":可以用"{0,1}"表示;
- "WoW{3}":表示一个字符串"Wo"后跟着4个"W"("WoWWW")
- "WoW{1,}":表示一个字符串"Wo"后面跟着至少一个"W"([1, +∞]), ("WoW", "WoWWWWW")
- "WoW{3,4}":表示一个字符串@"Wo"跟着3到4个"W", ("WoWWW", "WoWWWW")
注意:一个"{}"内可以没有上限,但不能没有下限, 括号内不允许有空格,不然程序会崩溃崩溃
-
.
表示除\r \n
之外的任何字符 -
|
表示或操作- Micheal|Michael 表示匹配Micheal或Michael
-
[0-9]
表示一个字符串包含0到9中的一个- "[a-d]":表示一个字符串包含小写的'a'到'd'中的一个(相当于"a|b|c|d"或者"[abcd]");
- "^[a-zA-Z].*":表示一个以字母开头的字符串;
- "[0-9]a":表示a前有一位的数字;
- ".*[a-zA-Z0-9]$":表示一个字符串以一个字母或数字结束。