截获圆括号(capturing parentheses)
被用作组模式的一部分。例如:3 (pm|am)会匹配文本“3 pm” ,也会匹配“3 am”。竖线字符(|)执行的是或操作。只要你乐意,你可以包含多个竖线字符在你的正则表达式中。例如,(Tom|Dick|Harry)是一个有效的模式,它能匹配那三个名字中的任一个。
当你需要选择性的匹配特定的字符串时,圆括号组用起来很方便。比方说你要在一个文本中查找“November”,但是它可能被简写为“Nov”.你就能定义一个模式Nov(ember)?,在捕获圆括号(capturing parentheses)后加上问号,意味着这个圆括号内的内容是可选的。
这个圆括号(parentheses)被定义为术语捕获(capturing)因为他们捕获匹配的内容,并允许在你的正则表达式的其他地方引用它。
举个例子,假使你有一个字符串“Say hi to Harry”.如果你创建一个搜索并替换的正则表达式,用that guy $1来替换任一处出现的(Tom|Dick|Harry),结果就会是“Say hi to that guy Harry”.$1允许你引用前面规则中的第一个截获组。
字符组(Character classes)
它相当于一组字符中匹配单个字符。字符组出现在中括号([和])之间。
例如,正则表达式t[aeiou]会匹配“ta”、“te”、“ti”、“to”或“tu”。你可以放任意多的字符在中括号中,但是请记住,只能匹配一个字符。[aeiou]看起来是五个字符,但它真实意义却是“a”或”e“或”i“或”o“或”u“。
如果字符连续出现,你也能在字符组中定义一个范围。例如,为了搜索在100到109的数字,模式应该用10[0-9]。这和10[0123456789]会返回同样地结果,不过,使用范围来定义你的正则表达式看起来更简洁和易于理解。
字符组不止局限于数字,你同样可以用字符来这样做。比如,[a-f]会匹配”a“,”b“,”c“,”d“,”e“或”f“。
字符集通常包含你想要匹配的字符,但是如果你想明确指出不要匹配的字符该怎么办?同样你能定义除此之外的字符组,把^放在前面。例如,模式t[^o]就会匹配包含”t“并且后面紧跟的字符是非o的字符。