看书和文档,太复杂了...对形式化的概念真的没感觉.于是自己写了好多例子来尝试.终于搞明白了
在java中正则表达式的捕获组由括号来表示 ,比如:
String regexS = "abc(de)(fg)"
其中(de)和(fg)都是捕获组,那么上面的正则表达式就有两个捕获组.
这玩意是来干嘛的呢?
这个主要是和Pattern和Matcher两个类结合使用的!
还是看个例子(从菜鸟教程上拷贝下来的):
public class RegexMatches
{
public static void main( String args[] ){
// 按指定模式在字符串查找
String line = "This order was placed for QT3000! OK?";
String pattern = "(\\D*)(\\d+)(.*)";
// 创建 Pattern 对象
Pattern r = Pattern.compile(pattern);
// 现在创建 matcher 对象
Matcher m = r.matcher(line);
if (m.find( )) {
System.out.println("Found value: " + m.group(0) );
System.out.println("Found value: " + m.group(1) );
System.out.println("Found value: " + m.group(2) );
System.out.println("Found value: " + m.group(3) ); //这行是我添加上去的,菜鸟教程上没有,这行对理解挺关键的!
} else {
System.out.println("NO MATCH");
}
}
再看看输出结果:
Found value: This order was placed for QT3000! OK?
Found value: his order was placed for QT
Found value: 3000
Found value: ! OK?
m.group(0) 里面的这个0很关键, 0代表整个正则表达式在这次匹配中,完整匹配出来的句子
你看m.group(0)得到的结果是:
---->> This order was placed for QT3000! OK?
这个就是"(\\D*)(\\d+)(.*)"所匹配的嘛!
而 m.group(1) m.group(2) m.group(3) 又是什么呢?
我们再对照下:
-----------------------------------------------------------
m.group(1) = This order was placed for QT
m.group(2) = 3000
m.group(3) = ! OK?
-----------------------------------------------------------
对了!
这个1对应的就是第一个括号(\\D*)匹配出来的内容
2就是第二个括号(\\d+)匹配出来的内容
3就是第三个括号(.*)匹配出来的内容,依此类推
m.group(0) 总是表示整个正则表达式匹配出来的内容!
而1,2,3,4......依次表示的就是捕获组匹配的内容,
捕获到了几组就显示到几,
一般可又 m.groupCount() 得到,注意这个获得的count是不包含0的
不是说有多少个捕获组就能显示到几组啊,有些捕获组说不定就没不捕获到
/**
* | 为什么我要添加一行 System.out.println("Found value: " + m.group(3) ); 呢
* | 因为上面实际上匹配到了三个捕获组,有一个没打印出来
* | 如果没 m.group(3) 有这对理解捕获组的概念 影响很大
* | 到这你应该明白什么叫捕获组了吧
*/
/**
* | 最后:你也可以在括号内添加个记号(?:pattern)价格问号和冒号,使得m.group(x)方法不获取到这个捕获组
* | 例如:
* | "(\\D*)(?:\\d+)(.*)"
* | 那么第二个捕获组(\\d+)就不会被记录下来,
* | 你在使用m.group(2)的时候获得的就不是"3000"而是"! OK?"
* | 即:
* | m.group(1) = This order was placed for QT
* | m.group(2) = ! OK?
* | 但是注意m.group(0)是不会改变的,依然是"This order was placed for QT3000! OK?"
* | m.group(0) = This order was placed for QT3000! OK?
*/