JS、Python、Java中正则表达式全局匹配功能对比

JS:

var regStr = "(\\w+),?";
var str = "aabb,xxx,yysin,ienif";
toIterateGroup = function(regStr, str){
    let reg = new RegExp(regStr, "g");
    let result = reg.exec(str);
    while(result !== null){
        console.log(result[0]);//匹配结果
        if(result.length > 1){
            for(let i = 1; i < result.length; ++i){
                console.log(result[i]);//匹配结果中捕获结果
            }
        }
    result = reg.exec(str);
    }
}

toIterateGroup(regStr, str);

上式中reg.exec(str)的结果为["aabb,", "aabb", "index":0, input:"aabb,xxx,yysin,ienif", groups:undefined]
结果数组部分:
第0项"aabb,"为(\w+),?表达式的匹配结果;
第1项"aabb"为表达式中第一个捕获项(\w+)的捕获结果;
以此类推,第n项为第n个捕获项的捕获结果;
结果属性部分:
index为匹配结果首字母在目标字符串中的索引位置;
input为目标字符串;

其中由于reg设置了flag为"g",意为全局匹配,则每一次执行reg.exec(str)都会前进到下一个匹配项,直到没有匹配项(没有匹配项的执行结果为null,可以以此为循环的终止条件)。
正则对象reg中的属性lastIndex,为每次匹配结果的末位字符在目标字符串中的索引位置index+1的值,也就是下一个字符的index(即下次匹配的起始index);

注意:如果没有设置全局匹配的flag,则每次执行reg.exec(str)都为第一个匹配结果,且str.match(reg)和reg.exec(str)的结果一致。如果有设置全局匹配的flag,那么str.match(reg)返回一个按顺序包含全部匹配结果的字符串数组。

Python:

import re
reg = r"(\w+),?"
str = "aabb,xxx,yysin,ienif"
re.findall(reg, str, re.I)

python中的re.findall(pattern, str, flags)函数是JS当中的match和exec函数的综合。
findall的返回结果是全部匹配项的数组(findall函数本身就是全局匹配的意思);如果pattern中有捕获项,则返回的数组中,每个元素都是按顺序捕获的字符串所组成的元组(类似二维数组,只不过数组内的数组被元组所替代)。
re.finditer(pattern, str, flags)与findall函数功能类似,但是返回的是包含匹配结果和捕获结果的对象组成的数组。需按如下方式遍历:

reg = r"(\w+),?"
str = "aabb,xxx,yysin,ienif"
matchResult = re.finditer(reg, str, re.I)
for result in matchResult:
    result.group()#匹配结果
    result.groups()#匹配结果当中,捕获结果依次组成的元组对象
    if len(result.groups()) > 0:
        for g in result.groups():
            print(g)

Java:

String reg = "(\\w+),?";
String str = "aabb,xxx,yysin,ienif";
Pattern pattern = Pattern.compile(reg);//编译正则表达式(\w+),?
Matcher matcher = pattern.matcher(str);//用编译后的pattern去匹配目标字符串str
while(matcher.find()){//从开头逐个匹配,返回值为”是否发现匹配项“
    matcher.group();//当前匹配结果
    matcher.start();//当前匹配结果首字符在目标字符串中的索引位置index
    matcher.end();//当前匹配结果末位字符在目标字符串中的索引位置index+1
    matcher.groupCount();//正则表达式中捕获项个数
    if(matcher.groupCount() > 0){
        for(int i = 1; i <= matcher.groupCount(); ++i){
            matcher.group(i);//当前匹配结果中第i个捕获结果,i:1, 2, 3…
        }
    }
}

综上所述:
Java的正则表达式应用虽然较为繁琐,但是所要获得的内容都比较清晰。
js的exec函数的匹配结果,可读性较差,需要做专门说明,但是使用起来较为简单。
python的findall函数使用方便,但是当含有捕获项时,所得未必为期望的结果;而finditer函数所得结果为Match对象的迭代器,与java的结果较为相似,对应操作也类似。

如有错漏,欢迎留言讨论:D

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,752评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,100评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,244评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,099评论 1 286
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,210评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,307评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,346评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,133评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,546评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,849评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,019评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,702评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,331评论 3 319
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,030评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,260评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,871评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,898评论 2 351

推荐阅读更多精彩内容

  • //定义正则表达式的两种方式,在用构造函数的时候,有些地方是要加转义字符的。 //1、字面量。 var reg =...
    xiaobing0324阅读 492评论 0 0
  • Python中的正则表达式(re) import rere.match #从开始位置开始匹配,如果开头没有则无re...
    BigJeffWang阅读 7,070评论 0 99
  • 前言 作为一个程序员,要出去装逼,手中必备的技能就是正则表达式。程序员的正则表达式,医生的处方和道士的鬼画符,都是...
    Layzimo阅读 541评论 0 6
  • 1. 验证正则表达式中的全局g对几种方法的影响 test校验方法:正则的方法总结:1)不添加全局g时,lastIn...
    果木山阅读 317评论 0 0
  • 1.1 正则基础 正则的含义:由特定的符号组成的具有特殊含义的代码; 正则的目的:就是制定一些规则,来操作(校验/...
    果木山阅读 95评论 0 0