剑指offer 面试题19 正则表达式匹配

最近正好在学编译原理,和计算理论,正则表达式接触的也比较多.

题目:
请实现一个函数用来匹配包含'. '和''的正则表达式。
模式中的字符'.'表示任意一个字符,而'
'表示它前面的字符可以出现任意次(含0次)。
在本题中,匹配是指字符串的所有字符匹配整个模式。
例如,字符串"aaa"与模式"a.a"和"abaca"匹配,但与"aa.a"和"ab*a"均不匹配。

来源:力扣(LeetCode)
链接:https://leetcode-cn.com/problems/zheng-ze-biao-da-shi-pi-pei-lcof
著作权归领扣网络所有。商业转载请联系官方授权,非商业转载请注明出处。

其实是一个较为简单的正则表达式,简单来说正则表达式就是一种模式,用来表示各种符合相应特性的字符串,题目中只有两种特殊情况

  1. '.' 表示任意字符
  2. '*'表示闭包,代表前一个字符可以取0或无数次

难点就在于这个* 有可能是一次,有可能0次,也有可能是多次,所以整个题目终点都在处理*符号.

一开始很容易就对两个字符串
1.s代表输入字符串
2.p代表模式字符串
使用两个指针依次匹配是否相等,或者等于'.'
在遇到'*'的再进行特殊的处理,

但写着写着发现'*'在不同的位置需要判断的情况过于复杂,没有办法一个一个判断很好的覆盖所有的情况,所以没有规划的判断会导致代码越来越混乱,太多的ifelse到最后我也没有调出正确结果.

于是借鉴了题解提供的动态规划的思路:

我们首先要构建一个二维数组,boolean dp[n+1][m+1]
其中n是s字符串的长度,m是p字符串的长度
而dp[i][j]所代表的含义是,s的前i个字符与p前j个字符的模式是否能够匹配
具体一点来说是s的[0,i) 和p的[0,j) 是否匹配,不包含第i和j.

动态规划就像是归纳假设一样最重要的两步
1.确定初始状态
首先,考虑字符串为null的情况,当s或者p为null的时候,我们直接认为是不匹配的

if(s==null||p==null){
            return false;
        }

其次,若s和p长度为0或者说为空的时候,我们认为

  dp[0][0] =true ;

2.确定递推关系
我们无需关心具体哪一个位置,递推关系只要关注该结果是如何通过上一步推导的
我们关心dp[i][j] 则需要根据s.charAt(i-1) p.charAt(j-1)的关系来进行判断,这也就是题目匹配的最主要的逻辑部分.我们分类讨论各种情况
(此处i-1 j-1仍是因为dp[i][j]的定义是左闭右开的原因)

根据题目,字符有a-z '.' '*' 三种
1)当s.charAt(i-1)==p.charAt(j-1)
也就是当前所在的位置的两个字符相等,可以认为
dp[i][j]=dp[i-1][j-1]

如果两个字符不相等的话,又有以下情况
2)当p.charAt(j-1)=='.'
由于'.'匹配任意字符,这个情况与情况1并没有区别
dp[i][j]=dp[i-1][j-1]

3)当p.charAt(j-1)==''
根据题目我们知道
一定和它前面一个字符有关,并且他可能代表0个,1个或者多个,

i) 0个 由于当前的字符与前的字符不匹配,所以我们可以忽略这个以及前字符.
例如 当s=ab p=ac
b 的时候, 此时并不需要匹配c,则把c*视为0个.
这种情况下, 即p.charAt(j-2)!=s.charAt(i-1)
则我们让
dp[i][j] = dp[i][j-2] (相当于去掉p[j-1]和p[j-2])

ii)1个 由于当前的字符与前的字符匹配 且仅需要一个, 我们可以忽略掉号,仅仅做正常的字符匹配就行了 即,p.charAt(j-2)==s.charAt(i-1)
例如 s=ab p=ab*
则dp[i][j]=dp[i][j-1]

iii)多个 由于当前的字符与前的字符匹配 且仅需要多个,
即p.charAt(j-2)==s.charAt(i-1) 且至少p.charAt(j-2)==s.charAt(i-2)
则dp[i][j] = dp[i-1][j] 这代表着如果i-1的串模式是匹配的,那么在输入一个相同的字符,将不影响这个结果.
例如s=abbb p=ab

具体来说abbb是否匹配ab* 相当于abb是否匹配ab* 相当于ab是否匹配ab*此时由前面1个的情况 则又取决于ab(s)与ab(p)是否匹配.显然是成立的

最后
s.charAt(i-1)!=p.charAt(j-1) 且p.charAt(j-1)也不是'.'或者'*'的时候,
则代表模式无法匹配.dp[i][j]=false

结构图

代码示例:

public boolean isMatch(String s, String p) {
       \\判断是否为null
        if(s==null||p==null){
            return false;
        }
        int n = s.length();
        int m = p.length();
        boolean[][] dp = new boolean[n + 1][m + 1];
        dp[0][0]=true;\\认为两个空串匹配
        for(int j=2;j<m+1;j++)
        {
            if(p.charAt(j-1)=='*'&&dp[0][j-2]) {
                dp[0][j] = true;
            }
        }
      
        for(int i = 1;i<n+1;i++){
            for(int j = 1;j<m+1;j++){
                char a= s.charAt(i-1);\\当前s的字符
                char b= p.charAt(j-1);\\当前p的字符
                if(a==b){ 
                    dp[i][j]=dp[i-1][j-1];
                }
                else{
                    if(b=='.'){
                        dp[i][j]=dp[i-1][j-1];
                    }
                    else if(b=='*'){
                        if(j>=2){ \\为了保证j-2不会出错,实际上*不可能前面没有字符
                            char c = p.charAt(j-2);
                            if(c==a||c=='.') { \\字符匹配与.号匹配情况相同,合并在一起
                                dp[i][j] = dp[i - 1][j] || dp[i][j - 1]; \\只有 p.charAt(j-2)==s.chatAt(i-1)或 p.charAt(j-2)==‘.’才可以让*取1个或者多个字符:
                            }
                            dp[i][j] = dp[i][j]||dp[i][j-2];\\上述的结果或*代表0个的情况
                        }

                    }
                    else{
                        dp[i][j]=false;
                    }
                }
            }
        }
        return dp[n][m];
    }
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,734评论 6 505
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,931评论 3 394
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,133评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,532评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,585评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,462评论 1 302
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,262评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,153评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,587评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,792评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,919评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,635评论 5 345
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,237评论 3 329
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,855评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,983评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,048评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,864评论 2 354