双字符串类型题目的常见解法

leetcode有不少双字符串类型的题目,比如 “给两个字符串,判断 str1 -> str2 需要的最少改变次数”,“给两个字符串,判断 str2 是否是 str1 的正则表达”。

对于这类双字符串类型的题目,有一个常见的思路是:将一个字符串作为行、一个字符串作为列,然后进行dfs、dp,且这类题也是经典的dp问题。

leetcode 10: 正则表达式匹配 为例:给定两个字符串,判断string p 是否是 string s 的正则匹配。

解法一:dfs + buffer

dfs是最符合思考过程的算法模式,因此 dfs+buffer 即能够达到和 dp 一样的时间复杂度,同时在思维上也相对更好思考。

定义递归函数 func dfs(s, p string, si, pi int, buffer [][]int) bool,意思是:s[..i]与 p[...j] 是否能够正则匹配。中间结果使用buffer来记录,其中 buffer[si][pi] = -1 表示 false,buffer[si][pi] = 1 表示 true,等于0表示该组合还未看过。

base case

递归函数,首先考虑其base case。对于本题,base case应考虑两种情况:1. pi == 0(p为空串);2. si == 0(s为空串)。

若pi == 0(p为空串),则只有当 si == 0(s也为空串)时才为true,其他均为false。

若si == 0(s为空串),则需要分情况讨论对应的 pi。若 p[pi-1] != '',则一定无法匹配,返回false;若p[pi-1] == '',则应看结果 dfs(s, p, si, pi-2, buffer)。

于是有:

// base case
if pi == 0 {
  if si == 0 {
    buffer[si][pi] = 1  // true
  } else {
    buffer[si][pi] = -1  // false
  }
  return buffer[si][pi] == 1
}

if si == 0 {
  if p[pi-1] != '*' {
    buffer[si][pi] = -1  // false
  } else {
    if dfs(s, p, si, pi-2, buffer) {
      buffer[si][pi] = 1 // true
    } else {
      buffer[si][pi] = -1  // false
    }
  }
  return buffer[si][pi] == 1
}

recursive rule

接着考虑recursive rule。由于*的特殊性,因此从大类上分为两类:1. p[pi-1] != '';2. p[pi-1] == ''。

若 p[pi-1] != '*'。1. p[pi-1] == s[si-1] || p[pi-1] == '.',则需要看 dfs(s, p, si-1, pi-1, buffer)的结果;否则直接返回false。

若 p[pi-1] == '*'。1. p[pi-2] == s[si-1] || p[pi-2] == '.',则需要看 dfs(s, p, si, pi-2, buffer) || dfs(s, p, si-1, pi-2, buffer) || dfs(s, p, si-1, pi, buffer) 的结果;否则需要看 dfs(s, p, si, pi-2, buffer) 的结果。

于是有

// si, pi != 0
  if p[pi-1] != '*' {
        if p[pi-1] == s[si-1] || p[pi-1] == '.' {
            if dfs(s, p, si-1, pi-1, buffer) {
                buffer[si][pi] = 1
            } else {
                buffer[si][pi] = -1
            }
        } else {
            buffer[si][pi] = -1
        }
    } else {
        if p[pi-2] == s[si-1] || p[pi-2] == '.' {
            if dfs(s, p, si, pi-2, buffer) || 
            dfs(s, p, si-1, pi-2, buffer) || 
            dfs(s, p, si-1, pi, buffer) {
                buffer[si][pi] = 1
            } else {
                buffer[si][pi] = -1
            }
        } else {
            if dfs(s, p, si, pi-2, buffer) {
                buffer[si][pi] = 1
            } else {
                buffer[si][pi] = -1
            }
        }
    }

full code

func isMatch(s string, p string) bool {
    buffer := make([][]int, len(s)+1)
    for i := range buffer {
        buffer[i] = make([]int, len(p) + 1)
    }
    return dfs(s, p, len(s), len(p), buffer)
}

// s[...si] matches p[...pi]?
// buffer[si][pi] = 1 if true
// buffer[si][pi] = -1 if false
func dfs(s, p string, si, pi int, buffer [][]int) bool {
    if buffer[si][pi] != 0 {
        return buffer[si][pi] == 1
    }
    // base case
    if pi == 0 {    // pattern == ""
        if si == 0 {    // s == ""
            buffer[si][pi] = 1
        } else {    // s != ""
            buffer[si][pi] = -1
        }
        return buffer[si][pi] == 1
    }
    if si == 0 {    // s == "" && pattern != ""
        if p[pi-1] == '*' && dfs(s, p, si, pi - 2, buffer){
            buffer[si][pi] = 1
        } else {
            buffer[si][pi] = -1
        }
        return buffer[si][pi] == 1
    }

    // si, pi != 0
    if p[pi-1] != '*' {
        if p[pi-1] == s[si-1] || p[pi-1] == '.' {
            if dfs(s, p, si-1, pi-1, buffer) {
                buffer[si][pi] = 1
            } else {
                buffer[si][pi] = -1
            }
        } else {
            buffer[si][pi] = -1
        }
    } else {
        if p[pi-2] == s[si-1] || p[pi-2] == '.' {
            if dfs(s, p, si, pi-2, buffer) || 
            dfs(s, p, si-1, pi-2, buffer) || 
            dfs(s, p, si-1, pi, buffer) {
                buffer[si][pi] = 1
            } else {
                buffer[si][pi] = -1
            }
        } else {
            if dfs(s, p, si, pi-2, buffer) {
                buffer[si][pi] = 1
            } else {
                buffer[si][pi] = -1
            }
        }
    }
    return buffer[si][pi] == 1
}

dp

dfs+记忆化搜索 向 dp 的转换,只需要将 base case 与 recursive rule 通过直接操作buffer写出来即可。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容