实现 strStr() 函数之KMP算法

假设给定两个字符串 F 和 S,怎么求 S 在 F 中出现的第一个位置?细想一下就能知道其实就是 JS 中 String 的实例方法 indexOf()的实现,像下面这样:

const father = "I AM YOUR FATHER";
const son = "YOUR FATHER ARE MY GRANDPA";
console.log(father.indexOf(son)); // 5

不过我们当然不能就直接使用indexOf,那就不叫算法了。本文将从最简单的解法开始,再讲解 KMP 算法的原理。

直接解法

也可以叫暴力解法,就是遍历母串,和子串一一匹配,直到子串全部匹配完毕,如果中间有匹配不上的情况,就把母串从上一次开始匹配的位置后移一位,子串从 0 开始匹配,重复这个过程,直到匹配上或者匹配不上。代码如下:

const strStr = function(f, s) {
  // s为空,直接返回
  if (s === "") {
    return 0;
  }
  let i = 0;
  let j = 0;
  while (i < f.length) {
    // 如果匹配,各自加一,继续匹配
    if (f.charAt(i) === s.charAt(j)) {
      i++;
      j++;
    } else {
      // 如果不匹配,i置为上一轮匹配的下一位,j置为0
      i = i - j + 1;
      j = 0;
    }
    // 全部匹配上,返回
    if (j === s.length) {
      return i - j;
    }
  }
  return -1;
};

按说上面的解法对咱来说已经满足需要了,但是有三位大佬看了这种解法说,垃圾,这也叫算法?于是,我们有了 KMP 算法。

KMP

什么叫 kmp?就是提出这种算法的三个人的名字的首字母缩写,我们要搞懂的是名字后面的解法。

上面的直接解法是粗暴的一一匹配,效率较低,kmp 三人发现可以利用匹配失败时某种信息减少匹配的次数,从而提升效率,这个信息就是这个算法的关键点。
是什么信息呢?简单说就是子串在匹配失败位置之前的字符串的最大相同的前缀后缀的长度。比较拗口,断句来看就是,子串在匹配失败位置,之前的字符串的,最大相同的前缀后缀,的长度。

关键点在最大相同的前缀后缀,什么叫最大相同的前缀后缀?
比如ABCDAB,最大相同前后缀是AB,长度是 2,
比如123123,最大相同前后缀是123,长度是 3。

我们需要的就是这个长度,我们来看一下这个长度有什么用。

我们假设以下两个字符串:

const m = "ABCDAB ABCDABCDABD";
const p = "ABCDABD";

可以想到,当匹配到 m[6]、p[6]时,我们能获取到的信息是前六位匹配,前六位的最大相同前后缀长度是AB,长度为 2。当不匹配时,暴力解法的做法是将母串后移一位,子串从 0 开始重新匹配,我们先模拟一下这个过程:

  1. 当匹配到 m[6] p[6]时不匹配,m 后移一位从 m[1]开始,p 从 p[0]开始
  2. m[1]和 p[0]不匹配,继续移位
  3. m[2]和 p[0]不匹配,继续移位
  4. 一直到 m[4]和 p[0],终于匹配上了 A,然后下一位的 B 也能匹配上,直到 m[6],p[2]

而匹配上的这俩正好是我们的最大相同前后缀,相比从第 6 位没匹配上开始,m 位置没变,还是 6,p 从 6 移到了 2,这个 2 正好是上面最大相同前后缀的长度(缘分啊),所以这个长度的作用就是当匹配不到时,子串回退到的索引。我们给存储子串每位最大相同前后缀长度的数组取名为 next,每次匹配不到时子串索引置为相应值即可。

那么这个 next 数组该怎么求呢?我们默认将第一位置为-1,因为第一位没匹配上也不能再向左移动了,代码如下:

const getNext = str => {
  let j = 0;
  let k = -1;
  const next = [-1];
  while (j < str.length - 1) {
    if (k === -1 || str[j] === str[k]) {
      j++;
      k++;
      next[j] = k;
    } else {
      k = next[k];
    }
  }
  return next;
};

所以结合上面这个方法,我们有:

const strStr = function(f, s) {
  // s为空,直接返回
  if (s === "") {
    return 0;
  }
  const next = getNext(s);
  let i = 0;
  let j = 0;
  while (i < f.length) {
    // 如果匹配,各自加一,继续匹配
    if (j === -1 || f.charAt(i) === s.charAt(j)) {
      i++;
      j++;
    } else {
      // 如果不匹配,i不用改变,j置为此位置最大前后缀的长度
      j = next[j];
    }
    // 全部匹配上,返回
    if (j === s.length) {
      return i - j;
    }
  }
  return -1;
};

上面便是 kmp 的解法,然鹅,还可以再优化,看以下例子:

example1.png

当匹配不到时,下一步我们移动的位置应该是这样

example2.png

可以发现,这步匹配是完全没意义的,因为上一步的 B 已经不匹配,这步的 B 肯定也不匹配了。发生问题的原因在于
p[j] == p[next[j]],移动到的值正好等于现在的,这步移动就可以省略掉,进一步提升效率。我们修改一下求 next 数组的方法,如下:

const getNext = str => {
  let j = 0;
  let k = -1;
  const next = [-1];
  while (j < str.length - 1) {
    if (k === -1 || str[j] === str[k]) {
      j++;
      k++;
      if (p[j] !== p[k]) {
        next[j] = k;
      } else {
        next[j] = next[k];
      }
    } else {
      k = next[k];
    }
  }
  return next;
};

OK,以上便是 kmp 解法的讲解,我主要是用推导的方式,发现规律,里面其实是有数学公式佐证的,但是比较不好理解,就不贴出来了,有问题欢迎交流。

参考:

  1. 这里
  2. 这里
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,185评论 6 503
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,652评论 3 393
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,524评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,339评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,387评论 6 391
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,287评论 1 301
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,130评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,985评论 0 275
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,420评论 1 313
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,617评论 3 334
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,779评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,477评论 5 345
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,088评论 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,716评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,857评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,876评论 2 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,700评论 2 354

推荐阅读更多精彩内容