字符串匹配(KMP算法)

因为这周事情特别多,所以上个星期所教的字符串匹配现在才进行整理。上周我们主要学习了四个算法:暴力算法,sunday算法,rk算法和kmp算法。本次主要讲一下上周师兄没来得及将的KMP算法,暴力算法是一切的基础所以顺便提一下。

首先,什么是字符串匹配?



如图所示,简而言之字符串匹配就是在text字符串中寻找pattern出现的位置。

一、暴力算法
暴力算法应该是绝大多数人第一时间想到的第一个方法了,其核心思想可以理解为:
一步步移动text字符串,直到“上方的”text字符串相对应位置的字符与pattern一一对应为止。(为什么说是移动text字符串而不是移动pattern字符串?因为在代码的实现上,pattern每次都是从0位置开始,变化的是text字符串的比较位置,所以说text字符串移动更有助于理解代码)

如下图所示:

第一次比较,text字符串的第一个字符为B,pattern为A,匹配失败。


第二次比较,将text往左移动一位,此时text的第二个字符将与pattern的第一个字符比较,本次比较仍然没有对应。

直到第四次比较,两个字符串对应位置的字符终于匹配成功。这样就可以让text停止移动,依次比较接下来几位对应位置的字符。如果匹配都成功,结果就出来了。


二、KMP算法
可以看出,暴力算法的比较次数很多,如果比较失败了,下一次比较pattern还得从第0位开始比较,那么有什么办法可以让字符串比较的时候比较智能的跳过一些无意义的比较呢?KMP算法就是解决这个问题的。
下面就来说明下KMP算法是什么。

如图所示,当我们匹配到第六个字符的时候,我们发现text是B,而pattern是A,匹配显然失败了,如果是按照暴力算法,我们就要将text往左边移动一位。



然而,我们可以观察到,pattern比较失败的那个字符A前面(ABBAB)中,往前找和往后找,可以找到两个一样的字符串(AB),这就给字符串提供了一个跳板,将前面AB原本在的位置直接跳到后面AB原本在的位置,就可以一下次移动很多位,极大减少了比较的次数,而且中间不会有遗漏的情况。


那么,这些相同的前缀后缀是怎么找到的,我们如何在代码中知道他们应该跳多少步?
如下图所示,如果我们假设pattern第一个字符就不匹配,而我上面提到,要往左边找相同的前缀字符串和后缀字符串,但第一个字符前面什么都没有,所以下一次仍然要从第一位开始找起来。



同理,当第二个字符不匹配的时候,前面只有一个字符,也找不到两个相同的前后缀,所以仍然要从第一个找起。



直到匹配到第四个字符,我们终于可以分别从前从后找到两个相同的字符串了。那就是第1位的A和第3位的A。

然后,因为前缀和后缀相同,而且比较到第四个字符,说明前面三个字符都是匹配成功,我们将会做这样的移动,移动过后,原本的比较到的第4位字符变成了第2位了。第1位A原本的位置就是曾经的后缀A匹配成功的,所以无须比较。故可以得出接下来要从第二位开始找起。

同理,接下来第五位,我们可以找到AB与AB,移动后比较的位置变成第3位。




而到了第六位的时候,我们可以找到第一位的A和第五位的A,但是我们还可以找到第123的ABA和第345的ABA,此时我们应该【选最长】的。

接下里你们可以自己在纸上写一写接下来的结果。

以此类推可以得到以下结果。



转化为坐标迁移数组:



是不是很眼熟?《数据结构》这个书本里面的坐标迁移列表就是这么出来的。接下来只要应用到代码中就可以了。

具体的代码网络上有很多,可以自己去搜索试着试验一下。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,547评论 6 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,399评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,428评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,599评论 1 274
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,612评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,577评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,941评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,603评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,852评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,605评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,693评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,375评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,955评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,936评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,172评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,970评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,414评论 2 342