【重学数据结构与算法(JS)】字符串匹配算法(四)——Sunday算法

前言

惯例,最重要的匹配思路还是要贴一遍:

  1. 模式串主串进行比较
    • 从前往后比较
    • 从后往前比较
  2. 匹配时,比较主串模式串的下一个位置
  3. 失配时,
    • 模式串中寻找一个合适的位置
      • 如果找到,从这个位置开始与主串当前失配位置进行比较
      • 如果未找到,从模式串的头部与主串失配位置的下一个位置进行比较
    • 主串中找到一个合适的位置,重新与模式串进行比较

Sunday算法也许是三种里面最好理解也最好写的一种了,它的思路也是在于失配时如何跳过尽可能多的字符,具体的说,主要是优化了第3步,失配时,在主串中找到一个合适的位置,重新与模式串进行比较

算法介绍与分析

  • 主串模式串的首位开始比较,记
    • 主串 S
    • 模式串 P
    • 主串长度 slen
    • 模式串长度 plen
    • 主串位置指针 i
    • 模式串位置指针 j
    • 每次重新匹配时,模式串尾部对应主串位置的下一位 m
  • 判断 S[i]P[j] 是否相等
    • 如果相等
      • 判断 jplen-1 是否相等,如果相等则表示 表示模式串匹配完成,直接返回 i - j 即可
      • 如果不相等,则继续比较下一位,即 i++;j++;
    • 如果不相等
      • 查看 S[m] 字符是否存在于 P 中,如果存在,将 P 移至两字符对应的位置上
      • 如果不存在,则移至 S[m] 的后一位
  • 如果移动后, m > slen ,说明 S 已经遍历一遍,仍然没有找到目标,模式串 匹配失败。

栗子

初始状态,i = 0, j = 0, m = 4

QQ20200123-205626.png

比较 S[0]P[0],发现不相等,看 S[4] 处发现并没有在 P 中出现

QQ20200123-205718.png

直接将 P 移至 S[4] 的后一位,此时 i = 5, j = 0, m = 9

QQ20200123-205913.png

比较 S[5]P[0],发现不相等,看 S[9] 处发现有在 P 中出现

QQ20200123-210136.png

P 中的 iS 中的 i 对齐,此时 i = 8, j = 0, m = 12

QQ20200123-210415.png

比较 S[8]P[0],发现不相等,看 S[12] 处发现并没有在 P 中出现

QQ20200123-210651.png

直接将 P 移至 S[12] 的后一位,此时 i = 13, j = 0, m = 17

QQ20200123-210854.png

比较 S[13]P[0],发现不相等,看 S[17] 处发现有在 P 中出现

QQ20200123-211050.png

P 中的 nS 中的 n 对齐,此时 i = 15, j = 0, m = 18

QQ20200123-211352.png

继续匹配,直到 j === plen - 1 = 3,则匹配成功,得到结果 i - j = 18 - 3 = 15

QQ20200123-211750.png

代码实现

极端情况的排除

carbon.png

整体逻辑框架

  • 首先,肯定有一个循环,先找到终结条件,和 BF算法 一样,查找顺序也是从前往后,可以很快知道,i < slen 就是终结的条件
  • 其次,就是要对匹配和失配进行不同的处理

由此,我们就可以写出整体的框架:

carbon的副本.png

细节的完善

carbon的副本2.png

总结

Sunday算法 遵循匹配思路,失配时采取自己的优化策略,也尽可能的移动了最多的步数,达到提高效率的目的,且易理解。

后记

“字符串匹配算法”是“重学数据结构与算法”系列笔记:

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 220,458评论 6 513
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 94,030评论 3 396
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 166,879评论 0 358
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,278评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,296评论 6 397
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 52,019评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,633评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,541评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 46,068评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,181评论 3 340
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,318评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,991评论 5 347
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,670评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,183评论 0 23
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,302评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,655评论 3 375
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,327评论 2 358