数据结构-解读KMP算法的程序实现

      在数据结构算法中,KMP算法可以说是为串的查找提供了良好的简约型方案,其最大的特点是主串的查找位置不需要回溯,有效地优化减少了查找的时间复杂度。具体详解可见http://baike.baidu.com/link?url=Z8lDiDx_z_3Z70Xc5n6avwOMHJJQDeBR20HlSAlN-YQI-sOc198b-9a6O_uBnPgZKTtAtS132VYJVBqFPwNgFK

      此方法的主要依赖于对模式串的处理,在模式串的查找中,需要在每次匹配失败后,都需要判断出下一次查找的起始位置;对此判断过程可以经过一个新的函数来实现,下一次的查找地址用next[]来记录,在对next进行赋值的过程中,用程序的实现如图所示

其中,i代表当前与主串相比较的位置,j所代表的是从下标为一处开始与正在比较位置之前的元素相同的字串的长度,next则是失败后模式串所要重新与主串参与匹配当前位置所指元素进行匹配的位置;个人认为此算法可以由先比后加的思路简单理解。

      先进行比较,再对加一的位置进行赋值,具体表现为首先判断当前主串所比较的元素之模式串当前比较的元素比较,如果成功匹配,则可分别将当前与主串匹配位置与模式串中子串位置分别加一后将next[j]的值赋予next[i],如图,设i的位置为5,j的位置设为2,此后若6位置的a匹配失败后,由于12与45相同,则回溯位置为3即可,满足的公式正好为next[5+1]=next[2+1],比较位置的结果决定之后一个位置对应next的下标,这正是i++,j++的巧妙之处。

             在了解了这些之后,代码的编写就会容易许多,下面着重分析怎样对代码进行编写。

      首先,需要考虑的是两种情况,即成功匹配和不成功匹配。不成功匹配中,又可以区分为:下一次的查找地址是1,即串首和非串首的串,在第二种情况下,必须满足的条件是在此次查找的前方必须有一个长度大于0的串与从第一个元素开始,与之等长且元素相同的串,可相交不可重合。拿上图举例,i=5时发生失配,其前面长度为1的串(下标为4)与第从头开始第一个元素(下标为1,可以理解为一个长度为1的串)相等,下一次的查找地址就是0+1。

          在程序的编写中,首先考虑匹配成功,从第一次匹配开始,可以如此编写:

i=1;

if(j==0)    {i++;j++;next[i]=j;}      //为第一次比较,决定的是next[2]=1;

接下来,假设仍可以正确匹配,则有

if (ch[2]==ch[1])   {2+1;1+1;next[3]=2}    //参考字串aaaaa

如果不是从确定第一个元素,如串:abaaaa,有

lf (ch[3]==ch[1])    {3+1;1+1;next[4]=2;}   //第四个a匹配失败时的重新查找地址是2,满足上面的代码格式。

依次类推,可以将前后的查找方位用i,j代替,并且写入while语句中,情况如下:

while (i<length){

if (j==0||ch[i]==ch[j])   {i++;j++;next[i]=j;}

}

接下来考虑匹配失败时的情况,在此时,首先需要明白的是,next代表的含义,设next[i]的值是k;则表明在i的前面有k-1长度的串与从1开始k-1个串的长度相等。

接下来,需要注意的是,如果当前匹配成功,而下一个i+1;j+1;的字符匹配不成功,则需要重新匹配的位置是在i+1之前的n个可以与j之前n个完全匹配的

字符串,重新匹配的下标为n+1,n不小于0。此时,可以和上面一段话对比,发现在不成功匹配时,可以用一个关于next[]的函数循环实现。由于当前匹配成功时,已经进行过了i++,j++的过程,j与i对比出错后,重新与i对比以便于确定next[i+1]的值的j应该取next[j],此过程需要保持i的值不变,因此,便可以在已有函数中加上匹配不成功的处理过程,结果如下:

while (i<length){

if (j==0||ch[i]==ch[j])   {i++;j++;next[i]=j;}

else

j=next[j];

}

需要额外考虑的是:如果n的值是0,即j=1与i-1的值仍旧不匹配,n=0;这种情况需要事先进行声明,有next[1]=0;此时正好进行j从0开始的匹配判断。

另外,由于是从第一个字符比较开始的,i的初始化值为1,此时j=0,正好进行第一次比较。


KMP算法的总结则如下:

next[1]=0;i=1;j=0;

while (i<length){

if (j==0||ch[i]==ch[j])   {i++;j++;next[i]=j;}

else

j=next[j];

}

文笔较渣,希望表达得可以理解。O(∩_∩)O

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,080评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,422评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,630评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,554评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,662评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,856评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,014评论 3 408
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,752评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,212评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,541评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,687评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,347评论 4 331
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,973评论 3 315
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,777评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,006评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,406评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,576评论 2 349

推荐阅读更多精彩内容