第四章-串&有关KMP算法方面的总结-2019-03-05

char    cStr[] = "abc";串长为3 数组的长度为4(应为有个'\0')

串的存储结构 ,对于我来说怎么都不会定义一个数据结构,书上这么说,就多写一遍加深记忆

typedef struct str

{

        int    str[maxSize+1];

        int    nLength;

}str;

或者

typedef struct str

{

        char *ch;

        int    nLength;

}str;


KMP算法

        这个真是,看了别人的书感觉写的怪怪的,不符合自己的思维方式。看视频,知道怎么用,怎么写,还是感觉自己的理论并没有那么清晰,所以还是自己整理一下,加深印象。以前对这些算法不太重视,真看进去感觉还是挺有意思的。

 如在a b a b c a b c a c b a b查找是否有a b a b a b b

    术语:

    1、模式匹配:对一个串中某子串的定位操作

    2、模式串:待定位的子串,既(a b a b a b b 

普通匹配比较,挨个比较会比较慢,如下图

  p1              a b a b     c     a b c a c b a b

   p2             a b a b     a     b b 

当开始比较的的时候abab都相等,到c处才发现不等,这时p2需从头开始与p1的b处开始的地方进行比较,即:

  p1              a b a b c a b c a c b a b     

  p2                 a b a b a b b 

依次类推,知道查到有子串或者没有子串与模式串完全相等

KMP算法

  p1              a b a b     c     a b c a c b a b   

  p2              a b a b     a     b b 

当p1,p2在不等的位置,p2往后移,与p1匹配的过程中,有些步骤完全可以省略掉,如在p2总,只看a前面的字母,即下图加粗的地方

   p1              a b a b     c     a b c a c b a b                                        (1)                

   p2              a b a b     a     b b                                                           (2) 

      p2              a b a      b     a b b   (p2往后移了1个位置)          (3)

           p2            a b      a     b a b b   (p2往后移了2个位置)      (4)

            会发现,并不是所有的字符都匹配p1总的前面的字符都匹配,例如(3)。如果能从(2)直接跳跃到(4),然后对下图(1)和(4)中的c和a进行比较则能够省去很多步骤。

   p1              a b a b     c     a b c a c b a b                                        (1)   

           p2            a b      a     b a b b   (p2往后移了2个位置)       (4)

怎样才能保证从(2)跳到(4)呢,这里,必须保证(4)中a前加黑的地方相等与(2)中p2的a前面的加黑部分,以为如果加黑的部分不相等,根本就走不到(4)的    a    处,也就无从谈匹配了。其实也就是说abab这四个字母,前面的顺序ab必须等于后面的ab。

   p2              a b a b     a     b b                                                           (2) 

           p2            a b      a     b a b b   (p2往后移了2个位置)       (4) 

{

        附录:

                最长公共前后缀的求法,如a b a b a b b,下面所有的例子也拿书上这一串代码做说明

                前缀                公共前后缀        长度

                a                        无                         0

                ab                       无                        0

                aba                    a                           1

                ab ab                   ab                       2(加粗部分上这一串字符前后最长相等的字符串,其长度为2)

                ababa                 aba                      3

                ababab                abab                   4

我们把公共前后缀的长度+1(为啥要+1呢,一位前面的都匹配了,做的是+1位置与当前主串位置匹配的地方的比较),保存到数组next[]中,改数组从next[1] = 0开始,也就是

next[]数组中从1-7分别保存了0,1,1,2,3,4,5。

}

其实求出next[]的信息,也就把kmp算法最难得部分解决了,其他的就是根据next[]做相应的比较运算。

KMP算法的改进

{

                对于字符串a a a a a b

            next[]的信息为0 1 2 3 4 5 

列出来如下表

字符串        a    a    a    a    a    b

    j              1    2    3    4    5     6

 next[ j ]       0   1     2    3    4    5(j的值就是上面加粗的对应的,next[6] == 5,next[2] == 1)

根据kmp算法,如果在b处发生不匹配,这返回next[6]处,即j=5处与字母a进行比较,如果又发生不匹配,这返回到next[5],即j=4处进行比较;如果又发生不匹配,这返回到next[4],即j=3处进行比较,依次,知道next[j]==0或者找到发生匹配的地方。

这里我们会发现另外一个问题,如果在j=5处与字母a不匹配,则相应的与j=4处的字母a也不发生匹配,这样分析的话,我们在kmp的时候多做了很多的无用功,所以呢,我们可以作为改进,求另外一个nextval[]数组,来知道算法比较的时候跳跃到的地方。

字符串        a    b    a    b    a    a    b 

    j               1    2    3    4    5     6   7 

 next[ j ]       0    1    1    2    3    4    2 

nextval[ j ]    0    1    0    1    0    4    1

j=2对应的nextval[2]的值为1是怎么来的呢:在j=2处如果发生不匹配,根据kmp算法首先跳到next[ 2 ],即j=1的地方进行匹配,这时我们发现j=1对应的是字母a,因为a不等于b,所以给nextval赋值为j,即为1(加粗的地方就是要赋值给nextval的值)

j=2对应的nextval[3]的值为0是怎么来的呢 :

在j=3处如果发生不匹配,根据kmp算法首先跳到next[ 3],即j=1的地方进行匹配,这时我们发现j=1对应的是字母a,因为a==a,发现相同,这时候nextval[ 3 ]的值=nextval[ 1 ]的值,即为0。

j=6对应的nextval[6]的值为4是怎么来的呢 : 在j=6处如果发生不匹配,根据kmp算法首先跳到next[ 6],即j=4的地方进行匹配,这时我们发现j=4对应的是字母b,因为a!=b,这时候nextval[ 6 ]的值等于j的值,即为4。 

就这么来的……不写了……算出这些玩意,其他的就没意思了。

发现自己写的估计除了我看,比人看更蛋疼。

}

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 205,386评论 6 479
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,939评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,851评论 0 341
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,953评论 1 278
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,971评论 5 369
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,784评论 1 283
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,126评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,765评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,148评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,744评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,858评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,479评论 4 322
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,080评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,053评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,278评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,245评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,590评论 2 343

推荐阅读更多精彩内容

  • 专业考题类型管理运行工作负责人一般作业考题内容选项A选项B选项C选项D选项E选项F正确答案 变电单选GYSZ本规程...
    小白兔去钓鱼阅读 8,972评论 0 13
  • 在C语言中,五种基本数据类型存储空间长度的排列顺序是: A)char B)char=int<=float C)ch...
    夏天再来阅读 3,323评论 0 2
  • 前言 最先接触编程的知识是在大学里面,大学里面学了一些基础的知识,c语言,java语言,单片机的汇编语言等;大学毕...
    oceanfive阅读 3,043评论 0 7
  • 一、快捷键 ctr+b 执行ctr+/ 单行注释ctr+c ...
    o_8319阅读 5,782评论 2 16
  • 我喜欢这一刻的孤单的想你未来的你我不希望你是蓝色穹顶的云絮因为风会带走你最好是让风一声叹息的沉默最浪漫的人一定是火...
    青眠谷雨阅读 202评论 0 0