五. 串

串是由零个或多个字符组成的有限序列,又名叫字符串。
朴素的模式匹配算法

#define String char*

/*返回子串T在主串S中第pos个字符之后的位置。若不存在,则函数返回值为0。*/
int Index(String S, String T, int pos) {
    int i = pos; //i用于主串S中当前位置下标,若pos不为1则从pos位置开始
    int j = 1; //j用于子串T中当前位置下标值
    while (i <= S[0] && j <= T[0]) { //若i小于S长度且j小于T的长度时循环
        if (S[i] == T[i]) { //两字母相等则继续
            ++i;
            ++j;
        } else { //指针后退重新开始匹配
            i = i - j + 2; //i退回到上次匹配首位的下一位
            j = 1; //j退回到子串T的首位
        }
    }
    if (j > T[0]) {
        return i - T[0];
    } else {
        return 0;
    }
}

KMP模式匹配算法

为了避免重复遍历的情况,三位前辈发表了一个模式匹配算法,称之为克努特-莫里斯-普拉特算法,简称KMP算法。

void get_next(String T, int *next) {
    int i = 1, j = 0;
    next[1] = 0;
    while (i < T[0]) { //此处T[0]表示串T的长度
        if (j == 0 || T[i] == T[j]) { /*
                                       T[i]表示后缀的单个字符
                                       T[j]表示前缀的单个字符
                                       */
            ++i;
            ++j;
            next[i] = j;
        } else {
            j = next[j]; //若字符不相同,则j值回溯
        }
    }
}

int Index_KMP(String S, String T, int pos) {
    int i = pos;
    int j = 1;
    int next[255];
    while (i < S[0] && j <= T[0]) {
        if (j == 0 || T[i] == T[j]) {
            ++i;
            ++j;
            next[i] = j;
        } else {
            j = next[j];
        }
    }
    if (j > T[0]) {
        return i - T[0];
    } else {
        return 0;
    }
}

get_next函数进行改良

void get_nextval(String T, int *nextval) {
    int i = 1, j = 0;
    nextval[1] = 0;
    while (i < T[0]) {
        if (j == 0 || T[i] == T[j]) {
            ++i;
            ++j;
            if (T[i] != T[j]) {
                nextval[i] = j;
            } else {
                nextval[i] = nextval[j];
            }
        } else {
            j = nextval[j];
        }
    }
}d4dd
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 串的概念 串(String)是由零个或多个字符组成的有限序列,又名字符串,一般记为 s = "a1a2...an"...
    聪明的奇瑞阅读 3,214评论 1 4
  • 十一期间,项目比较紧,让各位久等了 一.串的定义 串:是由零个或多个字符组成的有限序列,又名叫字符串一般记为s =...
    e40c669177be阅读 1,182评论 1 2
  • 串是由零个或多个字符组成的有限序列,又名叫字符串;零个字符的串称为空串(null string,也用Φ表示),只包...
    Bangys阅读 389评论 0 0
  • 1. 串 串的定义:串是由零个或多个字符组成的有限序列,又名叫字符串。串是一种内容受限制的线性表,其特殊性体现在数...
    yinxmm阅读 1,874评论 0 0
  • KMP算法——寻找子串位置 1、KMP算法简介: KMP算法是一种改进的字符串匹配算法,由D.E.Knuth,J....
    一直流浪阅读 815评论 0 5