数据结构与算法学习笔记(训练营一第三节)---kmp

KMP(O(N))

流程

  • 定义两个变量x,y分别表示在原始串str中的位置和匹配串match中的位置。
  • 先生成需要匹配的字符串的next数组,next数组记录了当前元素的最长匹配前缀的和后缀的长度,并且也表示如果某一次没有匹配上,那么y需要跳到的位置(最长前缀的下一个元素就是需要继续比较的下一个位置)。
  • 同时比较x,y位置的字符是否相等:
    1.若相等则x,y同时加一向后继续比较。
    2.若不相等,判断此时该位置的next[y]位置是否是还能跳过去的位置如果是-1则表示此时位置已经是match的其实位置,不能再往前跳了,则让x向后走一步,继续和match的0位置开始比较,重复上面过程。若不等于-1表示可以继续跳,用next[y]位置和x位置进行比较若相等重复1,不相等重复2.

两个实质:

  • 利用y位置的前缀和数组可以减少不用让x回到当时起点的下一,y回到0位置继续进行比较。(证明在原始串str中后缀的头位置的前一个位置以前不可能在匹配出match字符串)。
  • 利用前缀后缀加速
/**
 * 假设字符串str长度为N,字符串match长度为M,M <= N
 * 想确定str中是否有某个子串是等于match的。
 * 时间复杂度O(N)
 */
public class Kmp {
    // 输入两个字符串str和match,返回match在str中匹配开始的位置,如果不匹配则返回-1
    public static int kpm(String str,String match){
        if(str == null
                || match == null
                || match.length() == 0
                || str.length() == 0
                ||str.length() < match.length()){
            return -1;
        }
        char[] strA = str.toCharArray();
        char[] matchA = match.toCharArray();
        // 定义两个变量一个代表str的下标,一个代表match的下标
        // str下标
        int x = 0;
        // match下标
        int y = 0;
        // 获取next数组
        int[] next = getNextArr(match);
        // 只要小标不越界就一直比较
        while (x < str.length() && y < match.length()){
            if(strA[x] == matchA[y]){
                // 如果两个字符相等,继续下一个的比较
                x ++;
                y ++;
            }else if(next[y] == -1){
                // 如果此时两个字符不相等,那么需要跳到match的最长前缀的下一个继续进行比较
                // 但是此时已经第一元素了,没有最长前缀了,那么y边让str中的x跳到下一个
                x ++;
            }else {
                // 当前位置y 有可以跳的最长前缀的下一个元素
                y = next[y];
            }
        }
        // 跳出循环的可能:1.x越界了,但是y没有越界,匹配失败;2.x没有越界但是y越界了,匹配上了;3.x,y同时都越界了匹配上了
        // 综上,只要是y越界的都是匹配上的
        return y == match.length() ? x - y : -1;


    }

    // 获取字符串的最长前缀和最长后缀的长度
    // match[i]表示在0~i-1上,以字符结尾的子串的最长前缀后最长后缀的长度
    // 且也可以代表最长前缀的下一个字符的位置,KMP中如果不满足要求需要跳的位置
    private static int[] getNextArr(String match){
        // 认为规定 如果只有一个字符那么next[0] = -1;
        // 如果多余一个字符那么第二个字符next[1] = 0;
        if(match.length() == 1){
            return new int[]{-1};
        }
        char[] matchA = match.toCharArray();
        int len = matchA.length;
        int[] next = new int[len];
        next[0] = -1;
        next[1] = 0;
        int index = 2;
        // 记录index - 1 前一个位置的值,也是index - 1前缀和的下一个位置的坐标
        int cn = 0;
        // 从第三个字符开始遍历
        while (index < len){
            // 看当前位置的前一个位置也就是index - 1的位置的值num
            // 比较next[num] 和 index - 1是否相等
            // 若相等,那么next[index] = next[index - 1] + 1;
            if(matchA[index - 1] == matchA[cn]){
                // cn index - 1 位置时的最长前缀
                // 现在index 跳到下一个了,那就是求index + 1 位置的值
                // 所以现在的cn = cn + 1;
                next[index ++] = ++cn;
            }else if(next[cn] == -1){
                // 已经不能在跳了那就是没有
                next[index ++ ] = 0;
                // 到了这个不那么坑定已经来到了数组中的0位置,那么此时cn =0;
                // 此时index = 2 所以下面这句可以不要
                cn = next[index - 1];

            }else{
                // 还能继续跳
                cn = next[cn];
            }
        }
        return next;
    }


    public static void main(String[] args) {
        String str = "rabdcadf";
        String match = "a";
        System.out.println(kpm(str, match));
    }
}

例题

  • 给你两个字符串str1,str2判断他们是否互为旋转词。旋转词,如字符"abcdef","cdefab"互为旋转词。
    流程,用两个str1拼接成一个新的字符串str3,判断str2是否是str3的子串,如果是那么str1,str2互为旋转词,否则不是。
public class XuanZhuanCi {
    public static boolean xuanZhuanCi(String str1,String str2){
        if(str1 == null || str2 == null || (str1.length() != str2.length())){
            return false;
        }

        String str3 = str1+str1;
        // 调用kmp算法
        int kpm = Kmp.kpm(str3, str2);
        return kpm == -1 ? false : true;
    }

    public static void main(String[] args) {
        String str1 = "abcdef";
        String str2 = "cdefab";
        System.out.println(xuanZhuanCi(str1,str2));
    }
}
  • 给定两棵二叉树的头节点head1和head2,想知道head1中是否有某个子树的结构和head2完全一样。
    流程:head1,head2两颗二叉树先序序列化,通过kmp看head2序列化后是否为head1的子串,若是,head2是head1的子结构。
/**
 * 给定两棵二叉树的头节点head1和head2
 * 想知道head1中是否有某个子树的结构和head2完全一样
 */
public class SubTree {
    public static boolean subTree(Node head1,Node head2){
        if(head1 == null && head2 != null){
            return false;
        }
        if(head1 != null && head2 == null){
            return false;
        }
        if(head1 == null && head2 == null){
            return true;
        }

        // 先序序列化head1 head2
        List<String> head1Str = new ArrayList<>();
        List<String> head2Str = new ArrayList<>();
        pre(head1,head1Str);
        pre(head2,head2Str);
        return kpm(head1Str,head2Str) != -1;
    }


    private static void pre(Node head,List<String> list){
        if(head == null){
            list.add(null);
        }else{
            list.add(head.value+"");
            pre(head.left,list);
            pre(head.right,list);
        }
    }


    // 输入两个字符串str和match,返回match在str中匹配开始的位置,如果不匹配则返回-1
    public static int kpm(List<String> str,List<String> match){
        if(str == null
                || match == null
                || match.size() == 0
                || str.size() == 0
                ||str.size() < match.size()){
            return -1;
        }
        String[] strA = new String[str.size()];
        for (int i = 0; i < strA.length; i++) {
            strA[i] = str.get(i);
        }
        String[] matchA = new String[match.size()];
        for (int i = 0; i < matchA.length; i++) {
            matchA[i] = match.get(i);
        }
        // 定义两个变量一个代表str的下标,一个代表match的下标
        // str下标
        int x = 0;
        // match下标
        int y = 0;
        // 获取next数组
        int[] next = getNextArr(matchA);
        // 只要小标不越界就一直比较
        while (x < str.size() && y < match.size()){
            if(isEqual(strA[x],matchA[y])){
                // 如果两个字符相等,继续下一个的比较
                x ++;
                y ++;
            }else if(next[y] == -1){
                // 如果此时两个字符不相等,那么需要跳到match的最长前缀的下一个继续进行比较
                // 但是此时已经第一元素了,没有最长前缀了,那么y边让str中的x跳到下一个
                x ++;
            }else {
                // 当前位置y 有可以跳的最长前缀的下一个元素
                y = next[y];
            }
        }
        // 跳出循环的可能:1.x越界了,但是y没有越界,匹配失败;2.x没有越界但是y越界了,匹配上了;3.x,y同时都越界了匹配上了
        // 综上,只要是y越界的都是匹配上的
        return y == match.size() ? x - y : -1;


    }

    // 获取字符串的最长前缀和最长后缀的长度
    // match[i]表示在0~i-1上,以字符结尾的子串的最长前缀后最长后缀的长度
    // 且也可以代表最长前缀的下一个字符的位置,KMP中如果不满足要求需要跳的位置
    private static int[] getNextArr(String[] matchA){
        // 认为规定 如果只有一个字符那么next[0] = -1;
        // 如果多余一个字符那么第二个字符next[1] = 0;
        if(matchA.length == 1){
            return new int[]{-1};
        }
        int len = matchA.length;
        int[] next = new int[len];
        next[0] = -1;
        next[1] = 0;
        int index = 2;
        // 记录index - 1 前一个位置的值,也是index - 1前缀和的下一个位置的坐标
        int cn = 0;
        // 从第三个字符开始遍历
        while (index < len){
            // 看当前位置的前一个位置也就是index - 1的位置的值num
            // 比较next[num] 和 index - 1是否相等
            // 若相等,那么next[index] = next[index - 1] + 1;
            if(isEqual(matchA[index - 1],matchA[cn])){
                // cn index - 1 位置时的最长前缀
                // 现在index 跳到下一个了,那就是求index + 1 位置的值
                // 所以现在的cn = cn + 1;
                next[index ++] = ++cn;
            }else if(next[cn] == -1){
                // 已经不能在跳了那就是没有
                next[index ++ ] = 0;
                // 到了这个不那么坑定已经来到了数组中的0位置,那么此时cn =0;
                // 此时index = 2 所以下面这句可以不要
                cn = next[index - 1];

            }else{
                // 还能继续跳
                cn = next[cn];
            }
        }
        return next;
    }

    public static boolean isEqual(String a, String b) {
        if (a == null && b == null) {
            return true;
        } else {
            if (a == null || b == null) {
                return false;
            } else {
                return a.equals(b);
            }
        }
    }


    public static void main(String[] args) {

        Node head1 = new Node(1);
        head1.left = new Node(2);
        head1.right = new Node(3);
        head1.right.left = new Node(4);

        Node head2 = new Node(3);
        head2.left = new Node(4);
        System.out.println(subTree(head1, head2));
        System.out.println( null == null);

    }
}
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,923评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,154评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,775评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,960评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,976评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,972评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,893评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,709评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,159评论 1 308
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,400评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,552评论 1 346
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,265评论 5 341
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,876评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,528评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,701评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,552评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,451评论 2 352