代码随想录第 9 天:地狱 KMP

字符串系列最后两题,地狱 KMP😭今天先小理解一波~

28. 实现 strStr()

题目描述:
给定一个 haystack 字符串和一个 needle 字符串,在 haystack 字符串中找出 needle 字符串出现的第一个位置 (从0开始)。如果不存在,则返回 -1。
示例 1: 输入: haystack = "hello", needle = "ll" 输出: 2
示例 2: 输入: haystack = "aaaaa", needle = "bba" 输出: -1
说明: 当 needle 是空字符串时,我们应当返回什么值呢?这是一个在面试中很好的问题。 对于本题而言,当 needle 是空字符串时我们应当返回 0 。这与C语言的 strstr() 以及 Java的 indexOf() 定义相符。

解题方法:KMP 算法

思考:

KMP中心思想:next数组的构成和比较的过程
KMP算法的核心是判断某个字串是否出现在另一个文本串中,我们通过获得前最表来获取文本串和模式串中
最长相等前后缀长度,保存在next数组中;当文本串和模式串进行比较时,若元素相等,则进位;若元素不相等,
位于模式串的指针要进行回退,回退到next数组前一位标记的位置,也就是上一个最长相等前后缀长度的位置,
再跟文本串进行比较,若字符相等,则从该为后开始继续匹配;若还是不想等,则模式串指针继续回退,直到无法回退;

KMP优点:
KMP的主要思想是当出现字符串不匹配时,可以知道一部分之前已经匹配的文本内容,
可以利用这些信息避免从头再去做匹配了。

该题思路:
1.先获取所给字符串的next数组,并编写getNext函数;
2.根据next数组,获取最长相等前后缀的长度next[len-1]
判断如果 字符串总长度 %(字符串的总长度-最长相等前后缀长度)为0的话,则字符串的总长度是可以被
最长前后缀的长度除尽的,因此整个字符串可以被最长相等前后缀重复组成

class Solution {
    public int strStr(String haystack, String needle) {
        if (needle.length() == 0) {
            return 0;
        }

        //创建next数组,并获取needle的next数组
        int[] next = new int[needle.length()];
        getNext(next, needle);
        
        int j = 0;
        for (int i = 0; i < haystack.length(); i++) {
            while (j > 0 && needle.charAt(j) != haystack.charAt(i)) {
                j = next[j -1];
            }
            if (needle.charAt(j) == haystack.charAt(i)) {
                j++;
            }

            if (j == needle.length()) {
                return i - needle.length() + 1;
            }
        }
        return -1;
    }

    private void getNext(int[] next, String s) {        
        int j = 0;
        //对于第一个字符,没有前缀也没有后缀,因此前后缀相同部分为0;
        next[0] = j;
        //j为后缀字串,i为前缀字串,因此初始化i位1,j为0
        for (int i = 1; i < s.length(); i++) {
            while (j > 0 && s.charAt(j) != s.charAt(i)) {
                j = next[j - 1];
                //比较i,j所在的字符,如果不相等,j就退回next数组中前一位标记的位置
                //因为next数组记录的是前缀后缀相等字符串的长度
            }
            /*对i,j所在字符进行判断:
                ·如果相等,则i,j各进一步
                ·如果不相等,j进行回退,回退完之后再次比较
            */
            if (s.charAt(i) == s.charAt(j)) {
                j++;
            }
            //i标记的是当前所在的后缀字符,i在整轮循环中是不会变的,循环不变量
            //j记录的是当前前后缀相等的字符串长度,因此把j的值记录进next数组中
            next[i] = j;
            
        }
    }
}

459.重复的子字符串

题目描述:
给定一个非空的字符串,判断它是否可以由它的一个子串重复多次构成。给定的字符串只含有小写英文字母,并且长度不超过10000。

示例 1:

输入: "abab"
输出: True
解释: 可由子字符串 "ab" 重复两次构成。
示例 2:

输入: "aba"
输出: False
示例 3:

输入: "abcabcabcabc"
输出: True
解释: 可由子字符串 "abc" 重复四次构成。 (或者子字符串 "abcabc" 重复两次构成。)

解题方法:

class Solution {
    public boolean repeatedSubstringPattern(String s) {
        int len = s.length();
        if (len == 0) {
            return false;
        }
        int[] next = new int[len];
        getNext(next, s);
        if (next[len - 1] != 0 && len % (len - next[len - 1]) == 0) {
            return true;
        }
        return false;
    }

    private void getNext(int[] next, String s) {
        int j = 0;
        next[0] = j;
        //j初始化必须在0,i初始化必须在1
        for (int i = 1; i < s.length(); i++) {
            while (j > 0 && s.charAt(j) != s.charAt(i)) {
                j = next[j - 1];
            }

            if (s.charAt(i) == s.charAt(j)) {
                j++;
            }
            next[i] = j;
        }
    }
}

/*
    时间复杂度为O(n), n为字符串的长度;因为只匹配一遍
    空间复杂度O(n)

*/
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容