08-字符串匹配

KMP

KMP算法使主串指针不回溯,只有模式串指针回溯,因此比朴素匹配效率高。

// 懂得KMP匹配原理和next数组,可以手工KMP匹配,但对代码还不太理解
public class KnuthMorrisPratt {
    public static int[] getNext(String pattern) {
        int k = -1;
        int j = 0;
        int[] next = new int[pattern.length()];
        next[0] = -1;
        while (j < pattern.length() - 1) {
            // pattern.charAt(j)表示后缀,pattern.charAt(k)表示前缀
            if (k == -1 || pattern.charAt(j) == pattern.charAt(k)) {
                j++;
                k++;
                if (pattern.charAt(j) != pattern.charAt(k))
                    next[j] = k;
                else
                    // 因为不能出现pattern.charAt(j) == pattern.charAt(next[j])
                    // 所以当出现时需要继续递归
                    next[j] = next[k];
            } else {
                k = next[k];
            }
        }
        return next;
    }

    public static int kmpIndex(String source, String pattern, int[] next) {
        int i = 0, j = 0;
        while (i < source.length() && j < pattern.length()) {
            if (j == -1 || source.charAt(i) == pattern.charAt(j)) {
                // 继续比较后继字符
                i++;
                j++;
            } else {
                // 模式串向右移动
                // 移动位数 = 已匹配字符数 - 对应的部分匹配值
                // 部分匹配值为前缀和后缀的最长的公共元素的长度
                j = next[j];
            }
        }
        if (j == pattern.length())
            // 匹配成功
            return i - pattern.length();
        else
            return -1;
    }

    public static void main(String[] args) {
        String source = "ababcabcacbab";
        String pattern = "abcac";
        int[] next = getNext(pattern);
        System.out.println(kmpIndex(source, pattern, next));
    }
}
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容