Manacher算法

一、简介

Manacher 算法,又称“马拉车算法”,主要用于求解最长回文子串的长度

二、经典最长回文子串长度求法

从字符串的每个字符开始,向左右两边扩,算出以每个字符为中心的回文子串的长度,然后取最大值。

但是用这种方法只能算出奇回文子串的长度,无法算出偶回文子串的长度,如下图所示,这是一个长度为 4 的回文串,但用上面的方法没办法算出它的长度,因为上面的方法是以一个字符为中心算长度,但是偶回文子串的中心并不是一个字符。

为了可以计算出偶回文子串的长度,我们可以对字符串做一些变化,把 “abba” 变成 “#a#b#b#a#” ,然后按照上面的方面再计算一次,就可以算出来了,最大值除以 2 向下取整就是最长回文串的长度。

这里是在原字符串的每个字符前后加了特殊符号 “#”,但其实这个特殊符号加什么都行,只是为了方便,就算原字符串中本来就有 “#” 也不会有影响,因为我们可以发现在比较的时候原字符只会与原字符进行比较,特殊字符只与特殊字符比较。

整个过程的时间复杂度为 O(n2)

三、Manacher 算法

与 KMP 有点类似,就是对经典的算法做一个加速

1、几个重要的概念,

以字符串 “#a#b#b#a#b#b#a#”为例

回文半径:从中心字符到回文子串结束的距离,如回文子串 “#a#” 的回文半径就是 2,“#a#b#b#a#” 的回文半径是5

回文半径数组 pArr:与 KMP 的next 数组有点类似,回文半径数组存放的是每个字符对应回文子串的半径

最右回文右边界 R:之前所有的回文子串的最右的边界

最右回文右边界的中心 C:即最右回文有边界对应的回文串的中心位置

2、Manacher算法流程

主要是计算回文半径数组 pArr,分为两种情况

1)下一个字符的位置 i 不在 R 里,这种情况 R 直接往右扩,且以这个字符为中心的回文子串的长度至少为 1

2)下一个字符的位置 i 在 R 里,找到 i 相对于 C 的对称点 j,这时又分为三种情况,记 R 相对于 C 的字符为 L,[L……R]即为以 C 为中心最长回文子串

① j 为中心的回文子串(下面称 j 回文子串)在 [L……R] 里,那么 i 为中心的回文子串(下面称 i 回文子串)半径与以 j 回文子串半径相等

② j 回文子串部分在 [L…… R]里,那么 i 回文子串半径为 R - i

③ j 回文子串的左边界正好等于 L,那么 i 回文子串半径至少为 R - i,然后继续往外扩

证明:主要证 2)部分

2)①如下图所示,j 左右的小括号区域(下面称为 j 区域)代表 j 回文子串 ,因为 L 到 R 是以 C 为中心的最长回文子串,所以 i 左右的小括号区域(下面称为 i 区域)与 j 区域一定是互相逆序的,又因为 j 区域是回文子串,所以 i 区域也是回文子串。那么如何确定它是最大呢?我们假设 x 是以 j 回文子串前一个字符,y 是后一个字符,p、q同理分别为以 i 回文子串前一个和后一个字符,我们假设刚才的回文子串不是最大,那么p 和 q 必是相等的,按照回文串的性质,p和y相等,q和x 相等,则x 和 y 一定是相等的,但是 j 回文子串是不包括 x 和 y 的,也就是说 x 和 y 不可能相等,即 p 和 q 不可能相等,假设不成立,所以 i 回文子串半径一定与 j 回文子串半径相等。


② j 回文子串不全在 [L……R] 里,如下图所示,找到 L 相对于 j 的对称点 L' ,由回文串的性质可知,[L…… L'] 一定是回文子串,所以与之对应 [R'…… R] 也是回文串,所以 i 回文子串的半径最小是 R - i。那有没有可能更大呢?不可能。下图中 x 是 L 的前一个字符,y 是 L' 的后一个字符,p 是 R' 的前一个字符,q 是 R 后一个字符。i 回文子串半径要想更大,就需要 p 和 q 相等,我们现在已知 x 和 y 都属于 j 回文子串,所以 x 和 y 相等,y 和 p 相等,即 x 和 p 相等,因为 以 C 为中心的最长回文子串的左右边界是 L 和 R,所以 x 和 q 是不可能相等的,结合起来就是 p 不可能等于 q,所以 i 的回文子串半径最大为 R - i。

③ j 回文子串的左边界正好等于 L,如下图所示,首先我们可以肯定 i 回文子串至少是 R - i,至于能不能继续扩大,就需要看 p 能不能等于 q,从图中可以看出,与前面两种情况不同,p 等不等于 q,并不会破坏 j 回文子串和以 C 为中心的回文子串,所以 p 是可以等于 q 的,如果 p 等于 q,那么 R 往右扩, i 回文子串半径 +1,直到不能继续向右为止。

3、时间复杂度

O(n)

具体分析过程,可以看 左神的视频讲解

4、具体实现

//转换字符串
public static char[] manacherString(String str) {
    char[] charArr = str.toCharArray();
    char[] res = new char[str.length() * 2 + 1];
    int index = 0;
    for (int i = 0; i != res.length; i++) {
        res[i] = (i & 1) == 0 ? '#' : charArr[index++];
    }
    return res;
}

//具体的 manacher 算法
public static int maxLcpsLength(String str) {
    if (str == null || str.length() == 0) {
        return 0;
    }
    char[] charArr = manacherString(str);
    int[] pArr = new int[charArr.length];
    //中心
    int C = -1;
    //回文右边界
    int R = -1;
    //最大的回文半径
    int max = Integer.MIN_VALUE;
    //求每一个位置的回文半径
    for (int i = 0; i != charArr.length; i++) {
        //i 至少的回文区域,先给 pArr[i]
        /**
             * 同时满足上面的两类情况
             * 1)如果 R < i,即 i 不在 R 里,那么半径至少为 1
             * 2)如果 R > i,即 i 在 R 里,那么
             *      p[Arr[2 * C - i]]:i 关于 C 的对称点 j 所对应的回文半径
             *      为什么取两者的较小值呢?
             *      首先三种情况:
             *          如果 j 回文子串完全在 C 回文子串里,那么 i 回文子串半径就是p[Arr[2 * C - i]]
             *          如果 j 回文子串在部分在 C 回文子串里,那么 i 回文子串半径就是 R - i
             *          如果 j 回文子串左边界正好等于 C 回文子串的左边界,那么 i 回文子串半径至少为 R - i
             *      因为 j 回文子串可能不全在 C 回文子串里,
             *          当 j 回文子串满足第一种情况时,此时 R - i >= p[Arr[2 * C - i]], i 回文子串半径就是p[Arr[2 * C - i]]
             *          当 j 回文子串满足第二、第三种情况时, 此时 R - i <= p[Arr[2 * C - i]],i 回文子串半径就是 R - i
             *      所以直接写成了 Math.min(pArr[2 * C - i], R - i)
             */
        pArr[i] = R > i ? Math.min(pArr[2 * C - i], R - i) : 1;
        /**
             *
             * 主要针对 R < i 和 j 回文子串左边界正好等于 C 回文子串的左边界这两种情况,回文子串需要扩充
             * pArr[i]存放了当前位置的最少的回文半径,charArr[i + pArr[i]]和charArr[i - pArr[i]分别是当前回文子串的后一个和前一个字符,相等则 pArr[i]++,否则break
             *
             * 虽然上面 j 回文子串完全在 C 回文子串里和 j 回文子串在部分在 C 回文子串里时,pArr[i] 已经是确定值,不需要再扩充,
             * 但为了代码方便,减少 if else 使用,直接全部扩充,不需要的扩充的仅需进行一次判断就 break了,对代码整体时间复杂度影响不大
             */
        while (i + pArr[i] < charArr.length && i - pArr[i] > -1) {
            if (charArr[i + pArr[i]] == charArr[i - pArr[i]]) {
                pArr[i]++;
            } else {
                break;
            }
        }
        /**
             * 判断当前字符的回文子串的有边界是否大于之前最右回文有边界
             * 如果大于,更新 R 和 C
             */
        if (i + pArr[i] > R) {
            R = i + pArr[i];
            C = i;
        }
        //取出最大半径
        max = Math.max(max, pArr[i]);
    }
    //max 中包括是 # 字符的半径,max - 1正好是原回文串的长度
    return max - 1;
}
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,837评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,551评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,417评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,448评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,524评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,554评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,569评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,316评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,766评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,077评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,240评论 1 343
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,912评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,560评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,176评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,425评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,114评论 2 366
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,114评论 2 352

推荐阅读更多精彩内容