回文自动机，border原理以及可持久化（待更新）

关于一般的回文自动机

回文自动机，由于其 $fail$ 指针组成一颗失配树，又名回文树。关于这个算法是谁发现的，并不确切，我最早能追溯到是codeforces上一篇文章。不过至少在七年前，回文自动机应该不流行。例如像hdu3948，统计一个字符串中本质不同的回文串个数，这种模板题，相当部分人的题解是后缀数组，或者Manacher加上哈希。后来这种题目在17年某个网络赛上刻意卡掉了哈希算法，基本就只有自动机的做法了。现在而言，回文自动机已经算是OIer/ICPCer们的基本功了。

普通自动机，实现的细节不再叙述，网上资料也满天飞。这里给出一个模板：

#include <cstdio>
#include <cstring>

using namespace std;

namespace PAM {
    const int N = 500005, M = 26;
    int T[N][M], fail[N], len[N], sz, last, cnt[N];
    char s[N];

    void init() {
        len[0] = 0, len[1] = -1;
        sz = 1, last = 0;
        fail[0] = 1;
        memset(T[0], 0, sizeof(T[0]));
        memset(T[1], 0, sizeof(T[1]));
    }

    int get(int x, int pos) {
        while (pos == len[x] || s[pos - len[x] - 1] != s[pos])
            x = fail[x];
        return x;
    }

     void add(int c, int pos) {
        int t = get(last, pos);
        if (!T[t][c]) {
            len[++sz] = len[t] + 2;
            fail[sz] = T[get(fail[t], pos)][c];
            T[t][c] = sz;
            memset(T[sz], 0, sizeof(T[sz]));
        }
        last = T[t][c];
        cnt[last]++;
    }
}

//for (int i = PAM::sz; i >= 2; i--)
//        PAM::cnt[PAM::fail[i]] += PAM::cnt[i];
using namespace PAM;

其中每个节点都代表一个独一无二的回文子串。 $fail$ 指向了该串最大回文后缀的标号。 $T$ 则指向了该串向两边扩展同一个字母得到的新串， $len$ 则代表了这个回文串的长度， $cnt$ 则代表了本回文串出现的次数，一般的题目都会用到。

注意，每一次从左到右 $add$ 字符时，都会从上一个字符所在的回文后缀 $last$ 开始，查看是否可以走匹配，如果不行，则需要不断跳 $fail$ ，一直到空或者找到匹配，匹配的话，我们看此时当前这个节点是否存在，不存在就新建。总效率是 $O(n*M)$ 的，原因在于观察 $last$ 字符串的对称轴的移动，是不会往左的。向右边走的次数当然不超过 $n$ ，而每一次停止，都意味着左右两个字符相匹配。因为我们只添加 $n$ 个字符，所以停止次数也不会超过 $n$ 。

当然这是均摊意义上的。其中少量 $add$ 的时间可能比较大，因为走 $fail$ 可能会产生一条链，例如 $aaa...b$ ，扩展 $b$ 时便会如此。

Border理论

一些定理

部分参考自：https://zhuanlan.zhihu.com/p/93152631

定义：

$t$ 是 $s$ 的border，定义为 $t$ 既是 $s$ 的前驱串，又是 $s$ 的后缀串。
$t$ 是 $s$ 的周期，定义为 $s$ 可以看做 $n$ 个 $t$ 连接再截取前缀的结果（ $|t|\le|s|$ ）。

定理1： $t$ 是 $s$ 的border，当且仅当 $s$ 去掉后面一个 $t$ 得到的字符串，是 $s$ 的周期。

证明简单，可画图，从略。

定理2： $t$ 是回文串 $s$ 的后缀， $t$ 是 $s$ 的border当且仅当 $t$ 是回文串。

证明简单，可画图，从略。

定理3： $t$ 是字符串 $s$ 的border（ $|s|\le 2|t|$ ）， $s$ 是回文串当且仅当 $t$ 是回文串。

证明： $s$ 是回文， $t$ 当然是。 $t$ 是回文时，有 $s[i]=s[|t|+1-i]=s[|t|+1-i+|s|-|t|]=s[|s|+1-i]\ (i\le\lfloor\frac{s}{2}\rfloor)$ ，因此 $s$ 也是回文的。

证毕

定理4： $t$ 是字符串 $s$ 的 border，则 $s$ 去掉后面一个 $t$ 得到的字符串，是 $s$ 的周期，而如果是最小周期，当且仅当 $t$ 是 $s$ 的最长回文真后缀。

这是定理1衍生的，显然。

定理5： $x$ 是一个回文串， $y$ 是 $x$ 的最长回文真后缀， $z$ 是 $y$ 的最长回文真后缀。令 $u,v$ 分别为满足 $x=uy,y=vz$ 的字符串，则有下面三条性质：

$|u|\ge |v|$
如果 $|u|>|v|$ ，那么 $|u|\ge|z|$
如果 $|u|=|v|$ ，那么 $u=v$

这个定理是最重要的一条。会在回文自动机中得到很好应用。

证明摘自：https://xlor.cn/2019/11/mpf/

图片.png

由引理 4的推论， $|u|=|x|-|y|$ 是 $x$ 的最小周期， $|v|=|y|-|z|$ 是 $y$ 的最小周期。考虑反证法，假设 $|u|<|v|$ ，因为 $y$ 是 $x$ 的后缀，所以 $u$ 既是 $x$ 的周期，也是 $y$ 的周期，而 $v$ 是 $y$ 的最小周期，矛盾。所以 $|u|\ge|v|$ 。

因为 $y$ 是 $x$ 的 border，所以 $v$ 是 $x$ 的前缀，设字符串 $w$ ，满足 $x=v w$ （如下图所示），其中 $z$ 是 $w$ 的 border。考虑反证法，假设 $|u|\le|v|$ ，那么 $|z u| \leq 2|z|$ ，所以由引理 3 ， $w$ 是回文串，由引理 1 ， $w$ 是 $x$ 的 border，又因为 $|u|>|y|$ ，所以 $|w|>|y|$ ，矛盾。所以 $|u|>|v|$ 。

$u,v$ 都是 x 的前缀， $|u|=|v|$ ，所以 $u=v$ 。

推论：

$s$ 的所有回文后缀按照长度排序后，可以划分成 $\log |s|$ 段等差数列。

定理6：非空回文字符串 $S$ 如果存在一个回文后缀 $T$ ，那么 $S$ 的形式必然可以表示为 $YXYXY...XY$ 的形式。这里 $X,Y$ 为回文串，可以为空串。并且 $|X|+|Y|=|S|-|T|,|Y|=|S|\mod |S|-|T|$ 。

证明：

其实由定理4，这个定理的结论基本上接近显然了。这里给出不基于定理4的另一个证明，从另一个角度加以理解。

倘若 $a=|T|$ ， $2*a-|S|>0$ ，那么令 $b=2*a-|S|$ ，有 $2*b-a>0$ ，我们如下图构造出了回文字符串 $A$ 和 $B$ ，使得 $B$ 是回文串 $A$ 的回文后缀。如果我们找到了字符串 $A$ 的形式，那么将 $A$ 的右侧的 $|S|-a$ 个字符对称过来再拼接到左侧，就可以找到 $S$ 的形式。可以递归下去。

图片.png

倘若 $a=|T|$ ， $2*a-|S|\le0$ ，那么这个情况就很简单，是 $YXY$ 的形式，符合引理2所言，特殊地，当 $|X|=0$ ，也就是 $a=\frac{|S|}{2}$ 时， $S$ 可表示为两个回文串拼接而成。

图片.png

我们注意到每一次递归， $|S_i|-|T_i|=|S_{i-1}|-|T_{i-1}|=...=|S|-|A|$ ，因此，每次递归回溯，向左侧填充的字符串是完全一样的，都是 $YX$ 的形式，于是综上所述 $S=YXYXY...XY$ 。注意，一个回文串重复多次，只是一种特例的情况。

证毕

Border理论的应用

HDU6599 I Love Palindrome String

统计这样的回文串个数：满足自身回文同时满足前 $\lceil\frac{|s|}{2} \rceil$ 个字符组成的也是回文串。

有很多做法：马拉车配合哈希，回文自动机的 $fail$ 树上跑 $dfs$ 检查等等。知道Border原理之后就有一个很简单的方法：判断每个节点 $(len[i] >> 1) \% (len[i] - len[fail[i]])$ 的值是否为0，是则是符合题意的字符串。

原因很简单，一个回文串有 $\lfloor\frac{|s|}{2} \rfloor$ 长的回文后缀，意味着这个后缀在第一阶等差数列上，倘若不在，就找到第二阶梯第一个字符串 $s_2$ ，上个字符串为 $s_1$ 和上上个为 $s_0$ ，那么按照定理5，有 $|s_0|-|s_1|\ge|s_2|$ ，又 $|s_0|-|s_1|+|s_2|\le|s|-(|s_1|-|s_2|)< |s|$ ，因此 $s_2<\lceil \frac{|s|}{2} \rceil$ ，这是不可能的。

既然第一阶等差数列上，那么自然有 $|s|-\lceil\frac{|s|}{2} \rceil$ 是 $|s|-|fail[s]|$ 的倍数。因此满足条件的回文串至少一定满足这个倍数式子。满足式子的回文串，当然也是满足条件的：因为由定理4或者定理6，满足倍数的后缀一定是回文串。

类似的问题还有洛谷4287 双倍回文。当然，由于那道题求的不是个数，而是最大长度，因此用Manacher算法也可以做。

Codeforces932 G

这题应该相当经典了。可以说是万恶之源（雾。

首先我们发现，如果构造字符串 $t=s[0] s[n-1] s[1] s[n-2] s[2] s[n-3] \ldots s[n / 2-1] s[n / 2]$ ，那么问题会变成将字符串 $t$ 最少划分为多少个长度为偶数的字符串。

普通的 $dp$ 方法很显然，就是沿着回文自动机失配边走。但是每个节点走完 $fail$ ，次数的和是可以达到 $n^2$ 级别的，（比如：aaa...aa)。这里需要优化。

以下说明同样参考自博客：https://xlor.cn/2019/11/mpf/

回文树上的需要多维护两个信息 $dif[i]$ 和 $slink[i]$ 。前者表示节点和最长回文后缀的长度之差，即 $len[u]-len[fail[u]]$ 。后者表示节点一直沿着 fail 向上跳到第一个节点 $v$ ，使得 $dif[v]\not =dif[i]$ ，也就是 $i$

所在等差数列中长度最小的那个节点。

根据上面证明的结论，如果使用 $slink$ 指针向上跳的话，每向后填加一个字符，只需要向上跳 $O(\log|s|)$ 次。因此，可以考虑将一个等差数列表示的所有回文串的 $dp$ 值之和 $g$ ，记录到最长的那一个回文串对应节点上。

图片.png

$g[v]=\sum_{slink[x]=v}dp[i-len[x]]$

假设当前枚举到第 $i$ 个字符，回文树上对应节点为 $x$ 。 $g[x]$ 为橙色三个位置的 $dp$ 值之和（最短的回文串 $slink[x]$ 算在下一个等差数列中）。 $fail[x]$ 上一次出现位置是 $i-dif[x]$ （在 $i-dif[x]$ 处结束）， $g[fail[x]]$ 包含的 $dp$ 值是蓝色位置。因此， $g[x]$ 实际上等于 $g[fail[x]]$ 和多出来一个位置的 $dp$ 值之和，多出来的位置是 $i-slink[x]-diff[x]$ 。最后再用 $g[x]$ 去更新 $dp[i]$ ，这部分等差数列的贡献就计算完毕了，不断跳 $slink[x]$ ，重复这个过程即可。

参考代码：

#include <cstdio>
#include <cstring>

#define mo 1000000007

using namespace std;

namespace PAM {
    const int N = 1000005, M = 26;
    int T[N][M], fail[N], len[N], sz, last, slink[N], dif[N];
    char s[N];

    void init() {
        len[0] = 0, len[1] = -1;
        sz = 1, last = 0;
        fail[0] = 1;
        memset(T[0], 0, sizeof(T[0]));
        memset(T[1], 0, sizeof(T[1]));
    }

    int get(int j, int pos) {
        while (pos == len[j] || s[pos - len[j] - 1] != s[pos])
            j = fail[j];
        return j;
    }

    void add(int c, int pos) {
        int t = get(last, pos);
        if (!T[t][c]) {
            len[++sz] = len[t] + 2;
            fail[sz] = T[get(fail[t], pos)][c];
            T[t][c] = sz;
            memset(T[sz], 0, sizeof(T[sz]));
            dif[sz] = len[sz] - len[fail[sz]];
            slink[sz] = dif[sz] == dif[fail[sz]] ? slink[fail[sz]] : fail[sz];
        }
        last = T[t][c];
    }
}

using namespace PAM;

char t[N];
int n, dp[N], g[N];

int main() {
    scanf("%s", t);
    n = strlen(t);
    if (n & 1) {
        putchar('0');
        return 0;
    }
    for (int i = 0, j = 0; i < n >> 1; i++)
        s[j++] = t[i], s[j++] = t[n - i - 1];
    init();
    for (int i = 0; i < n; i++) {
        add(s[i] - 'a', i);
        for (int j = last, np; j > 0; j = slink[j]) {
            np = i - len[slink[j]] - dif[j];  //np最小为-1
            g[j] = np >= 0 ? dp[np] : 1;
            if (dif[j] == dif[fail[j]])
                g[j] = (g[j] + g[fail[j]]) % mo;
            if (i & 1)  //注意回文串必须是偶数，所以对应i%2==1
                dp[i] = (dp[i] + g[j]) % mo;
        }
    }
    printf("%d", dp[n - 1]);
    return 0;
}

最后编辑于：2020.03.30 15:50:08

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 216,240评论 6赞 498
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 92,328评论 3赞 392
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 162,182评论 0赞 353
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,121评论 1赞 292
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,135评论 6赞 388
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,093评论 1赞 295
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,013评论 3赞 417
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 38,854评论 0赞 273
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,295评论 1赞 310
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,513评论 2赞 332
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,678评论 1赞 348
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,398评论 5赞 343
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 40,989评论 3赞 325
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,636评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,801评论 1赞 268
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 47,657评论 2赞 368
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,558评论 2赞 352

回文自动机，border原理以及可持久化（待更新）

关于一般的回文自动机

Border理论

一些定理

Border理论的应用

HDU6599 I Love Palindrome String

Codeforces932 G

推荐阅读更多精彩内容