题目
蒜头君有 个字符串,他随机选两个字符串,问它们的最长公共前缀的期望是多少。
输入格式
第一个一个整数 ,表示蒜头君有 个字符串。()
接下来 行,每行一个字符串,保证字符串仅由小写字母组成且总长度不超过 。
输出格式
输出一行,为最长公共前缀的期望,与标准输出相差 以内均算通过。
解析
这道题目,我们可以运用我们刚学习的 字典树 数据结构的原理来解决这个问题。
第一步,建立一棵字典树,统计每个节点的经过次数 和 以它为结尾的字符串个数。
第二步,通过对字典树、还有最长公共前缀的分析,那么最长公共前缀到达该节点时,有以下三种情况:
-
任意不同去向的两个字符串。
-
一个以当前点为结尾的字符串和一个有下一个点的字符串。
- 两个同时以这个点为结尾的字符串。(点 的 表示以该点结束的字符串数量,那么他们的组合数就是 )
分别统计这三种情况的组合数量,并乘上该点深度,可以得到这个点对总和的贡献。
第三步,除以总的情况数 就可以了。
参考答案代码
#include<bits/stdc++.h>
using namespace std;
const int maxn = 1e6+1;
char s[maxn];
int tot, ch[maxn][26], cnt[maxn], p[maxn];
long long ans;
void insert(){
int len = strlen(s), now = 0;
for(int i=0;i<len;i++){
if(ch[now][s[i]-'a']==0){
ch[now][s[i]-'a']=++tot;
}
now = ch[now][s[i]-'a'];
cnt[now]++;
}
p[now]++;
}
void dfs(int u, int step){ //利用深搜,求出所有点中的前缀数对于期望的贡献
for(int i=0;i<26;i++){
for(int j=i+1;j<26;j++){
if(ch[u][i] && ch[u][j]){
ans += step * cnt[ch[u][i]] * cnt[ch[u][j]]; //第一种情况
}
}
}
for(int i=0;i<26;i++){
if(ch[u][i]){
ans += step * p[u] * cnt[ch[u][i]]; //第二种情况
}
}
ans += step * p[u] * (p[u] - 1) / 2; //第三种情况
for(int i=0;i<26;i++){
if(ch[u][i]){
dfs(ch[u][i],step+1); //对点u的子节点进行深搜
}
}
return;
}
int main(){
long long N;
cin >> N;
for(long long i=0; i<N; i++){
cin >> s;
insert(); // 将新读入的字符串插入字符串
}
dfs(0,0); // 从 0 点开始,逐层向下去寻找最长的公共前缀
cout << fixed << setprecision(10) << 1.0 * ans / (N*(N-1)/2); // 求期望
return 0;
}