小 P 在看过电影《超时空接触》(Contact)之后被深深的打动,决心致力于寻
找外星人的事业。于是,他每天晚上都爬在屋顶上试图用自己的收音机收听外星
人发来的信息。虽然他收听到的仅仅是一些噪声,但是他还是按照这些噪声的高
低电平将接收到的信号改写为由 0 和 1 构成的串, 并坚信外星人的信息就隐藏在
其中。他认为,外星人发来的信息一定会在他接受到的 01 串中重复出现,所以
他希望找到他接受到的 01 串中所有重复出现次数大于 1 的子串。但是他收到的
信号串实在是太长了,于是,他希望你能编一个程序来帮助他。
输入文件的第一行是一个整数N ,代表小 P 接收到的信号串的长度。
输入文件第二行包含一个长度为N 的 01 串,代表小 P 接收到的信号串。
输出文件的每一行包含一个出现次数大于1 的子串所出现的次数。输出的顺
序按对应的子串的字典序排列。
后缀数组需要将内存开大两倍,这个问题我就不赘述了。主要问题是求height数组,以前总觉得顺序问题很烦,其实也不难,只要搞清楚求height的转移顺序就行,一个位置的height求取就需要它在“字符串位置”中前一个位置的height值就行了,所以for语句应该一次枚举原数组的位置。
剩下就比较简单了,我用O(n^2)的时间复杂度处理答案,不知道有没有更快的,一点小的注意事项,字典序排序注意起始位置相同的子串的顺序,其顺序与枚举顺序相反。也就是说我们在绕过一个坑的情况下防止跌进另一个坑中。
#include<iostream>
#include<cstdio>
#include<cstring>
#include<algorithm>
#include<vector>
using namespace std;
#define MAXN 3010*2
char str[MAXN];
int sa[MAXN],tsa[MAXN];
int rank[MAXN],trank[MAXN];
int buc[MAXN];
int height[MAXN];
int theight[MAXN];
void IndexSort(int jp,int n)
{
memset(buc,0,sizeof(buc));
for (int i=0;i<n;i++)buc[rank[i+jp]]++;
for (int i=1;i<=n;i++)buc[i]+=buc[i-1];
for (int i=n-1;i>=0;i--)tsa[--buc[rank[i+jp]]]=i;
memset(buc,0,sizeof(buc));
for (int i=0;i<n;i++)buc[rank[tsa[i]]]++;
for (int i=1;i<=n;i++)buc[i]+=buc[i-1];
for (int i=n-1;i>=0;i--)sa[--buc[rank[tsa[i]]]]=tsa[i];
}
void SuffixArray(char* str,int n)
{
for (int i=0;i<n;i++)trank[i]=str[i]-‘0‘+1;
for (int i=0;i<n;i++)buc[trank[i]]++;
for (int i=1;i<=n;i++)buc[i]+=buc[i-1];
for (int i=n-1;i>=0;i--)sa[--buc[trank[i]]]=i;
for (int i=0,x=0;i<n;i++)
{
if (!i || trank[sa[i]]!=trank[sa[i-1]])x++;
rank[sa[i]]=x;
}
for (int j=1;j<n;j=j<<1)
{
IndexSort(j,n);
int x=0;
for (int i=0;i<n;i++)
{
if (!i || rank[sa[i]]!=rank[sa[i-1]] || rank[sa[i]+j]!=rank[sa[i-1]+j])x++;
trank[sa[i]]=x;
}
for (int i=0;i<n;i++)rank[i]=trank[i];
if (x==n)break;
}
}
void InitHeight(int n)
{
for (int i=0;i<n;i++)
{
if (rank[i]==1)continue;
height[i]=max(height[i-1]-1,0);
while (i+height[i]<n && sa[rank[i]-2]+height[i]<n
&& str[i+height[i]]==str[sa[rank[i]-2]+height[i]])
height[i]++;
}
for (int i=1;i<n;i++)
theight[i]=height[sa[i]];
}
vector<int> vec;
int stack[MAXN],tops=-1;
int main()
{
freopen("input.txt","r",stdin);
int n;
int x;
scanf("%d\n",&n);
scanf("%s\n",str);
SuffixArray(str,n);
InitHeight(n);
// for (int i=0;i<n;i++)printf("%d ",sa[i]);printf("\n");
// for (int i=0;i<n;i++)printf("%s\n",str+sa[i]);printf("\n");
// for (int i=0;i<n;i++)printf("%d ",height[i]);printf("\n");
for (int i=1;i<n;i++)
{
if (theight[i]<=theight[i-1])continue;
x=i;
for (int k=theight[i];k>theight[i-1];k--)
{
while (x+1<n && theight[x+1]>=k)x++;
stack[++tops]=x-i+2;
}
while (~tops)
printf("%d\n",stack[tops--]);
}
}