首页 > 其他 > 详细

POJ-2774 Long Long Message (最长公共子串,后缀系列结构)

时间:2020-01-19 14:33:21      阅读:56      评论:0      收藏:0      [点我收藏+]

POJ-2774 Long Long Message (最长公共子串,后缀系列结构)

后缀数组

将两个串接在一起,中间加上一些奇怪的字符

然后就是求下标分别落在两个串中的所有\(i,j\)\(LCP(Suf_i,Suf_j)\)的最大值

按照\(SA\)的顺序可以发现只用考虑最近的\(i,j\),所以对于每个 \(i\) 找到最近的 \(j\) 即可,就是一个尺取

尺取\(L,R\)之后可以用单调队列查询

#include<cstdio>
#include<algorithm>
#include<iostream>
#include<cctype>
#include<cstring>
#include<cassert>
using namespace std;

#define reg register
#define pb push_back
typedef long long ll;
typedef unsigned long long ull;
#define rep(i,a,b) for(reg int i=a,i##end=b;i<=i##end;++i)
#define drep(i,a,b) for(reg int i=a,i##end=b;i>=i##end;--i)
template <class T> inline void cmin(T &a,T b){ ((a>b)&&(a=b)); }
template <class T> inline void cmax(T &a,T b){ ((a<b)&&(a=b)); }
char IO;
int rd(){
    int s=0;
    int f=0;
    while(!isdigit(IO=getchar())) f|=(IO=='-');
    do s=(s<<1)+(s<<3)+(IO^'0');
    while(isdigit(IO=getchar()));
    return f?-s:s;
}


const int N=2e5+10,INF=1e9;

int n,m;
char s[N];
int cnt[N],tmp[N],rk[N<<1],lcp[N],sa[N];

void PreMake(){
    memset(cnt,0,800);
    rep(i,1,n) cnt[(int)s[i]]++;
    rep(i,1,200) cnt[i]+=cnt[i-1];
    rep(i,1,n) rk[i]=cnt[(int)s[i]],sa[i]=i;
    rep(i,n+1,n*2) rk[i]=0;
    for(reg int k=1;k<=n;k<<=1) {
        rep(i,0,n) cnt[i]=0;
        rep(i,1,n) cnt[rk[i+k]]++;
        rep(i,1,n) cnt[i]+=cnt[i-1];
        drep(i,n,1) tmp[cnt[rk[i+k]]--]=i;
        
        rep(i,0,n) cnt[i]=0;
        rep(i,1,n) cnt[rk[i]]++;
        rep(i,1,n) cnt[i]+=cnt[i-1];
        drep(i,n,1) sa[cnt[rk[tmp[i]]]--]=tmp[i];
        
        rep(i,1,n) tmp[sa[i]]=tmp[sa[i-1]]+(rk[sa[i]]!=rk[sa[i-1]]||rk[sa[i]+k]!=rk[sa[i-1]+k]);
        rep(i,1,n) rk[i]=tmp[i];
    }
    int h=0;
    rep(i,1,n) {
        int j=sa[rk[i]-1];
        if(h) h--;
        while(i+h<=n && j+h<=n && s[i+h]==s[j+h]) h++;
        lcp[rk[i]-1]=h;
    }
}

int GetIndex(int x) {
    x=sa[x];
    if(x<=m) return 1;
    if(x>m+1) return 2;
    return 0;
}

int c[4];
int Q[N],l=1,r;


int main(){
    scanf("%s",s+1),m=strlen(s+1);
    s[m+1]='#';
    scanf("%s",s+m+2),n=strlen(s+1);
    PreMake();
    int ans=0;
    for(reg int L=1,R=1;R<=n;++R) {
        c[GetIndex(R)]++;
        if(R-1>=L) {
            while(l<=r && lcp[Q[r]]>lcp[R-1]) r--;
            Q[++r]=R-1;
        }
        while(!GetIndex(L)||c[GetIndex(L)]>1) --c[GetIndex(L++)] ;
        while(l<=r && Q[l]<L) l++;
        if(c[1]&&c[2]) cmax(ans,lcp[Q[l]]);
    } // 尺取L,R 单调队列维护查询
    printf("%d\n",ans);
}




\[ \ \]

后缀自动机

当然可以像类似上面那样地去做,但是会比较慢,内存也会大

可以对于第一个串构建自动机,第二个串对于每个前缀,直接逐个匹配最长公共的的后缀

也就是逐个字符转移下来,如果不存在转移就不断返回\(link\),直到存在转移或为空,注意同时维护当前长度

#include<cstdio>
#include<cstring>
#include<cctype>
using namespace std;

#define reg register
typedef long long ll;
#define rep(i,a,b) for(int i=a,i##end=b;i<=i##end;++i)
#define drep(i,a,b) for(int i=a,i##end=b;i>=i##end;--i)

#define pb push_back
template <class T> inline void cmin(T &a,T b){ ((a>b)&&(a=b)); }
template <class T> inline void cmax(T &a,T b){ ((a<b)&&(a=b)); }

char IO;
int rd(){
    int s=0,f=0;
    while(!isdigit(IO=getchar())) if(IO=='-') f=1;
    do s=(s<<1)+(s<<3)+(IO^'0');
    while(isdigit(IO=getchar()));
    return f?-s:s;
}

const int N=2e5+10;

bool be;

int n;
char s[N];
int trans[N][26];
int lst,stcnt;
int len[N],link[N],ma[N];

struct Edge{
    int to,nxt;
}e[N];
int head[N],ecnt;
void AddEdge(int u,int v) {
    ecnt++;
    e[ecnt].to=v,e[ecnt].nxt=head[u];
    head[u]=ecnt;
}

ll ans;
int vis[N];

bool ed;

void Init(){ 
    link[0]=-1,len[0]=0;
    rep(i,0,stcnt) {
        len[i]=head[i]=ma[i]=0;
        rep(j,0,25) trans[i][j]=0;
        vis[i]=0;
    }
    stcnt=lst=ecnt=0;
}

void Extend(int c) {
    int cur=++stcnt,p=lst;
    len[cur]=len[lst]+1;
    while(~p && !trans[p][c]) trans[p][c]=cur,p=link[p];
    if(p==-1) link[cur]=0;
    else {
        int q=trans[p][c];
        if(len[q]==len[p]+1) link[cur]=q;
        else {
            int clone=++stcnt;
            link[clone]=link[q];
            memcpy(trans[clone],trans[q],104);
            len[clone]=len[p]+1;
            while(~p && trans[p][c]==q) trans[p][c]=clone,p=link[p];
            link[q]=link[cur]=clone;
        }
    }
    lst=cur;
}


int main(){
    scanf("%s",s+1);
    n=strlen(s+1);
    Init();
    rep(i,1,n) Extend(s[i]-'a');
    int ans=0;
    scanf("%s",s+1);
    int len=strlen(s+1);
    int p=0,nowlen=0;
    rep(i,1,len) {
        int c=s[i]-'a';
        while(p && !trans[p][c]) {
            p=link[p];
            cmin(nowlen,(~p?::len[p]:0));
        }
        if(trans[p][c]) {
            p=trans[p][c];
            nowlen++;
        }
        cmax(ans,nowlen);
    }
    printf("%d\n",ans);
}





POJ-2774 Long Long Message (最长公共子串,后缀系列结构)

原文:https://www.cnblogs.com/chasedeath/p/12213441.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!