后 缀 数 组 —-处理字符串的有力工具 处理字符串的有力工
#include<iostream> #include<cstring> #include<cstdlib> #include<algorithm> #include<cctype> #include<cmath> #include<ctime> #include<string> #include<stack> #include<deque> #include<queue> #include<list> #include<set> #include<map> #include<cstdio> #include<limits.h> #define MOD 1000000007 #define fir first #define sec second #define fin freopen("/home/ostreambaba/文档/input.txt", "r", stdin) #define fout freopen("/home/ostreambaba/文档/output.txt", "w", stdout) #define mes(x, m) memset(x, m, sizeof(x)) #define Pii pair<int, int> #define Pll pair<ll, ll> #define INF 1e9+7 #define inf 0x3f3f3f3f #define Pi 4.0*atan(1.0) #define lowbit(x) (x&(-x)) #define lson l,m,rt<<1 #define rson m+1,r,rt<<1|1 #define max(a,b) a>b?a:b typedef long long ll; typedef unsigned long long ull; const double eps = 1e-9; const int maxn = 1e6; const int maxm = 1e6+10; using namespace std; inline int read(){ int x(0),f(1); char ch=getchar(); while (ch<'0'||ch>'9') {if (ch=='-') f=-1;ch=getchar();} while (ch>='0'&&ch<='9') x=x*10+ch-'0',ch=getchar(); return x*f; } int wa[maxn]; int wb[maxn]; int wn[maxn]; int wm[maxn]; int rk[maxn]; int height[maxn]; int cmp(int *r,int a,int b,int l){ return r[a]==r[b]&&r[a+l]==r[b+l]; } void da(int *r,int *sa,int n,int m){ int i,j,*x=wa,*y=wb,*t,p; for(i=0;i<m;++i) wn[i]=0; for(i=0;i<n;++i) wn[x[i]=r[i]]++; for(i=1;i<m;++i) wn[i]+=wn[i-1]; for(i=n-1;i>=0;--i) sa[--wn[x[i]]]=i; for(j=1,p=1;p<n;j<<=1,m=p){ for(p=0,i=n-j;i<n;++i) y[p++]=i; for(i=0;i<n;++i){ if(sa[i]>=j){ y[p++]=sa[i]-j; } } 计数排序O(n),m过大可用快排 for(i=0;i<n;i++) wm[i]=x[y[i]]; for(i=0;i<m;i++) wn[i]=0; for(i=0;i<n;i++) wn[wm[i]]++; for(i=1;i<m;i++) wn[i]+=wn[i-1]; for(i=n-1;i>=0;i--) sa[--wn[wm[i]]]=y[i]; for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1;i<n;i++) x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++; } } void getHeight(int *r,int *sa,int n){ int i,j,k=0; for(i=1;i<=n;++i){ rk[sa[i]]=i; } for(i=0;i<n;height[rk[i++]]=k){ for(k?k--:0,j=sa[rk[i]-1];r[i+k]==r[j+k];k++); } } //主要为了方便后面求height[]的操作。避免这句中rank[i]-1出现为负数的情况 int main() { fin; string str; cin>>str; int r[maxn]; int n=str.size(); int m=30; for(int i=0;i<str.size();++i){ r[i]=str[i]-'a'+1; } r[str.size()]=0; int sa[maxn]; da(r,sa,n+1,m); for(int i=0;i<n;++i){ printf("%d ",sa[i]); } cout<<endl; getHeight(r,sa,n); for(int i=0;i<n;++i){ printf("%d ",rk[i]); } cout<<endl; for(int i=0;i<n;++i){ printf("%d ",height[i]); } cout<<endl; return 0; } //height 数组:定义height[i]=suffix(SA[i-1])和suffix(SA[i])的最长公共前缀,也就是排名相邻的两个后缀的最长公共前缀的长度 。 // /*sa[1~~n]为有效值 sa[i]=a则代表排在第i位的是第a个后缀。 a属于[0~n-1] rank[0~n-1]是有效值 rank[i]=b则代表第i个后缀排在第b位 b属于[1~n] height[2~n]是有效值 height[i]=c则代表排在第i位的后缀和排在第i-1的后缀的最长前缀长度是c */