后缀自动机

2019-10-04 约 868 字预计阅读 2 分钟次阅读

如你所见，后缀自动机。

然而就nm看不懂，先看不懂它的图是啥，又看不懂它的边是啥，现在还是看不懂它的边是咋找出来的。可是咱不想搞不清楚它是干嘛的就直接用啊靠。

后缀自动机首先是自动机。一个字符串S的后缀自动机能接受S的所有后缀。基于它的这个性质，它能够做到：

建立

最暴力的方式是建立一个O(n^2)级别的自动机，不过那个复杂度就没什么意义了。后缀自动机需要满足状态数最少，为线性级别，且转移（边）也为线性级别。

然后，我们可以开始折腾了。

定义串S的$endpos(x)$为一个集合，元素为x在其内出现的所有位置的结尾下标。

对SAM中所有状态预处理firstpos（第一次出现该状态的末端位置，也就是endpos集合的最小元素）。

扩展源函数为sam_extend()。创建新状态cur时，令

$$ firstpos(cur)=len(cur)-1 $$

当q复制到clone时，令

$$ firstpos(clone)=firstpos(q) $$

需要的答案就是$firstpos(t)-|P|+1$，$t$为字符串$P$的状态。每次查询需要$O(|P|)$

动态规划。

让$d_v$为节点$v$的答案。如果不存在使用字符集中至少一个字符的转移，那么$d_v=1$，否则

$$ d_v=1+\min_{w:(v,w,c) \in SAM} d_w $$

字符串可以由转移推回去。