KMP算法详解+模板

cervusy 2021-08-21 原文

KMP算法详解。字符串匹配走一波！

本文大部分摘自szy学长的ppt《string》中的KMP部分。

%%%膜拜szy大神orz

1.概述

KMP 算法是用来解决单模匹配问题的一种算法。

如果暴力的进行单模匹配，那么时间复杂度为O(nm)。

KMP 算法通过对模式串的预处理优化了复杂度。

2.求next数组

为了叙述方便，设模式串长度为n，主串长度为m。

将模式串称为s1，主串称为s2，下标从1 开始。

我们首先对模式串预处理出一个next 数组。

next[i] 表示最大的x，满足s1[1 : x – 1] 是s1[1 : i – 1] 的后缀。

这个数组记录了失配时，模式串指针移动的目标位置。

求next[i] 时，考虑维护一个位置j，初始时为next[i – 1]。

如果s1[j] = s1[i -1]，那么next[i] 显然等于j + 1。

如果s1[j] != s1[i – 1]，那么此时需要将j 向前移动到next[j] 的位置。

一直将j 移动到next[j] 的位置，直到j = 0 或s1[j] = s1[i – 1]。

此时next[i] 等于j + 1。

由于next 是最长公共前后缀，因此在j 的移动过程中一定会经过next[i] – 1 的位置。

 1 void getnx()
 2 {
 3     nx[1]=0;
 4     for(int i=2,j=1;i<=n;)
 5     {
 6         nx[i]=j;
 7         while(j&&s1[j]!=s1[i])j=nx[j];
 8         j++,i++;
 9     }
10 }

3.匹配

在匹配过程中，设在主串中匹配到位置i，模式串中匹配到位置j。

首先如果s2[i] = s1[j]，当前位置匹配成功，此时可以把i 和j 同时移动到下一个位置。

否则发生失配，需要进行调整，我们将j 置为next[j]，然后继续匹配。

同样由于next 是最长公共前后缀，因此在j 的移动过程中不会跳过可能匹配的位置。

并且模式串中j 之前的部分一定可以匹配。

void kmp()
{
    for(int i=1,j=1;i<=m;)
    {
        while(j&&s1[j]!=s2[i])j=nx[j];
        if(j==n)
        {
            // 此时找到了一个能够匹配的位置 
            j=nx[j];
        }
        else j++,i++;
    }
}

可以发现两部分代码有很大相似之处。

其实可以把求next 数组过程看做用模式串与自身匹配的过程。

4.时间复杂度

在求next 的过程中，j 指针每向后移动一步，i 指针就会向后移动一步。

而j 指针每延next 移动一次，就会向前移动大于等于一步。

由于i 指针会向后移动O(n) 次，因此j 指针也只会向后移动O(n) 次，因此向前同样最多移动O(n) 次。

因此求next 数组部分复杂度为O(n)。

与之类似，可以得出匹配过程的复杂度为O(m)。

因此KMP 算法的总复杂度为O(n + m)。

尾声：

总之，KMP算法是处理字符串匹配问题的一大利器。

搭配字符串上的DP可以说是……咳咳……很有趣……

（下篇高能预告）

本文链接：https://www.cnblogs.com/cervusy/p/9481643.html

KMP算法详解+模板的更多相关文章

KMP算法

KMP 算法看了好多没搞懂，然后看了海大的知乎一下子清晰了好多附海大链接首先先理解一下PMT表：现在有一 […]...

kmp算法

...

BP神经网络详解模板

%原始数据输入 P=[93 260.5 -52 -0.07 1.216 3621 139 29 6.142 1 […]...

字符串匹配算法(三)-KMP算法

今天我们来聊一下字符串匹配算法里最著名的算法-KMP算法，KMP算法的全称是 Knuth Morris Pra […]...

算法（Java实现）—— KMP算法

KMP算法应用场景字符串匹配问题有一个字符串str1 = “ hello hello llo hhell […]...

复习—KMP算法

对于KMP算法的学习，在寒假时我还是搞不太明白，但几个月之后，对于它的理解又更近了一步。首先是对于子串的自我 […]...

数据结构与算法（C/C++版）【串】

第四章《串、数组》（一）串数据结构中提到的串，即字符串，由 n 个字符组成的一个整体（ n >= […]...

KMP算法

字符串匹配，给定一个文本串S和一个模式串P，如何找到P在S中的位置？ BF算法（暴力匹配算法）思路：假设文本 […]...

随机推荐

常用模拟开关芯片引脚,功能及应用电路

https://zm12.sm-tc.cn/?src=http%3A%2F%2Fwww.sydzdiy.com […]...

Python爬虫之用脚本登录Github并查看信息

前言分析目标网站的登录方式　　目标地址：https://github.com/login 　　登录方 […]...

Python可以用中文命名

Python中文命名命名规则数字、字母、下划线环境 python 3.7.3 x64 win10 现象 P […]...

披荆斩棘、共赴未来

一、前言在繁忙的工作中不知不觉又迎来了新的一年，2020年这一年是有意义的、有价值的、有收获的。回顾这一年的 […]...

几种常见的树：排序二叉树、平衡二叉树、红黑树、B+树

一、排序二叉树(Binary Sort Tree，BST树) 二叉排序树，又叫二叉搜索树、有序二叉树（orde […]...

微信公众平台注册 – 岚之山

微信公众平台注册微信公众平台是由腾讯公司开发，其宗旨是在移动互联网时代，让企业和个人以更简捷的形式提供服务给 […]...

如何在Nginx不绑定域名下使用SSL/TLS证书?

前提该文主要记录如何在没有购买域名的情况下使用SSL/TLS协议，即地址前面的http变成了https。但是 […]...

统一监控报警平台架构设计思路

https://www.cnblogs.com/sanyuanempire/p/6169533.html […]...