首页 / 算法 / 简单易懂的KMP算法理解

简单易懂的KMP算法理解

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了简单易懂的KMP算法理解，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含3557字，纯文字阅读大概需要6分钟。

内容图文

KMP算法是由三大佬研发出来的用于匹配字符串的算法。

解决在一个大串中找与模板串相同的子串。

解决上诉问题，有一个简单且好理解的方式：

将大串前(M-N+1)个字符(M代表大串长度，N代表模板串的长度)依次与模板串的第一个字符比较，不匹配则大串当前比较的字符不是模板串的第一个字符则需要匹配下一个大串字符，若匹配，则大串当前比较的字符是模板串的第一个字符则需要将大串当前字符的下一个字符和模板串的下一个字符进行比较，依次类推，直到匹配全找到子串或者找不到。

这样的方法优点是简单好实现，但是显然会花费许多时间，举一个最坏情况下的例子:

大串:aaaaaaaaaaaaaaaaaaaab

模板串:aaaaab;

这个例子在最后一次匹配才成功找到，而前面的每次匹配都将模板串的每个字符都遍历了一次，如果大串长度M，模板串长度N，那么花费的时间共为O((M-N+1)*N);数量级可看成为二次方级的。在数据量稍微大些的情况下会很慢。

KMP算法便是用来解决这种缺点的。

KMP算法关键之处其实就是记录模板串中的前缀子串中的相同的最长前、后缀的长度。这样如果模板串中途匹配失败后，模板串匹配大串后移将不只是一位。而是移动直至匹配失败前的前缀子串(这里用x代替)中的前缀和其(x)后缀重叠，这样移动的位数为两相同的前后缀位置差。如果这样做是正确的，不就是节省了一些时间吗？那么接下来就解释下为什么这样做是正确的：

如果一个长度为N模板串配成功后，向后移动n位前N-n位依然能匹配对，那么会有什么性质？从第一次匹配最后一个字符往前算起长度N-n的子串是什么？其实就是模板长度为N-n的前后缀(因为两次都与大串匹配对了，这两个前后缀显然是相等的)。反过来说，若是一个模板串有多组相等的前后缀，如有三组长度分别为N-n1,N-n2,N-n3，那么模板串匹配成功后向后分别移n1,n2,n3个位置后依然有N-n1,N-n2,N-n3位能全匹配。

把这个应用到模板串匹配失败时候的处理：将匹配失败前的前缀子串(x)看成上述讲的成功匹配的小模板串,这个模板串可以根据已有的（如果有)相同前后缀的长度移动，为保证不漏匹配，只需要取最长前后缀(这样可以使得移动最小)的长度决定移动位数，即可保证这种匹配方法的正确性。

上述便是KMP的一个重点所在。

还有一个重点便是如何比较快的找到模板串前缀子串中的相同最大前后缀。这个也是KMP的难点：

事实上，如果模板串很长的话，要找到它的最长相同前后缀其实也不省事。若模板串短显然就容易了，那么不妨找个几个例子看看短模板串前后缀：

abca

显然最长前后缀为a

abcab

最长前后缀为ab

abcabc

最长前后缀为abc

上面三个例子中的下两个是由第一个例子增加一个字符扩展而成的，这样做的目的是展示一种情况：如果一个字符串最长相同前后缀(这里用cnext[n-1],n-1代表前缀最后一个字符的数组下标)长度为n，那么该字符串增加一个字符后最大前后缀最长上限是n+1。而达到这个上限的条件是增加的字符和原字符串的cnext[n-1]的下一个字符相同，这种匹配成功的情况下便是只匹配一次字符就可以得出最大前后缀的长度。但事实上更多情况是匹配失败，如果匹配失败该怎么做？举一个例子：

abacabab

abacaba这个最长相同前后缀为aba

之后加了一个b之后我们会匹配aba后面的c是否与b匹配，这个时候不匹配，显然最长相同前后缀已经不可能有比aba长了，既然如此，我们是否可以把abacabab看成abab呢？答案是可以的，为什么呢，因为现在最长相同前后缀只能在abacabab中的小于等于3长度的(aba的长度)后缀(bab)中找最大后缀（这里用cnext[7]代替），而abab后缀集合一定包含cnext[7];那么我们在新增字符不匹配的情况下就可以将abacabab看成abab去找其最长相同前后缀，以此类推直到找到最长相同前后缀或者找不到为止。

模拟下剩下的步骤：这个时候abab中的aba最长相同前后缀为a，将b与前缀a后面的b比较，相同，则abab最长相同前后缀为ab。

KMP算法是用一个和模板串相同长度的数组next[]保存每个模板串前缀中的最长相同前后缀的长度（next[n-1]的值是长度为n的前缀子串对应的最长相同前后缀的长度)，下面给出求next[]的代码：

void makeNext(const char P[],int next[])

{

int len= strlen(P);

next[0] = 0;

for (int q = 1,k = 0; q < len; ++q)

{

while(k > 0 && P[q] != P[k])

k = next[k-1];

if (P[q] == P[k])

{

k++;

}

next[q] = k;

}

内容总结

以上是互联网集市为您收集整理的简单易懂的KMP算法理解全部内容，希望文章能够帮你解决简单易懂的KMP算法理解所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/736935.html

来源：【匿名】

【上一篇】设计一个算法将一个顺序表逆置【下一篇】浅谈php实现映射的两种方法（链表和二叉树）

更多 ►

【简单易懂的KMP算法理解】教程文章相关的互联网学习教程文章

[转] 字符串匹配的KMP算法【图】

字符串匹配是计算机的基本任务之一。　　举例来说，有一个字符串"BBC ABCDAB ABCDABCDABDE"，我想知道，里面是否包含另一个字符串"ABCDABD"？　　许多算法可以完成这个任务，Knuth-Morris-Pratt算法（简称KMP）是最常用的之一。它以三个发明者命名，起头的那个K就是著名科学家Donald Knuth。　　这种算法不太容易理解，网上有很多解释，但读起来都很费劲。直到读到Jake Boxer的文章，我才真正理解这种算法。下面，我用自己的语言，...

70. Implement strStr() 与 KMP算法【代码】

Implement strStr()Implement strStr().Returns a pointer to the first occurrence of needle in haystack, or null if needle is not part of haystack.MY: Question.思路：逐步查找。当出现不同时，如何回溯是关键。Solution A:class Solution { public:char *strStr(char *haystack, char *needle) {int i = 0, j = 0;while(haystack[i] != ‘\0‘ && needle[j] != ‘\0‘) {if(haystack[i] == needle[j])++i, ++j;else i = i...

kmp算法原理与应用（简单易懂)【图】

原文：https://www.cnblogs.com/linruier/p/9726788.html

KMP 算法【图】

作者: 阮一峰发布时间: 2013-08-28 17:12 阅读: 82411 次推荐: 159 原文链接 [收藏] 字符串匹配是计算机的基本任务之一。　　举例来说，有一个字符串"BBC ABCDAB ABCDABCDABDE"，我想知道，里面是否包含另一个字符串"ABCDABD"？　　许多算法可以完成这个任务，Knuth-Morris-Pratt算法（简称KMP）是最常用的之一。它以三个发明者命名，起头的那个K就是著名科学家Donald Knuth。　　这种算法不太容易理解，网上有很多解释，...

KMP算法板子【代码】【图】

luogu P3375 【模板】KMP字符串匹配题目描述如题，给出两个字符串s1和s2，其中s2为s1的子串，求出s2在s1中所有出现的位置。为了减少骗分的情况，接下来还要输出子串的前缀数组next。（如果你不知道这是什么意思也不要问，去百度搜[kmp算法]学习一下就知道了。）输入输出格式输入格式：第一行为一个字符串，即为s1（仅包含大写字母）第二行为一个字符串，即为s2（仅包含大写字母）输出格式：若干行，每行包含一个整数，表示s2在...

KMP算法(1)-理论【图】

今天刷leetcode，发现28-实现strStr()这道题，可以使用KMP算法实现，所以去百度了一翻，做个记录。KMP算法简介：是一种改进的字符串匹配算法。核心思想：通过匹配失败后的信息，尽量减少模式串与主串的匹配次数来达到快速匹配的目的。leetcode题目：给定一个 haystack 字符串和一个 needle 字符串，在 haystack 字符串中找出 needle 字符串出现的第一个位置 (从0开始)。如果不存在，则返回 -1。1.自己写的算法：假设 haystack 为 ...

杭电2549（第一次用java写kmp算法）【代码】

点击打开杭电2549Problem DescriptionHomer: Marge, I just figured out a way to discover some of the talents we weren’t aware we had. Marge: Yeah, what is it? Homer: Take me for example. I want to find out if I have a talent in politics, OK? Marge: OK. Homer: So I take some politician’s name, say Clinton, and try to find the length of the longest prefix in Clinton’s name that is a suffix in my nam...

KMP算法【图】

1 // 根据算法引论一书中的说明写的程序 2 #include <stdio.h> 3 #include <string> 4 #define MAX_N 1000 5 using std::string; 6 7 int next[MAX_N]; 8 9 void generate_next(const string& pattern) {10 next[0] = -1;11 for(int i = 1; i < pattern.length(); ++i) {12 int j = next[i-1];13 while (j >= 0 && pattern[j] != pattern[i-1])14 j = next[j];15 16 // either patt...

UVALive 3026 Period （KMP算法简介）【代码】【图】

kmp的代码很短，但是不太容易理解，还是先说明一下这个算法过程吧。朴素的字符串匹配大家都懂，但是效率不高，原因在哪里？匹配过程没有充分利用已经匹配好的模版的信息，比如说，i是文本串当前字符的下标，j是要匹配的模版串当前正在匹配的字符的下标。（下标都从零开始）当匹配到i = 4， j = 4的时候失配了，朴素的匹配做法是往右边移一位然后从j开始扫，这样做效率很低。不难发现前面已经匹配好的串ab是相同的最大前缀后缀。把串...

KMP算法【代码】

输入第一行一个整数N，表示测试数据组数。接下来的N*2行，每两行表示一个测试数据。在每一个测试数据中，第一行为模式串，由不超过10^4个大写字母组成，第二行为原串，由不超过10^6个大写字母组成。其中N<=20输出对于每一个测试数据，按照它们在输入中出现的顺序输出一行Ans，表示模式串在原串中出现的次数。样例输入5 HA HAHAHA WQN WQN ADA ADADADA BABABB BABABABABABABABABB DAD ADDAADAADDAAADAAD样例输出3 1 3 1 0 1 #includ...

KMP算法心得【代码】

今天又看了一遍KMP,感觉真的懂了...就来这儿发一下心得吧.KMP算法其实就是暴力的改进版.让我们看看暴力的匹配.Original string: ababababcbbababababc Pattern string: abababc步骤:ababababcbbababababc abababc....中间一些步骤ababababcbbababababcabababc这里a和c匹配不了了,传统的作法会从第二个字符`b‘开始匹配.明显不行又跳出.即:ababababcbbababababca...再从第三个字符`a‘开始:ababababc...abababc现在匹配了.继续重复...

HDU 3613 Best Reward（拓展KMP算法求解）【代码】

题目链接：https://cn.vjudge.net/problem/HDU-3613 After an uphill battle, General Li won a great victory. Now the head of state decide to reward him with honor and treasures for his great exploit. One of these treasures is a necklace made up of 26 different kinds of gemstones, and the length of the necklace is n. (That is to say: n gemstones are stringed together to constitute this necklace, and ...

神奇的字符串匹配：扩展KMP算法【代码】【图】

引言一个算是冷门的算法（在竞赛上），不过其算法思想值得深究。前置知识kmp的算法思想，具体可以参考 → Click heretrie树（字典树）。正文问题定义：给定两个字符串 S 和 T（长度分别为 n 和 m），下标从 0 开始，定义 extend[i] 等于 S[i]...S[n-1] 与 T 的最长相同前缀的长度，求出所有的 extend[i]。举个例子，看下表：i01234567SaaaaabbbTaaaaacextend[i]54321000为什么说这是 KMP 算法的扩展呢？显然，如果在 S 的若干个位置...

KMP算法具体解释(转)【图】

作者：July。出处：http://blog.csdn.net/v_JULY_v/。引记此前一天，一位MS的朋友邀我一起去与他讨论高速排序，红黑树，字典树，B树、后缀树，包含KMP算法，只有在解说KMP算法的时候，言语磕磕碰碰，我想，原因有二：1、博客内的东西不常回想，忘了不少；2、便是我对KMP算法的理解还不够彻底，自不用说解说自如，运用自如了。所以，特再写本篇文章。因为此前，个人已经写过关于KMP算法的两篇文章，所以，本文名为：KMP算法之总...

kmp算法【代码】

1/* 核心代码 */ 2 3 4 5 #include<iostream>6 #include<string>7 8usingnamespace std;9constint N=100005; 1011void getNext(string p,int *next) 12{ 13int j,k; 14 next[0]=-1; 15 j=0; 16 k=-1; 17while(j<p.length()-1) 18 { 19if(k==-1||p[j]==p[k]) //匹配的情况下,p[j]==p[k]20 { 21 j++; 22 k++; 23 next[j]=k; 24 } 25else/...

算法 - 最热教程

浅谈SQLServer查询优化器中的JOIN算法有没那种可逆算法是密文比明文短的呢？...javascript-类似Excel里面的NORMDIST函...C++中的分治算法及常见题目汇总压缩感知重构算法综述-学习笔记 c++中内置函数qsort（快速排序）和bsea...一、fpga图像处理算法整合基于遗传算法（deap）的非线性函数寻优...集成学习-Bagging集成学习算法随机森林...机器学习笔记（九）聚类算法及实践（K-...

首页 / 算法 / 简单易懂的KMP算法理解

简单易懂的KMP算法理解

内容导读

内容图文

内容总结

内容备注

内容手机端

【简单易懂的KMP算法理解】教程文章相关的互联网学习教程文章

[转] 字符串匹配的KMP算法【图】

70. Implement strStr() 与 KMP算法【代码】

kmp算法原理与应用（简单易懂)【图】

KMP 算法【图】

KMP算法板子【代码】【图】

KMP算法(1)-理论【图】

杭电2549（第一次用java写kmp算法）【代码】

KMP算法【图】

UVALive 3026 Period （KMP算法简介）【代码】【图】

KMP算法【代码】

KMP算法心得【代码】

HDU 3613 Best Reward（拓展KMP算法求解）【代码】

神奇的字符串匹配：扩展KMP算法【代码】【图】

KMP算法具体解释(转)【图】

kmp算法【代码】

算法 - 相关标签

算法 - 最新教程

算法 - 最热教程