KMP算法

1,什么是kmp算法

kmp算法是一种改进的字符串匹配算法,由D.E.Knuth,J.H.Morris和V.R.Pratt同时发现,因此人们称它为克努特——莫里斯——普拉特操作(简称KMP算法)。简而言之就是在一串字符串中找寻一串子串。

基本思想:

设主串后面用m表示(长度为m):a b a c a a b a c a b a c a b a a b b

模式串后面用n表示(长度为n):  a b a c a b

如过使用暴力算法匹配模式串在主串的位置,则先是是m[0],n[0]对比,一样下表就同时往后移一位,继续对比,如果不一样,此时m从第二位开始和n进行匹配,继续刚才的操作,直到找到为止,这种方式极大的降低匹配效率,时间复杂度为O(mn)。

kmp算法就是为了在比较中让模式串尽量右移,从而达到提高效率效果。假设m是个char[],n也是,m[i]和n[j]进行比较,如上图,前面五位都相同,第6位开始出现差异。此时我们就要向右移动n,那么要向右移动几位呢。我们看mn前面5位都是相同的,a b a c a 的前缀和后缀只有一个a是相同的。对应的m中前面五位也只有一个长度为一的前缀和后缀a,

所以我们将n整体右移到m[4]的位置,变成

a b a c a a b a c a b a c a b a a b b

            a b a c a b

当比较到第二位又出现不等的情况,此时的n右移一位就行比较,此时已经在m中找到了n所在的位置,然后将a的下表返回。这就是大概思路,这样比较我们只进行3次比对,就出了结果。时间复杂度为O(m+n)。

a b a c a a b a c a b a c a b a a b b

               a b a c a b

现在我们来看看n的移动规则怎么来的,其实就找abacab中每一位到前缀中存在的最大长度的相等的前后缀,分析一下

a b a c a b

用一个next[]来保存计算出的值,n[0]本来就是前缀,所以为next[0]=0,n[0],n[1]对比不相等,所以n[1]b的相同的前缀也为0,next[1]=0,然后n[0]和n[2]对比相同,所以next[2]就是n[0]在next[]中对应的下标next[0]+1,所以next[2]=1;此时n[0]就不需要在和后面对比,从第二位n[1]=b开始接着对比,n[1]和n[3]进行对比,不相等,此时代表ab和ac不相等了,所以我们的下标又要回退到n[1]的前一位也就是n[0]在next[]数组中所对应的值,所以现在是n[0]和n[3]进行对比ac不等,此时n[0]已经不能往前移动,所以n[3]对应的next[3]值为0,然后n[0]继续对比n[4],aa相等,根据上面的分析得出next[4]=0+1(前缀a的下标加一),前后a相等已经找到所以开始对比n[1]和n[5]为bb相等,所以next[5]=1+1(前缀b的下标加一),最后得到next={0,0,1,0,1,2},在一次说明2的含义,就是存在一个长度为2相等的前后缀,这里就是ab;

代码如图


目标串 a b a c a a b a c a b a c a b a a b b

模式串 a b a c a b

next值 0 0 1 0 1 2 

第六位ab不等,b的前一位a的next值为1

目标串 a b a c a a b a c a b a c a b a a b b

模式串             a a c a b

此时m[5]!=n[1],重复

以上步骤,b的前一位a的next值为0,继续右移,最后相等,返回a的坐标,这就是kmp算法了

目标串 a b a c a b a c a b a c a b a a b b

模式串                a a c a b


©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 151,511评论 1 330
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 64,495评论 1 273
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 101,595评论 0 225
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 42,558评论 0 190
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 50,715评论 3 270
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 39,672评论 1 192
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,112评论 2 291
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 29,837评论 0 181
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 33,417评论 0 228
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 29,928评论 2 232
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 31,316评论 1 242
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 27,773评论 2 234
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 32,253评论 3 220
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 25,827评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,440评论 0 180
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 34,523评论 2 249
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 34,583评论 2 249

推荐阅读更多精彩内容

  • 说明 KMP算法看懂了觉得特别简单,思路很简单,看不懂之前,查各种资料,看的稀里糊涂,即使网上最简单的解释,依然看...
    半世浮华一生留恋阅读 494评论 0 0
  • 数据结构 第8讲 KMP算法 讲这个算法之前,我们首先了解几个概念: 串:又称字符串,是由零个或多个字符组成的有限...
    rainchxy阅读 1,197评论 0 3
  • 数据结构与算法--KMP算法查找子字符串 部分内容和图片来自这三篇文章: 这篇文章、这篇文章、还有这篇他们写得非常...
    sunhaiyu阅读 1,670评论 1 21
  • 专业考题类型管理运行工作负责人一般作业考题内容选项A选项B选项C选项D选项E选项F正确答案 变电单选GYSZ本规程...
    小白兔去钓鱼阅读 8,887评论 0 13
  • 风淡淡吹来你的消息 寂寞的我在下午等待 时间越近我越是快乐 远处响起你的脚步 我忽然慌乱坐立难安 不知道给你什么表...
    彩虹雪阅读 178评论 0 0