备案控制台

开发者社区

开发者社区> 问答> 正文

kmp算法的基本思想

kmp算法的基本思想

展开

收起

知与谁同 2018-07-22 13:02:41 2511 0

2 条回答

写回答

取消提交回答

知与谁同

你nupt的。 563819740,男仔囡幼

2019-07-17 22:55:51

赞同展开评论打赏
玄学酱

这个时候，玄酱是不是应该说点什么...

主串：a b a c a a b a c a b a c a b a a b b，下文中我们称作T
模式串：a b a c a b，下文中我们称作W
在暴力字符串匹配过程中，我们会从T[0] 跟 W[0] 匹配，如果相等则匹配下一个字符，直到出现不相等的情况，此时我们会简单的丢弃前面的匹配信息，然后从T[1] 跟 W[0]匹配，循环进行，直到主串结束，或者出现匹配的情况。这种简单的丢弃前面的匹配信息，造成了极大的浪费和低下的匹配效率。
然而，在KMP算法中，对于每一个模式串我们会事先计算出模式串的内部匹配信息，在匹配失败时最大的移动模式串，以减少匹配次数。
比如，在简单的一次匹配失败后，我们会想将模式串尽量的右移和主串进行匹配。右移的距离在KMP算法中是如此计算的：在已经匹配的模式串子串中，找出最长的相同的前缀和后缀，然后移动使它们重叠。
在第一次匹配过程中
T: a b a c a a b a c a b a c a b a a b b
W: a b a c ab
在T[5]与W[5]出现了不匹配，而T[0]~T[4]是匹配的，现在T[0]~T[4]就是上文中说的已经匹配的模式串子串，现在移动找出最长的相同的前缀和后缀并使他们重叠：
T: a b a c aab a c a b a c a b a a b b
W: a b a c ab
然后在从上次匹配失败的地方进行匹配，这样就减少了匹配次数，增加了效率。
然而，有些同学可能会问了，每次都要计算最长的相同的前缀会不会反而浪费了时间，对于模式串来说，我们会提前计算出每个匹配失败的位置应该移动的距离，花费的时间是常数时间。比如： j　　012345W[j]　　a　　bacabF(j)00　　1012当W[j]与T[i]不匹配的时候，设置j = F(j-1)
文献中，朱洪对KMP算法作了修改，他修改了KMP算法中的next函数，即求next函数时不但要求W[1,next(j)-1]=W[j-(next(j)-1)，j-1]，而且要求W[next(j)]<>W[j]，他记修改后的next函数为newnext。显然在模式串字符重复高的情况下，朱洪的KMP算法比KMP算法更加有效。
以下给出朱洪的改进KMP算法和next函数和newnext函数的计算算法。

2019-07-17 22:55:51

赞同展开评论打赏

问答分类：

算法

问答标签：

算法kmp

问答地址：

开发者社区 > 人工智能 > 问答

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

相关问答

[@徐雷frank][¥20]KMP算法

3119

1

0

c++里的string的find（）函数和KMP算法相比哪个效率更高

5804

1

0

为什么KMP算法中n-next的前缀为最小覆盖子串

1479

1

0

kmp算法的next函数及其修正值怎么求

2924

1

0

kmp算法要注意什么

1601

1

0

在编程中经常用到的知识点，比如kmp算法，qsort快速排序。等等。这样帮忙列举一下

1607

1

0

设主串长度为，模式串长度为，则串匹配的KMP算法的时间复杂度为 ?

2081

1

0

kmp算法的最大特点是指示主串的指针不需要回溯 A.正确 B.错误

5517

1

0

数据结构中串模拟匹配中的KMP算法能用简单通俗的话解释一下吗？谢谢啦！

1643

1

0

数据结构中 KMP算法应该怎样理解

1610

1

0

问答排行榜

最热

最新

1 通过阿里云代备案系统进行个人快速备案 2699508

2 【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥 1818157

3 据说在家办公的程序员是这样写代码的？ 1792074

4 阿里云开放端口权限 689772

5 《阿里云服务器从入门到精通》—论坛精华帖汇总（2013.8.21更新） 599345

6 如何升级配置 536010

7 【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？ 522286

8 【精品问答】python技术1000问(1) 513932

9 Flink Forward Asia 2021 有奖问答 512759

10 Linux Bash严重漏洞修复紧急通知（已全部给出最终修复方案） 456880

11 工信部官网：www.miitbeian.gov.cn打不开解决办法 399443

12 OceanBase 使用动画（持续更新） 359219

13 阿里云LNAMP(Linux + Nginx + Apache + MySQL + PHP)环境一键安装脚本 329678

14 OSS存储服务-客户端工具 321208

15 为体验实验室取一个新名字。 307146

16 企业邮箱发送邮件时，若出现投递失败产生退信，内容提示包含如下： the mta server of * reply:550 failed to meet SPF requirements 或者 the mta server of 163.com — 163mx01.mxmail.netease.com(220.181.14.141) reply:550 MI:SPF mx14,QMCowECpA0qTiftVaeB3Cg—.872S2 1442548128 http://mail.163.com/help 303631

17 Win Server 2003-2016 加密勒索事件必打补丁合集 295087

18 FLASH播放器，在IE浏览器下显示请确定您的域名已完成备案和CNAME绑定 283420

19 安全组详解，新手必看教程 277220

20 写code还是做管理，开发者如何进行职业规划？ 268217

1 在做程序员的道路上，你掌握了什么关键的概念或技术让你感到自身技能有了显著飞跃？ 1230

2 作为一个经典架构模式，事件驱动在云时代为什么会再次流行呢？ 981

3 宜搭：提交表单前，如何校验另一张表单的数据？ 185

4 如何看待首个 AI 程序员入职科技公司？ 1830

5 未启用对服务器的访问 491

6 在图像处理应用场景下，Serverless架构的优势体现在哪些方面？ 1467

7 如何处理线程死循环？ 2009

8 宜搭自定义页面，这个是怎么配置的 158

9 Idea 2024.1RC 报错提示 145

10 如何写出更优雅的并行程序？ 1628

11 你认为一个优秀的技术PM应该具备什么样的能力？ 2084

12 宜搭页面复制问题 333

13 宜搭审批节点调用连接器给表单组件赋值 125

14 宜搭在自定义页面保存数据新建表单后如何返回新建表单formInstId值 112

15 Nacos配置了鉴权登录接口返回caused:这个有谁清楚吗？ 128

16 从哪个版本开始nacos分成了两个端口？8848和9848 111

17 钉钉宜搭中要如何实现每日定时自动获取表单1中符合条件的实例数量总和，并赋值给表单2中的某个组件 317

18 宜搭官方的视频板块，图片上是怎么加文字样式的。 165

19 宜搭官方的这种页面是怎么实现的。 217

20 宜搭自定义页面，如何实现这种样式的文字。 115

相关课程

更多

相册服务中的故事生成算法介绍

31

1

去学习

Go语言核心编程 - 数据结构和算法

1657

47

去学习

神经网络概览及算法详解

801

36

去学习

推荐问答

乘风问答官招募中！机械键盘免费拿

相关电子书

更多

数据+算法定义新世界 立即下载

袋鼠云基于实时计算的反黄牛算法 立即下载

Alink：基于Apache Flink的算法平台 立即下载

相关实验场景

更多