KMP算法失配处理

2024-02-17 21:44
文章标签 算法 处理 kmp 失配

本文主要是介绍KMP算法失配处理,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

已知字符串s为“abaabaabacacaabaabcc”,模式串T为“abaabc”。采用KMP算法进行匹配,第一次出现“失配”(s[i]≠t[j])时,i=j=5,则下次开始匹配时i和j的值分别是(       )

A.i=1,j=0

B.i=5,j=0

C.i=5,j=2

D.i=6,j=2

解这道题前,首先要了解什么是KMP算法?

  1. KMP算法是三位学者提出来的,全称是克努特D.E.Knuth—莫里斯J.H.Morris—普拉特V.R.Pratt操作,是一种根据BF算法改进的字符串的模式匹配算法。
    1. 模式匹配就是在主串中寻找一个给定的模式,返回主串和模式串匹配的第一个子串的首字符位置。通常主串比较大,而模式串则比较短小。
  2. 所以如果要了解什么是KMP算法,需要先了解什么是BF算法。
    1. BF算法(Brute Force算法)
      1. 也就是我们经常说的暴力算法。
      2. 基本思想:
        1. 就是将主串S的第一个字符与模式串T的第一个字符字符字符进行匹配,
          1. 若相等,则继续比较S的第二个字符和T的第二个字符;
          2. 若不相等,则比较S的第二个字符和T的第一个字符;
          3. 依次比较下去,直到得出最后的匹配结果。
        2. 【换句话就是在模式串中有多个字符和主串中的若干个连续字符比较都相等,但最后一个字符比较不相等时,主串的比较位置需要回退
    2. 而KMP算法在上述情况下,通过一个本身包含了模式串的局部匹配信息的next()函数,利用匹配失败后的信息,尽量减少模式串与主串的匹配次数以达到快速匹配的目的,即主串位置不需要回退【或者理解为求得模式的特征向量之后,在每次匹配过程中发生某次失配时,不再单纯地把模式后移一位,而是根据当前字符的特征数来决定模式右移的位数(右移的距离是由模式串T本身决定的,即T的子串t[0...j-1]中的前缀串和后缀串相等的最长长度)】,这样就可以大大提高效率,这就是KMP算法。

回到题目:

已知字符串s为“abaabaabacacaabaabcc”,模式串T为“abaabc”。采用KMP算法进行匹配,第一次出现“失配”(s[i]≠t[j])时,i=j=5,则下次开始匹配时i和j的值分别是(       )

A.i=1,j=0

B.i=5,j=0

C.i=5,j=2

D.i=6,j=2

根据上面讲到的知识:

KMP算法在发生某次失配(s[i]≠t[j])时,i会保持不变,而对于j,

KMP算法由于不再单纯地把模式后移一位,而是根据当前字符的特征数来决定模式右移的位数(右移的距离是由模式串T本身决定的,即T的子串t[0...j-1]中的前缀串和后缀串相等的最长长度),故j会根据上面的方法回退到next的位置并重新比较

本题中讲到字符串s为“abaabaabacacaabaabcc”,模式串T为“abaabc”,

又因为模式串T的子串称为子串t,

第一次失配时i=5,则子串t为“abaab”,

序号0123456

主串s

“abaabaabacacaabaabcc”

abaaba...
【此处模式串T主串s发生失配】

模式串T

“abaabc”

abaabc
子串tabaab

故在这个子串t里面即“abaab”这5个字符中相等且最长的前后缀为“ab”,即“abaab”,

即T的子串t[0...j-1]中的前缀串和后缀串相等的最长长度j=2,代表右移了2位,

故下次开始匹配时i不变为5,j为2,

故选C。


 

这篇关于KMP算法失配处理的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/719069

相关文章

Python调用LibreOffice处理自动化文档的完整指南

《Python调用LibreOffice处理自动化文档的完整指南》在数字化转型的浪潮中,文档处理自动化已成为提升效率的关键,LibreOffice作为开源办公软件的佼佼者,其命令行功能结合Python... 目录引言一、环境搭建:三步构建自动化基石1. 安装LibreOffice与python2. 验证安装

Java使用Thumbnailator库实现图片处理与压缩功能

《Java使用Thumbnailator库实现图片处理与压缩功能》Thumbnailator是高性能Java图像处理库,支持缩放、旋转、水印添加、裁剪及格式转换,提供易用API和性能优化,适合Web应... 目录1. 图片处理库Thumbnailator介绍2. 基本和指定大小图片缩放功能2.1 图片缩放的

Python进行JSON和Excel文件转换处理指南

《Python进行JSON和Excel文件转换处理指南》在数据交换与系统集成中,JSON与Excel是两种极为常见的数据格式,本文将介绍如何使用Python实现将JSON转换为格式化的Excel文件,... 目录将 jsON 导入为格式化 Excel将 Excel 导出为结构化 JSON处理嵌套 JSON:

Spring Boot 中的默认异常处理机制及执行流程

《SpringBoot中的默认异常处理机制及执行流程》SpringBoot内置BasicErrorController,自动处理异常并生成HTML/JSON响应,支持自定义错误路径、配置及扩展,如... 目录Spring Boot 异常处理机制详解默认错误页面功能自动异常转换机制错误属性配置选项默认错误处理

SpringBoot 异常处理/自定义格式校验的问题实例详解

《SpringBoot异常处理/自定义格式校验的问题实例详解》文章探讨SpringBoot中自定义注解校验问题,区分参数级与类级约束触发的异常类型,建议通过@RestControllerAdvice... 目录1. 问题简要描述2. 异常触发1) 参数级别约束2) 类级别约束3. 异常处理1) 字段级别约束

Java堆转储文件之1.6G大文件处理完整指南

《Java堆转储文件之1.6G大文件处理完整指南》堆转储文件是优化、分析内存消耗的重要工具,:本文主要介绍Java堆转储文件之1.6G大文件处理的相关资料,文中通过代码介绍的非常详细,需要的朋友可... 目录前言文件为什么这么大?如何处理这个文件?分析文件内容(推荐)删除文件(如果不需要)查看错误来源如何避

使用Python构建一个高效的日志处理系统

《使用Python构建一个高效的日志处理系统》这篇文章主要为大家详细讲解了如何使用Python开发一个专业的日志分析工具,能够自动化处理、分析和可视化各类日志文件,大幅提升运维效率,需要的可以了解下... 目录环境准备工具功能概述完整代码实现代码深度解析1. 类设计与初始化2. 日志解析核心逻辑3. 文件处

Java docx4j高效处理Word文档的实战指南

《Javadocx4j高效处理Word文档的实战指南》对于需要在Java应用程序中生成、修改或处理Word文档的开发者来说,docx4j是一个强大而专业的选择,下面我们就来看看docx4j的具体使用... 目录引言一、环境准备与基础配置1.1 Maven依赖配置1.2 初始化测试类二、增强版文档操作示例2.

MyBatis-Plus通用中等、大量数据分批查询和处理方法

《MyBatis-Plus通用中等、大量数据分批查询和处理方法》文章介绍MyBatis-Plus分页查询处理,通过函数式接口与Lambda表达式实现通用逻辑,方法抽象但功能强大,建议扩展分批处理及流式... 目录函数式接口获取分页数据接口数据处理接口通用逻辑工具类使用方法简单查询自定义查询方法总结函数式接口

SpringBoot结合Docker进行容器化处理指南

《SpringBoot结合Docker进行容器化处理指南》在当今快速发展的软件工程领域,SpringBoot和Docker已经成为现代Java开发者的必备工具,本文将深入讲解如何将一个SpringBo... 目录前言一、为什么选择 Spring Bootjavascript + docker1. 快速部署与