数据结构-KMP 算法(Knuth-Morris-Pratt 字符串查找算法)

2024-03-22 11:10

本文主要是介绍数据结构-KMP 算法(Knuth-Morris-Pratt 字符串查找算法),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1.什么是KMP算法:快速的从一个主串中找出一个你想要的子串

       KMP算法是一种改进的字符串匹配算法。KMP算法的核心是利用匹配失败后的信息,尽量减少模式串与主串的匹配次数以达到快速匹配的目的。具体实现就是通过一个next()函数实现,函数本身包含了模式串的局部匹配信息。KMP算法的时间复杂度O(m+n)。

首先,对于这个问题有一个很单纯的想法:从左到右一个个匹配,如果这个过程中有某个字符不匹配,比较指针就跳回去(比较指针回溯),将模式串向右移动一位。

/*** 暴力破解法* ts 主串* ps 模式串* 如果找到,返回在主串中第一个字符出现的下标,否则为-1*/
public static int bf(String ts, String ps) {int i = 0; // 主串的位置int j = 0; // 模式串的位置while (i < t.length && j < p.length) {if(t[i]==p[j]){//当两个字符相同,就比较下一个i++;j++;} else{i=i-j+1;// 一旦不匹配,i后退j=0;//j归0}}if(j==p.length){return i-j;} else{return -1;}
}

比较指针回溯使算法效率低,而KMP算法可以做到仅仅后移模式串,比较指针不回溯。

2.KMP算法实现过程

当某个字符不匹配时,我们观察发现箭头左边部分,上下字符串模式串和主串是完全匹配的。

模式串左右两端两个字串是完全匹配的,称为模式串的公共前后缀。

KMP核心:直接移动模式串,将公共前缀移动到公共后缀。

因为前后缀是匹配的,可以保证当前比较指针所在的位置左边的串上下匹配,且不会跳过某些匹配的情况。

注意:如果模式串存在多对公共前后缀,我们要取最长公共前后缀。

对于KMP算法只需研究模式串就可以。

3.KMP转化为代码形式(如何构建next数组)

首先把模式串放入数组中,模式串是从数组下标1开始的(根据个人喜好)。模式串的每一位都有可能与主串不匹配。

首先假设若1号位发生不匹配。

1号位与主串下一位比较。

若2号位发生不匹配。

 例题

1.剪花布条

一块花布条,里面有些图案,另有一块直接可用的小饰条,里面也有一些图案。对于给定的花布条和小饰条,计算一下能从花布条中尽可能剪出几块小饰条来呢?

输入格式

输入数据为多组数据,读取到 # 字符时结束。每组数据仅有一行,为由空格分开的花布条和小饰条。花布条和小饰条都是用可见 ASCII 字符表示的,不会超过  个字符。

注意:这个 # 应为单个字符。若某字符串开头有 #,不意味着读入结束!

输出格式

对于每组数据,输出一行一个整数,表示能从花纹布中剪出的最多小饰条个数。

样例

输入

abcde a3
aaaaaa aa
#

输出

0
3

数据范围与提示

对于全部数据,字符串长度<=1000 。

#include<bits/stdc++.h>
using namespace std;
const int maxn=1005;
int n,m,next[maxn];
char s[maxn],t[maxn];//s[]为模式串,t[]为匹配串void getnext(){next[0]=0;for(int i=1;i<n;i++){int j=next[i-1];while(t[j]!=t[i]&&j>0){j=next[j-1];}if(t[j]==t[i]){next[i]=j+1;}else{next[i]=0;}}
} int kmp(){int j=0;int sum=0;for(int i=0;i<m;i++){while(t[j]!=s[i]&&j>0)j=next[j-1];if(t[j]==s[i]) {j++;}if(j>=n){sum++;j=0;}}return sum;
}int main(){while(~scanf("%s",s)){if(s[0]=='#'){break;}scanf("%s",t);m=strlen(s);n=strlen(t);getnext();printf("%d\n",kmp());}return 0;
} 

2.Power Strings

给定若干个长度  的字符串,询问每个字符串最多是由多少个相同的子字符串重复连接而成的。如:ababab 则最多有  个 ab 连接而成。

输入格式

输入若干行,每行有一个字符串。特别的,字符串可能为 . 即一个半角句号,此时输入结束。

样例

输入

abcd
aaaa
ababab
.

输出

1
4
3

数据范围与提示

字符串长度<=1e6 。

#include<bits/stdc++.h>
using namespace std;
const int N=1e6+5;
char a[N];
int p[N],n;
void kmp()
{p[1]=0;int j=0;for(int i=1;i<n;i++){while(j>0&&a[j+1]!=a[i+1]){j=p[j];}if(a[j+1]==a[i+1]){j++;//如果已经相等,则看接下来的字符相不相等,若不相等则返回,说明还没有开始重复;否则接着匹配}p[i+1]=j;//开始时不相等,那么j不自增,继续看之后的串哪个i开始与j匹配}
}
int main()
{while(1){scanf("%s",a+1);if(a[1]=='.'){break;}n=strlen(a+1);kmp();if(n%(n-p[n])==0){printf("%d\n",n/(n-p[n]));} else{printf("%d\n",1);}}return 0;
}

3.Radio Transmission

给你一个字符串,它是由某个字符串不断自我连接形成的。但是这个字符串是不确定的,现在只想知道它的最短长度是多少。

输入格式

第一行给出字符串的长度 ,第二行给出一个字符串,全由小写字母组成。

输出格式

输出最短的长度。

样例

输入

8
cabcabca

输出

3

对于样例,我们可以利用 abc 不断自我连接得到 abcabcabc,读入的 cabcabca 是它的子串。

数据范围与提示

对于全部数据,1<=L<=1e6。

#include <bits/stdc++.h>
using namespace std;
char p[1000005];
int next[1000005],len;
void get_next()
{int i,j;next[0]=j=-1;i=0;while(i<len){while(j!=-1&&p[j]!=p[i]){j=next[j];}  next[++i]=++j;}
}int main()
{int n;cin>>n;scanf("%s",p);len=strlen(p);get_next();
//    for(int i=0;i<len;i++)
//    {
//        cout<<next[i]<<" ";
//    }cout<<n-next[n];return 0;
}

这篇关于数据结构-KMP 算法(Knuth-Morris-Pratt 字符串查找算法)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/835181

相关文章

Java实现将HTML文件与字符串转换为图片

《Java实现将HTML文件与字符串转换为图片》在Java开发中,我们经常会遇到将HTML内容转换为图片的需求,本文小编就来和大家详细讲讲如何使用FreeSpire.DocforJava库来实现这一功... 目录前言核心实现:html 转图片完整代码场景 1:转换本地 HTML 文件为图片场景 2:转换 H

Java使用正则提取字符串中的内容的详细步骤

《Java使用正则提取字符串中的内容的详细步骤》:本文主要介绍Java中使用正则表达式提取字符串内容的方法,通过Pattern和Matcher类实现,涵盖编译正则、查找匹配、分组捕获、数字与邮箱提... 目录1. 基础流程2. 关键方法说明3. 常见场景示例场景1:提取所有数字场景2:提取邮箱地址4. 高级

C#高效实现Word文档内容查找与替换的6种方法

《C#高效实现Word文档内容查找与替换的6种方法》在日常文档处理工作中,尤其是面对大型Word文档时,手动查找、替换文本往往既耗时又容易出错,本文整理了C#查找与替换Word内容的6种方法,大家可以... 目录环境准备方法一:查找文本并替换为新文本方法二:使用正则表达式查找并替换文本方法三:将文本替换为图

redis数据结构之String详解

《redis数据结构之String详解》Redis以String为基础类型,因C字符串效率低、非二进制安全等问题,采用SDS动态字符串实现高效存储,通过RedisObject封装,支持多种编码方式(如... 目录一、为什么Redis选String作为基础类型?二、SDS底层数据结构三、RedisObject

Python中高级文本模式匹配与查找技术指南

《Python中高级文本模式匹配与查找技术指南》文本处理是编程世界的永恒主题,而模式匹配则是文本处理的基石,本文将深度剖析PythonCookbook中的核心匹配技术,并结合实际工程案例展示其应用,希... 目录引言一、基础工具:字符串方法与序列匹配二、正则表达式:模式匹配的瑞士军刀2.1 re模块核心AP

Python 字符串裁切与提取全面且实用的解决方案

《Python字符串裁切与提取全面且实用的解决方案》本文梳理了Python字符串处理方法,涵盖基础切片、split/partition分割、正则匹配及结构化数据解析(如BeautifulSoup、j... 目录python 字符串裁切与提取的完整指南 基础切片方法1. 使用切片操作符[start:end]2

MyBatis的xml中字符串类型判空与非字符串类型判空处理方式(最新整理)

《MyBatis的xml中字符串类型判空与非字符串类型判空处理方式(最新整理)》本文给大家介绍MyBatis的xml中字符串类型判空与非字符串类型判空处理方式,本文给大家介绍的非常详细,对大家的学习或... 目录完整 Hutool 写法版本对比优化为什么status变成Long?为什么 price 没事?怎

MySQL常用字符串函数示例和场景介绍

《MySQL常用字符串函数示例和场景介绍》MySQL提供了丰富的字符串函数帮助我们高效地对字符串进行处理、转换和分析,本文我将全面且深入地介绍MySQL常用的字符串函数,并结合具体示例和场景,帮你熟练... 目录一、字符串函数概述1.1 字符串函数的作用1.2 字符串函数分类二、字符串长度与统计函数2.1

C# $字符串插值的使用

《C#$字符串插值的使用》本文介绍了C#中的字符串插值功能,详细介绍了使用$符号的实现方式,文中通过示例代码介绍的非常详细,需要的朋友们下面随着小编来一起学习学习吧... 目录$ 字符使用方式创建内插字符串包含不同的数据类型控制内插表达式的格式控制内插表达式的对齐方式内插表达式中使用转义序列内插表达式中使用

详解MySQL中JSON数据类型用法及与传统JSON字符串对比

《详解MySQL中JSON数据类型用法及与传统JSON字符串对比》MySQL从5.7版本开始引入了JSON数据类型,专门用于存储JSON格式的数据,本文将为大家简单介绍一下MySQL中JSON数据类型... 目录前言基本用法jsON数据类型 vs 传统JSON字符串1. 存储方式2. 查询方式对比3. 索引