KMP?next数组?前缀表?菜鸟重拾C++之算法

2024-03-02 09:20

本文主要是介绍KMP?next数组?前缀表?菜鸟重拾C++之算法,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

实现strStr()

知识点

  • KMP(Knuth-Morris-Pratt)算法是一种用于字符串匹配的高效算法。其原理基于字符串匹配时的特性,通过预处理模式字符串(待匹配字符串)的信息,避免在匹配过程中重复比较已经匹配过的部分。

  • 前缀表记录了模式字符串中最长相同前后缀的长度

    前缀是指不包含最后一个字符的所有以第一个字符开头的连续子串

    后缀是指不包含第一个字符的所有以最后一个字符结尾的连续子串

    最长相同前后缀的长度:

    举一个例子“ABABBABC”

    • A -> 0

    • AB -> 0

    • ABA -> 1

    • ABAB -> 2

    • ABABB -> 0

    • ABABBA->0

    • ABABBAB->2

    • ABABBABC->0

    再举个栗子“aabaaf”

    • a->0

    • aa->1

    • aab->0

    • aaba->1

    • aabaa->2

    • aabaaf->0

  • next 数组 其实就是前缀表的不同表现形式,主流的写法有三种:

    拿“aabaaf”来说,需要找到aabaabaaf的匹配下标

    第一种next数组表示方式为[0, 1, 0, 1, 2, 0], 当他遍历到f的时候发现f和b有冲突,那么找到f对应的前缀表位置的前一位的值为2,那么之前回退到前缀表下标为2的地方。

    第二种next数组表示方式为[-1, 0, 1, 0, 1, 2],当他遍历到f的时候发现f和b有冲突,那么找到f对应的前缀表位置的值为2,那么之前回退到前缀表下标为2的地方。

    第三种next数组表示方式为[-1, 0, -1, 0, 1, -1],当他遍历到f的时候发现f和b有冲突,那么找到f对应的前缀表位置的前一位的值为1,加1之后,那么之前回退到前缀表下标为2的地方。

  • 难点:next 数组怎么写

    我们就看第一种 next 数组的写法

    • 初始化

    • 前后缀不相等的情况

    • 前后缀相等的情况

    • 更新 next 数组

    /* i:表示后缀末尾;j表示前缀末尾(也表示冲突返回的下标位置)*/// 初始化
    int j = 0;
    next[0] = 0;
    ​
    for(int i = 1; i < s.size(); i++){// 前后缀不相等的情况, 根据不变性原理,j也需要回退到j对应的前一位的值对应的下标值的位置while(j > 0 && s[i] != s[j]){j = next[j - 1];}// 前后缀相等的情况if(s[i] == s[j]){// 更新next数组next[i] = j++;}
    }

题目

给你两个字符串 haystackneedle ,请你在 haystack 字符串中找出 needle 字符串的第一个匹配项的下标(下标从 0 开始)。如果 needle 不是 haystack 的一部分,则返回 -1

28. 找出字符串中第一个匹配项的下标 - 力扣(LeetCode)

题解1:暴力解法

class Solution {
public:int strStr(string haystack, string needle) {for (int i = 0; i + needle.size() <= haystack.size(); i++) {//i + needle.size() <= haystack.size()if (haystack[i] == needle[0]) {bool flag = true;int j = needle.size() - 1;for (; j >= 0; j--) {if (haystack[i + j] != needle[j]){flag = false;break;}}if(flag ){ // 善用flagreturn i;}}}return -1;}
};

题解2:KMP解法

class Solution {
public:void getNext(int* next, const string& s){int j = 0;next[0] = 0;for(int i = 1; i < s.size(); i++){while(j > 0 && s[i] != s[j]){j = next[j - 1];}if(s[i] == s[j]){j++;}next[i] = j;}}
​int strStr(string haystack, string needle) {if(needle.size() == 0) return 0;int next[needle.size()];getNext(next, needle);int j = 0;for(int i = 0; i < haystack.size(); i++){while(j > 0 && haystack[i] != needle[j]){j = next[j - 1];}if(haystack[i] == needle[j]){j++;}if(j == needle.size()){return (i - needle.size() + 1);}}return -1;}
};

这篇关于KMP?next数组?前缀表?菜鸟重拾C++之算法的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/765648

相关文章

C++中unordered_set哈希集合的实现

《C++中unordered_set哈希集合的实现》std::unordered_set是C++标准库中的无序关联容器,基于哈希表实现,具有元素唯一性和无序性特点,本文就来详细的介绍一下unorder... 目录一、概述二、头文件与命名空间三、常用方法与示例1. 构造与析构2. 迭代器与遍历3. 容量相关4

C++中悬垂引用(Dangling Reference) 的实现

《C++中悬垂引用(DanglingReference)的实现》C++中的悬垂引用指引用绑定的对象被销毁后引用仍存在的情况,会导致访问无效内存,下面就来详细的介绍一下产生的原因以及如何避免,感兴趣... 目录悬垂引用的产生原因1. 引用绑定到局部变量,变量超出作用域后销毁2. 引用绑定到动态分配的对象,对象

深入理解Mysql OnlineDDL的算法

《深入理解MysqlOnlineDDL的算法》本文主要介绍了讲解MysqlOnlineDDL的算法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小... 目录一、Online DDL 是什么?二、Online DDL 的三种主要算法2.1COPY(复制法)

JavaScript对象转数组的三种方法实现

《JavaScript对象转数组的三种方法实现》本文介绍了在JavaScript中将对象转换为数组的三种实用方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友... 目录方法1:使用Object.keys()和Array.map()方法2:使用Object.entr

C++读写word文档(.docx)DuckX库的使用详解

《C++读写word文档(.docx)DuckX库的使用详解》DuckX是C++库,用于创建/编辑.docx文件,支持读取文档、添加段落/片段、编辑表格,解决中文乱码需更改编码方案,进阶功能含文本替换... 目录一、基本用法1. 读取文档3. 添加段落4. 添加片段3. 编辑表格二、进阶用法1. 文本替换2

C++中处理文本数据char与string的终极对比指南

《C++中处理文本数据char与string的终极对比指南》在C++编程中char和string是两种用于处理字符数据的类型,但它们在使用方式和功能上有显著的不同,:本文主要介绍C++中处理文本数... 目录1. 基本定义与本质2. 内存管理3. 操作与功能4. 性能特点5. 使用场景6. 相互转换核心区别

C++右移运算符的一个小坑及解决

《C++右移运算符的一个小坑及解决》文章指出右移运算符处理负数时左侧补1导致死循环,与除法行为不同,强调需注意补码机制以正确统计二进制1的个数... 目录我遇到了这么一个www.chinasem.cn函数由此可以看到也很好理解总结我遇到了这么一个函数template<typename T>unsigned

C++统计函数执行时间的最佳实践

《C++统计函数执行时间的最佳实践》在软件开发过程中,性能分析是优化程序的重要环节,了解函数的执行时间分布对于识别性能瓶颈至关重要,本文将分享一个C++函数执行时间统计工具,希望对大家有所帮助... 目录前言工具特性核心设计1. 数据结构设计2. 单例模式管理器3. RAII自动计时使用方法基本用法高级用法

JavaScript中比较两个数组是否有相同元素(交集)的三种常用方法

《JavaScript中比较两个数组是否有相同元素(交集)的三种常用方法》:本文主要介绍JavaScript中比较两个数组是否有相同元素(交集)的三种常用方法,每种方法结合实例代码给大家介绍的非常... 目录引言:为什么"相等"判断如此重要?方法1:使用some()+includes()(适合小数组)方法2

深入解析C++ 中std::map内存管理

《深入解析C++中std::map内存管理》文章详解C++std::map内存管理,指出clear()仅删除元素可能不释放底层内存,建议用swap()与空map交换以彻底释放,针对指针类型需手动de... 目录1️、基本清空std::map2️、使用 swap 彻底释放内存3️、map 中存储指针类型的对象