算法第十八天-实现Trie(前缀树)

2024-01-14 10:44

本文主要是介绍算法第十八天-实现Trie(前缀树),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

实现Trie(前缀树)

题目要求

解题思路

本文是前缀入门教程
从二叉树说起
前缀树,也是一种树。为了理解前缀树,我们先从二叉树说起。常见的二叉树结构是下面这样子的:

class TreeNode { int val; TreeNode* left; TreeNode* right; }

可以看到一个树的节点包含了三个元素:该节点本身的值,左子树的指针,右子树的指针。二叉树可视化是下面这样子的:

二叉树的每个节点只有两个孩子,那如果每个节点可以有多个孩子呢?这就形成了多叉树。多叉树的子节点数目一般不是固定的,所以会用变长数组来保存所有的子节点的指针。多叉树的结构式下面这样:

class TreeNode { int val; vector<TreeNode*> children; 
}

多叉树可视化是下面这样:

对于普通的多叉树,每个节点的所有子节点可能是没有任何规律的。而本题讨论的[前缀树]就是每个节点的Children有规律的多叉树。

前缀树
(只保存小写字符的)[前缀树]是一种特殊的多叉树,它的TrieNode中Children是一个大小为26的一维数组,分别对应了26个英文字母,也就是说形成了一棵26叉树。
前缀树的结果可以定义为下面这样。
里面存储了两个信息:

  • isWord表示从根节点到当前节点为止,该路径是否已经形成了一个有效的字符串。
  • children是该节点的所有子节点
class TrieNode {
public:vector<TrieNode*> children;bool isWord;TrieNode() : isWord(false), children(26, nullptr) {}~TrieNode() {for (auto& c : children)delete c;}
};

构建
在构建前缀树的时候,按照下面的方法:

  • 根节点不保存任何信息;
  • 关键词放到[前缀树]时,需要把它拆成各个字符,每个字符按照其在'a'~'z'的序号,放在对应的children里面,下一个字符实在当前字符的子节点。
  • 一个输入字符串构建[前缀树]结束的时候,需要把该节点的isword标记为true,说明从根节点到当前节点的路径,构成了一个关键词。

看下面这个图的时候,需要注意:
1.所有以相同字符开头的字符串,会聚合到同一个子树上。比如{'am','an','as'}
2.并不一定是到达叶子节点才形成一个关键词,只要isword为true,那么从根节点到当前节点的路劲就是关键词。比如{'c','cv'}
在这里插入图片描述

有些题解把字符画在节点中,这是不准确的。因为前缀树是根据字符在children中的位置确定子树,而不真正在书中存储了'a'~'z'这些字符。树中每个节点存储的isWord,表示从根节点到当前节点的路径是否构成了一个关键词。

查询
在判断一个关键词是否在[前缀树]中时,需要依次遍历该关键词所有字符,在前缀树中找到这条路径。可能会出现三种情况:
1.在寻找路径的过程中,发现到某个位置路径断了。比如在上面的前缀树图中寻找'd'或者''ar或者'any',由于树中没有构建对应的节点,那么就查找不到这些关键词;
2.找到了这条路径,但是最后一个节点的isWord为false。这也说明没有改关键词。比如在上面的前缀树图中寻找'a';
3.找到了这条路径,并且最后一个节点的isWord为true。这说明前缀树存储了这个关键词,比如上面前缀树图中的'am','cv'等。

应用
上面说了这么多前缀树,那前缀树有什么用那?
其实我们生活中就有应用。比如我们常见的电话拨号键盘,当我们输入一些数字的时候,后面会自动提示以我们的输入数字为开头的所有号码。

代码

下面的Python解法中,保存children是使用的字典,它保存的结构式{字符:Node},所以可以直接通过children[“a”]来获取当前节点的’a’子树。

class Node(object):def __init__(self):self.children = collections.defaultdict(Node)self.isword = False
class Trie:def __init__(self):"""Initialize your data structure here."""self.root = Node()def insert(self, word: str) -> None:"""Inserts a word into the trie."""current = self.rootfor w in word:current = current.children[w]current.isword = Truedef search(self, word: str) -> bool:"""Returns if the word is in the trie."""current = self.rootfor w in word:current = current.children.get(w)if current == None:return Falsereturn current.isworddef startsWith(self, prefix: str) -> bool:"""Returns if there is any word in the trie that starts with the given prefix."""current = self.rootfor w in prefix:current = current.children.get(w)if current == None:return Falsereturn True
# Your Trie object will be instantiated and called as such:
# obj = Trie()
# obj.insert(word)
# param_2 = obj.search(word)
# param_3 = obj.startsWith(prefix)

复杂度分析

时间复杂度:初始化为 O ( 1 ) O(1) O(1),其余操作为 O ( ∣ S ∣ ) O(|S|) O(S),其中|S|是每次插入或咨询的字符串长度。
空间复杂度: O ( ∣ T ∣ ⋅ ∑ ) O(|T|·∑) O(T),其中|T|为所有插入字符串的长度之和,∑为字符集的大小,本题∑=26

这篇关于算法第十八天-实现Trie(前缀树)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/604884

相关文章

基于Redisson实现分布式系统下的接口限流

《基于Redisson实现分布式系统下的接口限流》在高并发场景下,接口限流是保障系统稳定性的重要手段,本文将介绍利用Redisson结合Redis实现分布式环境下的接口限流,具有一定的参考价值,感兴趣... 目录分布式限流的核心挑战基于 Redisson 的分布式限流设计思路实现步骤引入依赖定义限流注解实现

SpringBoot实现虚拟线程的方案

《SpringBoot实现虚拟线程的方案》Java19引入虚拟线程,本文就来介绍一下SpringBoot实现虚拟线程的方案,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,... 目录什么是虚拟线程虚拟线程和普通线程的区别SpringBoot使用虚拟线程配置@Async性能对比H

基于Python实现进阶版PDF合并/拆分工具

《基于Python实现进阶版PDF合并/拆分工具》在数字化时代,PDF文件已成为日常工作和学习中不可或缺的一部分,本文将详细介绍一款简单易用的PDF工具,帮助用户轻松完成PDF文件的合并与拆分操作... 目录工具概述环境准备界面说明合并PDF文件拆分PDF文件高级技巧常见问题完整源代码总结在数字化时代,PD

Python实现Word转PDF全攻略(从入门到实战)

《Python实现Word转PDF全攻略(从入门到实战)》在数字化办公场景中,Word文档的跨平台兼容性始终是个难题,而PDF格式凭借所见即所得的特性,已成为文档分发和归档的标准格式,下面小编就来和大... 目录一、为什么需要python处理Word转PDF?二、主流转换方案对比三、五套实战方案详解方案1:

SpringBoot集成EasyExcel实现百万级别的数据导入导出实践指南

《SpringBoot集成EasyExcel实现百万级别的数据导入导出实践指南》本文将基于开源项目springboot-easyexcel-batch进行解析与扩展,手把手教大家如何在SpringBo... 目录项目结构概览核心依赖百万级导出实战场景核心代码效果百万级导入实战场景监听器和Service(核心

C# async await 异步编程实现机制详解

《C#asyncawait异步编程实现机制详解》async/await是C#5.0引入的语法糖,它基于**状态机(StateMachine)**模式实现,将异步方法转换为编译器生成的状态机类,本... 目录一、async/await 异步编程实现机制1.1 核心概念1.2 编译器转换过程1.3 关键组件解析

基于Python Playwright进行前端性能测试的脚本实现

《基于PythonPlaywright进行前端性能测试的脚本实现》在当今Web应用开发中,性能优化是提升用户体验的关键因素之一,本文将介绍如何使用Playwright构建一个自动化性能测试工具,希望... 目录引言工具概述整体架构核心实现解析1. 浏览器初始化2. 性能数据收集3. 资源分析4. 关键性能指

使用Redis快速实现共享Session登录的详细步骤

《使用Redis快速实现共享Session登录的详细步骤》在Web开发中,Session通常用于存储用户的会话信息,允许用户在多个页面之间保持登录状态,Redis是一个开源的高性能键值数据库,广泛用于... 目录前言实现原理:步骤:使用Redis实现共享Session登录1. 引入Redis依赖2. 配置R

SpringBoot实现RSA+AES自动接口解密的实战指南

《SpringBoot实现RSA+AES自动接口解密的实战指南》在当今数据泄露频发的网络环境中,接口安全已成为开发者不可忽视的核心议题,RSA+AES混合加密方案因其安全性高、性能优越而被广泛采用,本... 目录一、项目依赖与环境准备1.1 Maven依赖配置1.2 密钥生成与配置二、加密工具类实现2.1

在Java中实现线程之间的数据共享的几种方式总结

《在Java中实现线程之间的数据共享的几种方式总结》在Java中实现线程间数据共享是并发编程的核心需求,但需要谨慎处理同步问题以避免竞态条件,本文通过代码示例给大家介绍了几种主要实现方式及其最佳实践,... 目录1. 共享变量与同步机制2. 轻量级通信机制3. 线程安全容器4. 线程局部变量(ThreadL