AcWing 149. 荷马史诗(二叉堆、小根堆、Huffman树、C++)

2023-10-20 05:50

本文主要是介绍AcWing 149. 荷马史诗(二叉堆、小根堆、Huffman树、C++),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

  • AcWing 149. 荷马史诗
  • 题目描述
  • 输入输出
      • 数据范围
      • 输入样例
      • 输出样例
  • 思路
  • C++实现

AcWing 149. 荷马史诗

题目地址:https://www.acwing.com/problem/content/151/

题目描述

一部《荷马史诗》中有 n 种不同的单词,从 1 到 n 进行编号。其中第 i 种单词出现的总次数为 wi 。

达达想要用 k 进制串 si 来替换第 i 种单词,使得其满足如下要求:

对于任意的 1 ≤ i,j ≤ n ,i ≠ j,都有:si 不是 sj 的前缀。

现在达达想要知道,如何选择 si,才能使替换以后得到的新的《荷马史诗》长度最小。

在确保总长度最小的情况下,达达还想知道最长的 si 的最短长度是多少?

一个字符串被称为 k 进制字符串,当且仅当它的每个字符是 0 到 k−1 之间(包括 0 和 k−1)的整数。

字符串 Str1 被称为字符串 Str2 的前缀,当且仅当:存在 1 ≤ t ≤ m,使得 Str1 = Str2 [1…t] 。

其中,m 是字符串 Str2 的长度,Str2[1…t] 表示 Str2 的前 t 个字符组成的字符串。

输入输出

第一行输入n、k,分别表示有 n 种单词,需要使用k进制字符串进行替换。
第2 - (n + 1) 行每行输入一个非负整数 wi ,表示第 i 种单词出现的次数。

数据范围

2 ≤ n ≤ 100000,
2 ≤ k ≤ 9
1 ≤ wi ≤ 10^12

输入样例

4 2
1
1
2
2

输出样例

12
2

思路

本题所构造的编码方式其实就是 Huffman 编码,我们把单词的出现次数 w1 ~ wn 作为 Huffman 树
叶子节点的权值,然后求出k 叉 Huffman 树。对于 Huffman 树的每个节点的k个分支,分别在边上标
记字符0 ~ k - 1.

此时,可以把这棵Huffman树看作一棵Trie树,就得到了使总长度最小的编码方式——单词 i 的编码就是从根节点到叶子节点 i 的路径上各条边的字符相连。一个单词不是另一个的前缀,其实就对应着: 在Trie树中,所有单词编码的末尾都在叶子节点上,而不在Trie树的一个内部节点上,恰好满足了这个性质。

同时,本题还要求最长的 si 长度最短,我们只需要在求Huffman 树时,对于权值相同的节点,优先考虑当前深度最小(已合并次数最小)的进行合并即可。

哈夫曼树,就是满足权值路径长度最短的树,因此我们这道题目直接可以开哈夫曼树处理即可。

在代码实现过程中,我们先将所有的值压入堆中,每个值的first存的是叶子节点的权值,即单词的出现次数,second存深度。然后,我们在执行上述贪心算法之前,补加一些额外的权值为0的叶子节点,使叶子节点的个数n满足 ( n - 1 ) mod ( k - 1 ) = 0。也就是说,我们让子节点不足k个的情况发生在最底层,而不是根节点处。在满足 ( n - 1 ) mod ( k - 1 ) = 0 时,执行“每次从堆中取出最小的k个权值的贪心算法就是正确的。

Trie树

C++实现

#include<iostream>
#include<algorithm>
#include<cstdlib>
#include<cstring>
#include<cctype>
#include<cmath>
#include<vector>
#include<stack>
#include<queue>
#include<map>
#include<set>using namespace std;#define IOS ios::sync_with_stdio(false); cin.tie(0), cout.tie(0);
#define ll long long
#define endl '\n'typedef pair<ll, ll> pir;	//first存的是叶子节点的权值,即单词的出现次数,second存深度
const int mod = 0x7f7f7f7f;
const int N = 100010;ll a[N], min_len;
priority_queue<pir, vector<pir>, greater<pir> > heap;int main(void){IOSint n, k; cin >> n >> k;for(int i = 1; i <= n; i ++ ){ll x; cin >> x;heap.push({x, 0});}while((heap.size() - 1) % (k - 1) != 0){	//补全额外的叶子节点heap.push({0, 0});}while(heap.size() >= k){ll num = 0, deep = -1;for(int i = 1; i <= k; i ++ ){	//每次取出k个最小权值pir p = heap.top();heap.pop();num += p.first;deep = max(deep, p.second);}min_len += num;	//总权值heap.push({num, deep + 1});	//深度 +1}cout << min_len << endl << heap.top().second << endl;	//堆顶的数即为最长字符串的最短长度return 0;
}

这篇关于AcWing 149. 荷马史诗(二叉堆、小根堆、Huffman树、C++)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/245107

相关文章

C++右移运算符的一个小坑及解决

《C++右移运算符的一个小坑及解决》文章指出右移运算符处理负数时左侧补1导致死循环,与除法行为不同,强调需注意补码机制以正确统计二进制1的个数... 目录我遇到了这么一个www.chinasem.cn函数由此可以看到也很好理解总结我遇到了这么一个函数template<typename T>unsigned

C++统计函数执行时间的最佳实践

《C++统计函数执行时间的最佳实践》在软件开发过程中,性能分析是优化程序的重要环节,了解函数的执行时间分布对于识别性能瓶颈至关重要,本文将分享一个C++函数执行时间统计工具,希望对大家有所帮助... 目录前言工具特性核心设计1. 数据结构设计2. 单例模式管理器3. RAII自动计时使用方法基本用法高级用法

深入解析C++ 中std::map内存管理

《深入解析C++中std::map内存管理》文章详解C++std::map内存管理,指出clear()仅删除元素可能不释放底层内存,建议用swap()与空map交换以彻底释放,针对指针类型需手动de... 目录1️、基本清空std::map2️、使用 swap 彻底释放内存3️、map 中存储指针类型的对象

C++ STL-string类底层实现过程

《C++STL-string类底层实现过程》本文实现了一个简易的string类,涵盖动态数组存储、深拷贝机制、迭代器支持、容量调整、字符串修改、运算符重载等功能,模拟标准string核心特性,重点强... 目录实现框架一、默认成员函数1.默认构造函数2.构造函数3.拷贝构造函数(重点)4.赋值运算符重载函数

C++ vector越界问题的完整解决方案

《C++vector越界问题的完整解决方案》在C++开发中,std::vector作为最常用的动态数组容器,其便捷性与性能优势使其成为处理可变长度数据的首选,然而,数组越界访问始终是威胁程序稳定性的... 目录引言一、vector越界的底层原理与危害1.1 越界访问的本质原因1.2 越界访问的实际危害二、基

c++日志库log4cplus快速入门小结

《c++日志库log4cplus快速入门小结》文章浏览阅读1.1w次,点赞9次,收藏44次。本文介绍Log4cplus,一种适用于C++的线程安全日志记录API,提供灵活的日志管理和配置控制。文章涵盖... 目录简介日志等级配置文件使用关于初始化使用示例总结参考资料简介log4j 用于Java,log4c

C++归并排序代码实现示例代码

《C++归并排序代码实现示例代码》归并排序将待排序数组分成两个子数组,分别对这两个子数组进行排序,然后将排序好的子数组合并,得到排序后的数组,:本文主要介绍C++归并排序代码实现的相关资料,需要的... 目录1 算法核心思想2 代码实现3 算法时间复杂度1 算法核心思想归并排序是一种高效的排序方式,需要用

C++11范围for初始化列表auto decltype详解

《C++11范围for初始化列表autodecltype详解》C++11引入auto类型推导、decltype类型推断、统一列表初始化、范围for循环及智能指针,提升代码简洁性、类型安全与资源管理效... 目录C++11新特性1. 自动类型推导auto1.1 基本语法2. decltype3. 列表初始化3

C++11右值引用与Lambda表达式的使用

《C++11右值引用与Lambda表达式的使用》C++11引入右值引用,实现移动语义提升性能,支持资源转移与完美转发;同时引入Lambda表达式,简化匿名函数定义,通过捕获列表和参数列表灵活处理变量... 目录C++11新特性右值引用和移动语义左值 / 右值常见的左值和右值移动语义移动构造函数移动复制运算符

C++中detach的作用、使用场景及注意事项

《C++中detach的作用、使用场景及注意事项》关于C++中的detach,它主要涉及多线程编程中的线程管理,理解detach的作用、使用场景以及注意事项,对于写出高效、安全的多线程程序至关重要,下... 目录一、什么是join()?它的作用是什么?类比一下:二、join()的作用总结三、join()怎么