【2023年修正版】哈夫曼编码详解

2023-12-02 22:20

本文主要是介绍【2023年修正版】哈夫曼编码详解,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

霍夫曼编码的原理就是根据字符的使用频率,排成二叉树,使用次数少的放到后面,使用次数多的离根节点越近;这样字符的占位也相应的较少。

  1. 首先,主要操作是找每次字符中使用频率最低的(数最小)两个数字,然后将他们两个结合;
  2. 结合后的数字和添加到原数组中(使用频率次数中),继续找最小的两个,根据左小右大原则存放;
  3. 最终组成的数从根节点开始左0右1,遍历到目标节点即为哈夫曼编码。

其中,如果遇到相等的情况则按小于的情况来看。

以下题为例,画哈夫曼编码图
image.png

第一步

先写出字符对应的频率:
8fe6e7a3f1e7d36c1fba1781ab90b1b.jpg
找到其中最小的两个数,目前为5和4;并将他们两个结合左小右大,4+5=9;
e68a15f4e57328a35901fbf2ba88e1b.jpg

第二步

将9写入原序列中,删除已经用掉的4和5
image.png
再找其中最小的两个数,这次为8和9;9已经在图中了,根据左小右大原则,8放到9的左边并相加结合;
8+9=17
image.png

第三步

基本就是这样的步骤,下面删除已经用过的8和9,再加上17
image.png
当前最小的数为13和17(注意相同的数字优先找原序列中的),找个其他地方重新结合即可;
image.png

第四步

数字序列中加上刚刚得到的30,找到最小的17和24结合;
image.png

第五步

这一步最小的数为34和30,将这两个结合,得到30+34=64
image.png

第六步

将最后两个数结合即可得到哈夫曼树;
image.png

以下方法是2022年底有缺陷的方法。


直接上题目:
已知字符集{ a, b, c, d, e, f },若各字符出现的次数分别为{ 6, 3, 8, 2, 10, 4 },则对应字符集中各字符的哈夫曼编码可能是:(2分)
A. 00, 1011, 01, 1010, 11, 100
B. 00, 100, 110, 000, 0010, 01
C. 10, 1011, 11, 0011, 00, 010
D. 0011, 10, 11, 0010, 01, 000

步骤一:

1.找最小两个次数(这里是2和3)
image.png
2.把他们放进树中(小左大右
3.每次组合都多一个父节点(即2+3=5)
image.png

步骤二:

1.再选出2个最小的数(排除上面已经选了的)——选出了4和6
image.png
2.因为4<=5(注意是小于等于) , 6>5(5为步骤一中组合后的父节点)
3.单独拿4来跟5组合(小左大右) 【如果拿出的2个数都比5小,则这2个数自己组合后跟5组合,下面提到】
image.png

步骤三:

1.因为步骤二用掉了4,还没用6。现在取最小2个数
image.png
2.因为6 < 9 , 8< 9 所以6和8自己组合(小左大右) (组合后先放一边)
image.png

步骤四:

1.取出最后10
image.png
2.10要和这两个子树根节点最小的组合(9<14,所以和9组合)(小左大右
image.png
3.然后把14的子树组合上去(小左大右) 所以放左边
image.png

步骤五:

组合完哈夫曼树后,将对应的字符填上去
image.png

步骤六:

从根节点开始向下走往左为0,往右1。走到对应的字符的路径就是该字符的哈夫曼编码(左0右1
image.png

最后结果:

字符哈夫曼编码
a00
b1011
c01
d1010
e11
f100

所以最后答案 A
已知字符集{ a, b, c, d, e, f },若各字符出现的次数分别为{ 6, 3, 8, 2, 10, 4 },则对应字符集中各字符的哈夫曼编码可能是:(2分)
A. 00, 1011, 01, 1010, 11, 100 ✔
B. 00, 100, 110, 000, 0010, 01
C. 10, 1011, 11, 0011, 00, 010
D. 0011, 10, 11, 0010, 01, 000

这篇关于【2023年修正版】哈夫曼编码详解的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/447050

相关文章

PHP轻松处理千万行数据的方法详解

《PHP轻松处理千万行数据的方法详解》说到处理大数据集,PHP通常不是第一个想到的语言,但如果你曾经需要处理数百万行数据而不让服务器崩溃或内存耗尽,你就会知道PHP用对了工具有多强大,下面小编就... 目录问题的本质php 中的数据流处理:为什么必不可少生成器:内存高效的迭代方式流量控制:避免系统过载一次性

MySQL的JDBC编程详解

《MySQL的JDBC编程详解》:本文主要介绍MySQL的JDBC编程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录前言一、前置知识1. 引入依赖2. 认识 url二、JDBC 操作流程1. JDBC 的写操作2. JDBC 的读操作总结前言本文介绍了mysq

Java实现字节字符转bcd编码

《Java实现字节字符转bcd编码》BCD是一种将十进制数字编码为二进制的表示方式,常用于数字显示和存储,本文将介绍如何在Java中实现字节字符转BCD码的过程,需要的小伙伴可以了解下... 目录前言BCD码是什么Java实现字节转bcd编码方法补充总结前言BCD码(Binary-Coded Decima

Redis 的 SUBSCRIBE命令详解

《Redis的SUBSCRIBE命令详解》Redis的SUBSCRIBE命令用于订阅一个或多个频道,以便接收发送到这些频道的消息,本文给大家介绍Redis的SUBSCRIBE命令,感兴趣的朋友跟随... 目录基本语法工作原理示例消息格式相关命令python 示例Redis 的 SUBSCRIBE 命令用于订

使用Python批量将.ncm格式的音频文件转换为.mp3格式的实战详解

《使用Python批量将.ncm格式的音频文件转换为.mp3格式的实战详解》本文详细介绍了如何使用Python通过ncmdump工具批量将.ncm音频转换为.mp3的步骤,包括安装、配置ffmpeg环... 目录1. 前言2. 安装 ncmdump3. 实现 .ncm 转 .mp34. 执行过程5. 执行结

Python中 try / except / else / finally 异常处理方法详解

《Python中try/except/else/finally异常处理方法详解》:本文主要介绍Python中try/except/else/finally异常处理方法的相关资料,涵... 目录1. 基本结构2. 各部分的作用tryexceptelsefinally3. 执行流程总结4. 常见用法(1)多个e

SpringBoot日志级别与日志分组详解

《SpringBoot日志级别与日志分组详解》文章介绍了日志级别(ALL至OFF)及其作用,说明SpringBoot默认日志级别为INFO,可通过application.properties调整全局或... 目录日志级别1、级别内容2、调整日志级别调整默认日志级别调整指定类的日志级别项目开发过程中,利用日志

Java中的抽象类与abstract 关键字使用详解

《Java中的抽象类与abstract关键字使用详解》:本文主要介绍Java中的抽象类与abstract关键字使用详解,本文通过实例代码给大家介绍的非常详细,感兴趣的朋友跟随小编一起看看吧... 目录一、抽象类的概念二、使用 abstract2.1 修饰类 => 抽象类2.2 修饰方法 => 抽象方法,没有

MySQL8 密码强度评估与配置详解

《MySQL8密码强度评估与配置详解》MySQL8默认启用密码强度插件,实施MEDIUM策略(长度8、含数字/字母/特殊字符),支持动态调整与配置文件设置,推荐使用STRONG策略并定期更新密码以提... 目录一、mysql 8 密码强度评估机制1.核心插件:validate_password2.密码策略级

从入门到精通详解Python虚拟环境完全指南

《从入门到精通详解Python虚拟环境完全指南》Python虚拟环境是一个独立的Python运行环境,它允许你为不同的项目创建隔离的Python环境,下面小编就来和大家详细介绍一下吧... 目录什么是python虚拟环境一、使用venv创建和管理虚拟环境1.1 创建虚拟环境1.2 激活虚拟环境1.3 验证虚