数据结构与算法实验-(附加实验)文本串的哈夫曼编码和译码

2024-01-24 13:48

本文主要是介绍数据结构与算法实验-(附加实验)文本串的哈夫曼编码和译码,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文本串的哈夫曼编码和译码

哈夫曼编码是最基本的字符压缩编码。对文本进行哈夫曼编码后再进行信息通讯可以大大提高信道利用率,缩短信息传输时间,降低传输成本。但是,这要求在发送端通过一个编码系统对待传数据预先编码;在接收端将传来的数据进行译码(复原)。 请设计一个程序,输入一行字符文本串(最大长度为10000个字符),构造其哈夫曼编码。根据需要(传输前)选择对字符文本进行编码(将字符文本转换为哈夫曼0-1编码),或对已编码的数据(接收后)进行译码(将0-1编码还原为字符文本)。
具体:
(1)初试化(I):读入一行文本,根据字符分布建立哈夫曼树,构造字符的哈夫曼编码(用于编码和译码),输出“Huffman code established!“”;
(2)编码(C):使用得到的哈夫曼编码对原始字符文本进行编码,输出;
(3)译码(D)::对编码后的0-1文本进行译码(还原为原来的字符文本),输出;
(4)退出(X):结束;注:如果编码或译码时,哈夫曼编码还没建立,应提示"Huffman code does not exist!”
例如:
样例输入:
I
Welcome to the school of computer science and technology.
C
D
11011001100100001000101101110111001001011100001101110111010000001110010000101011001101111010001000101111100011100111000111110101011101000011101101101000000111011111000100111101101110001100000110100100001010011111011111101010
X
样例输出:
Huffman code established!
11011001100100001000101101110111001001011100001101110111010000001110010000101011001101111010001000101111100011100111000111110101011101000011101101101000000111011111000100111101101110001100000110100100001010011111011111101010
Welcome to the school of computer science and technology.

要注意:
string不能malloc,要用new! string不能malloc,要用new! string不能malloc,要用new!
就是因为这个,codeblocks上边可以运行通过,OJ上不行,两天的段错误啊……
建立哈夫曼树的方法:
1.找到两个权值最小的点(若权值一样,则选择前面的),然后将这两个点连接到一个“根”上(根的权值是两个点权值之和),将“根”放到原序列最后,将选择的两个点从原序列删除(原序列指删除重复字符后的给定序列);
2.重复上述操作,直至原序列剩余一个点,将其标记为根节点。

包括空格的字符串这样输入:

getchar();
char c;
scanf("%c",&c);
int i=0;
while(c!='\n')
{str[i]=c;i++;scanf("%c",&c);}
len=i;

完整代码如下:

#pragma GCC optimize(3,"Ofast","inline")
#pragma G++ optimize(3)
#include <bits/stdc++.h>
#include <iostream>
#include <cstdio>
#include <fstream>
#include <algorithm>
#include <cmath>
#include <deque>
#include <vector>
#include <queue>
#include <string>
#include <cstring>
#include <map>
#include <stack>
#include <set>
#include <sstream>
using namespace std;
typedef long long ll;
typedef unsigned long long ull;
typedef pair<ll,ll> pll;
typedef pair<int,int> pii;
typedef queue<int> q_i;
typedef queue<string> q_s;
typedef queue<double> q_d;
typedef queue<ll> q_ll;
typedef queue<char> q_c;
typedef priority_queue<int> pq_i;
typedef priority_queue<string> pq_s;
typedef priority_queue<double> pq_d;
typedef priority_queue<ll> pq_ll;
typedef stack<int> s_i;
typedef stack<string> s_s;
typedef stack<double> s_d;
typedef stack<ll> s_ll;
typedef stack<char> s_c;
typedef map<ll,ll> m_ll_ll;
typedef map<int,ll> m_i_ll;
typedef map<string,ll> m_s_ll;
typedef map<char,int> m_c_i;
typedef map<char,ll> m_c_ll;
#define rep(i,l,r) for(ll i=l;i<=r;i++)
#define per(i,l,r) for(ll i=r;i>=l;i--)
#define eif else if
#define N 3005
#define mm(dp) memset(dp,0,sizeof(dp))
#define mm1(dp) memset(dp,-1,sizeof(dp))
#define mm2(dp) memset(dp,0x3f,sizeof(dp))
#define IT set<int>::iterator
#define fs(n) fixed<< setprecision(n)
#define inf 0x3f3f3f3f
const double e=2.71828182845;
const double pi = acos(-1.0);
map<char,int>mapp;
map<char,string>mapp1;
typedef struct
{string s1;int num;
}STU;
typedef struct
{string s1,s0;int num;
}STU1;
bool cmp(STU x,STU y)
{return x.num>y.num;
}
typedef struct node
{string data;struct node *left,*right;
}HuffmanTreeNode,*PtrHuffman;
class Haffman
{public:PtrHuffman head=NULL;PtrHuffman p[100005];void create1(int nm,STU *stu){int u=0;rep(i,1,nm){PtrHuffman t=new HuffmanTreeNode;t->data = stu[i].s1;t->left = t->right = NULL;p[i]= t;}rep(i,1,nm-1){int fi=inf,se=inf;int fi1=0,se1=0;rep(j,1,nm+u){if(stu[j].num>0&&stu[j].num<fi){fi=stu[j].num;fi1=j;}}rep(j,1,nm+u){if(stu[j].num>0&&stu[j].num<se&&j!=fi1){se=stu[j].num;se1=j;}}PtrHuffman q=new HuffmanTreeNode;q->data=p[fi1]->data+p[se1]->data;q->left=p[fi1];q->right=p[se1];u++;stu[nm+u].s1=stu[fi1].s1+stu[se1].s1;stu[nm+u].num=stu[fi1].num+stu[se1].num;p[nm+u]=q;stu[fi1].num=-1;stu[se1].num=-1;head=q;}}void bianli(struct node *t1,int u){if(t1==NULL)return;if(u==0)cout<<t1->data<<endl;else{cout<<u<<" ";cout<<t1->data<<endl;}bianli(t1->left,u+1);bianli(t1->right,u+1);}void bianli1(struct node *t1,char ch,string str){if(t1==NULL)return;string s1="";s1+=ch;string ss=t1->data;if(ss==s1){mapp1[ch]=str;return;}else{string s=t1->data;int len=s.size();int flag=0;rep(i,0,len){if(s[i]==ch){flag=1;break;}}if(flag==0)return;else{bianli1(t1->left,ch,str+"0");bianli1(t1->right,ch,str+"1");}}}STU1 bianli2(struct node *t1,string str){if(t1->data.size()==1){STU1 stu;stu.s1=t1->data;int len=str.size();stu.s0=str;return stu;}char ch=str[0];int len=str.size();str=str.substr(1,len-1);if(ch=='0'){return bianli2(t1->left,str);}if(ch=='1'){return bianli2(t1->right,str);}}
};
int len;
int main()
{//ios::sync_with_stdio(false);//cin.tie(0);//cout.tie(0);Haffman ha;char str[10005];int uu=0;while(1){char ch;cin>>ch;if(ch=='X')break;eif(ch=='I'){getchar();char c;scanf("%c",&c);int i=0;while(c!='\n'){str[i]=c;i++;scanf("%c",&c);}len=i;string ss="";rep(i,0,len-1){if(mapp[str[i]]==0){mapp[str[i]]=1;ss+=str[i];}eif(mapp[str[i]]!=0){mapp[str[i]]++;}}int len1=ss.size();STU stu[10005];rep(i,0,len1-1){string s0="";char c=ss[i];s0+=c;stu[i+1].s1=s0;stu[i+1].num=mapp[c];}ha.create1(len1,stu);cout<<"Huffman code established!"<<endl;uu=1;}eif(ch=='C'){if(uu==0){cout<<"Huffman code does not exist!"<<endl;}else{rep(i,0,len-1){char cc=str[i];ha.bianli1(ha.head,cc,"");cout<<mapp1[str[i]];}cout<<endl;}}eif(ch=='D'){if(uu==0){cout<<"Huffman code does not exist!"<<endl;}else{string s2;cin>>s2;while(1){if(s2=="")break;STU1 huan=ha.bianli2(ha.head,s2);cout<<huan.s1;s2=huan.s0;}cout<<endl;}}}return 0;
}

这篇关于数据结构与算法实验-(附加实验)文本串的哈夫曼编码和译码的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/639891

相关文章

深入理解Mysql OnlineDDL的算法

《深入理解MysqlOnlineDDL的算法》本文主要介绍了讲解MysqlOnlineDDL的算法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小... 目录一、Online DDL 是什么?二、Online DDL 的三种主要算法2.1COPY(复制法)

C++中处理文本数据char与string的终极对比指南

《C++中处理文本数据char与string的终极对比指南》在C++编程中char和string是两种用于处理字符数据的类型,但它们在使用方式和功能上有显著的不同,:本文主要介绍C++中处理文本数... 目录1. 基本定义与本质2. 内存管理3. 操作与功能4. 性能特点5. 使用场景6. 相互转换核心区别

Python动态处理文件编码的完整指南

《Python动态处理文件编码的完整指南》在Python文件处理的高级应用中,我们经常会遇到需要动态处理文件编码的场景,本文将深入探讨Python中动态处理文件编码的技术,有需要的小伙伴可以了解下... 目录引言一、理解python的文件编码体系1.1 Python的IO层次结构1.2 编码问题的常见场景二

Java中字符编码问题的解决方法详解

《Java中字符编码问题的解决方法详解》在日常Java开发中,字符编码问题是一个非常常见却又特别容易踩坑的地方,这篇文章就带你一步一步看清楚字符编码的来龙去脉,并结合可运行的代码,看看如何在Java项... 目录前言背景:为什么会出现编码问题常见场景分析控制台输出乱码文件读写乱码数据库存取乱码解决方案统一使

Java实现字节字符转bcd编码

《Java实现字节字符转bcd编码》BCD是一种将十进制数字编码为二进制的表示方式,常用于数字显示和存储,本文将介绍如何在Java中实现字节字符转BCD码的过程,需要的小伙伴可以了解下... 目录前言BCD码是什么Java实现字节转bcd编码方法补充总结前言BCD码(Binary-Coded Decima

Java实现在Word文档中添加文本水印和图片水印的操作指南

《Java实现在Word文档中添加文本水印和图片水印的操作指南》在当今数字时代,文档的自动化处理与安全防护变得尤为重要,无论是为了保护版权、推广品牌,还是为了在文档中加入特定的标识,为Word文档添加... 目录引言Spire.Doc for Java:高效Word文档处理的利器代码实战:使用Java为Wo

Python文本相似度计算的方法大全

《Python文本相似度计算的方法大全》文本相似度是指两个文本在内容、结构或语义上的相近程度,通常用0到1之间的数值表示,0表示完全不同,1表示完全相同,本文将深入解析多种文本相似度计算方法,帮助您选... 目录前言什么是文本相似度?1. Levenshtein 距离(编辑距离)核心公式实现示例2. Jac

redis数据结构之String详解

《redis数据结构之String详解》Redis以String为基础类型,因C字符串效率低、非二进制安全等问题,采用SDS动态字符串实现高效存储,通过RedisObject封装,支持多种编码方式(如... 目录一、为什么Redis选String作为基础类型?二、SDS底层数据结构三、RedisObject

Java 中编码与解码的具体实现方法

《Java中编码与解码的具体实现方法》在Java中,字符编码与解码是处理数据的重要组成部分,正确的编码和解码可以确保字符数据在存储、传输、读取时不会出现乱码,本文将详细介绍Java中字符编码与解码的... 目录Java 中编码与解码的实现详解1. 什么是字符编码与解码?1.1 字符编码(Encoding)1

Python中高级文本模式匹配与查找技术指南

《Python中高级文本模式匹配与查找技术指南》文本处理是编程世界的永恒主题,而模式匹配则是文本处理的基石,本文将深度剖析PythonCookbook中的核心匹配技术,并结合实际工程案例展示其应用,希... 目录引言一、基础工具:字符串方法与序列匹配二、正则表达式:模式匹配的瑞士军刀2.1 re模块核心AP