小张学算法之基础算法:2.游标编码算法

2024-02-20 06:10

本文主要是介绍小张学算法之基础算法:2.游标编码算法,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

定义:

游标编码就是将一连串相同的字符或数据使用 次数+数据的方式进行压缩。属于熵编码的一种。

例子:
加入文本数据:
aaaaaabbbbbbbccc
就可以表示为
6a7b3c
原本存储需要16个byte存储,现在只需要6个byte了。
如何存储呢:
如果只是顺序的存储cnt+数据的存储方式,我们没法解决有数字的文本信息,当出现数字时没法知道到底是数字4还是cnt值为4。

存储结构

所以我们以这样的数据结构来存储:

struct{byte cnt;byte dat;
}

第一字节存cnt,第二字节存数据,当然这个数据可以是字符也可是一个字节的二进制数据。

适用条件

出现连续的重复序列的数据

例子

我们对一张色域256的图片进行压缩,(色域256色刚好一个像素对应一个字节,如果其他色域,一个像素不是一个字节那就可能没有一系列重复的字节),window 画图工具打开,进行艺术创造~,保存256色域 nihao.bmp
在这里插入图片描述
上代码进行压缩(python实现)

#-*- coding:utf-8 -*-def rle_compile(src_path, dest_path):with open(src_path, 'rb') as src_fd:with open(dest_path, 'wb') as dest_fd:cur_byt = src_fd.read(1)last_byt = Nonecnt = 0;while cur_byt:if cur_byt != last_byt:if last_byt is not None:write_pair(dest_fd, cnt, last_byt)last_byt = cur_bytcnt = 1else:cnt = cnt + 1if cnt > 255:write_pair(dest_fd, 255, last_byt)cnt=1cur_byt = src_fd.read(1)if cnt > 0:write_pair(dest_fd, cnt, last_byt)def write_pair(fd, cnt, dat_byt):fd.write(int.to_bytes(cnt, 1, byteorder='big'))fd.write(dat_byt)def rle_decompile(src_path, dest_path):with open(src_path, 'rb') as src_fd:with open(dest_path, 'wb') as dest_fd:cnt = src_fd.read(1)dat_byt = src_fd.read(1)while cnt and dat_byt:dest_fd.write(int.from_bytes(cnt,byteorder='big')*dat_byt)cnt = src_fd.read(1)dat_byt = src_fd.read(1)
def main():src_path = 'nihao.bmp'com_path = 'nihao_cmo.zfj'decom_path = 'nihao_decmo.bmp'rle_compile(src_path, com_path)rle_decompile(com_path, decom_path)
if __name__ == '__main__':main()

在这里插入图片描述
508KB的源文件压缩到11KB,压缩率达2.1%!!!

这篇关于小张学算法之基础算法:2.游标编码算法的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/727272

相关文章

Java利用Spire.Doc for Java实现在模板的基础上创建Word文档

《Java利用Spire.DocforJava实现在模板的基础上创建Word文档》在日常开发中,我们经常需要根据特定数据动态生成Word文档,本文将深入探讨如何利用强大的Java库Spire.Do... 目录1. Spire.Doc for Java 库介绍与安装特点与优势Maven 依赖配置2. 通过替换

JavaScript装饰器从基础到实战教程

《JavaScript装饰器从基础到实战教程》装饰器是js中一种声明式语法特性,用于在不修改原始代码的情况下,动态扩展类、方法、属性或参数的行为,本文将从基础概念入手,逐步讲解装饰器的类型、用法、进阶... 目录一、装饰器基础概念1.1 什么是装饰器?1.2 装饰器的语法1.3 装饰器的执行时机二、装饰器的

Java JAR 启动内存参数配置指南(从基础设置到性能优化)

《JavaJAR启动内存参数配置指南(从基础设置到性能优化)》在启动Java可执行JAR文件时,合理配置JVM内存参数是保障应用稳定性和性能的关键,本文将系统讲解如何通过命令行参数、环境变量等方式... 目录一、核心内存参数详解1.1 堆内存配置1.2 元空间配置(MetASPace)1.3 线程栈配置1.

从基础到高级详解Go语言中错误处理的实践指南

《从基础到高级详解Go语言中错误处理的实践指南》Go语言采用了一种独特而明确的错误处理哲学,与其他主流编程语言形成鲜明对比,本文将为大家详细介绍Go语言中错误处理详细方法,希望对大家有所帮助... 目录1 Go 错误处理哲学与核心机制1.1 错误接口设计1.2 错误与异常的区别2 错误创建与检查2.1 基础

深入理解Mysql OnlineDDL的算法

《深入理解MysqlOnlineDDL的算法》本文主要介绍了讲解MysqlOnlineDDL的算法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小... 目录一、Online DDL 是什么?二、Online DDL 的三种主要算法2.1COPY(复制法)

Spring的基础事务注解@Transactional作用解读

《Spring的基础事务注解@Transactional作用解读》文章介绍了Spring框架中的事务管理,核心注解@Transactional用于声明事务,支持传播机制、隔离级别等配置,结合@Tran... 目录一、事务管理基础1.1 Spring事务的核心注解1.2 注解属性详解1.3 实现原理二、事务事

Python动态处理文件编码的完整指南

《Python动态处理文件编码的完整指南》在Python文件处理的高级应用中,我们经常会遇到需要动态处理文件编码的场景,本文将深入探讨Python中动态处理文件编码的技术,有需要的小伙伴可以了解下... 目录引言一、理解python的文件编码体系1.1 Python的IO层次结构1.2 编码问题的常见场景二

Java中最全最基础的IO流概述和简介案例分析

《Java中最全最基础的IO流概述和简介案例分析》JavaIO流用于程序与外部设备的数据交互,分为字节流(InputStream/OutputStream)和字符流(Reader/Writer),处理... 目录IO流简介IO是什么应用场景IO流的分类流的超类类型字节文件流应用简介核心API文件输出流应用文

Java中字符编码问题的解决方法详解

《Java中字符编码问题的解决方法详解》在日常Java开发中,字符编码问题是一个非常常见却又特别容易踩坑的地方,这篇文章就带你一步一步看清楚字符编码的来龙去脉,并结合可运行的代码,看看如何在Java项... 目录前言背景:为什么会出现编码问题常见场景分析控制台输出乱码文件读写乱码数据库存取乱码解决方案统一使

Java实现字节字符转bcd编码

《Java实现字节字符转bcd编码》BCD是一种将十进制数字编码为二进制的表示方式,常用于数字显示和存储,本文将介绍如何在Java中实现字节字符转BCD码的过程,需要的小伙伴可以了解下... 目录前言BCD码是什么Java实现字节转bcd编码方法补充总结前言BCD码(Binary-Coded Decima