折腾你的浏览器 —— 把10000x10000的图片无损压缩到200字节!

2024-06-19 21:18

本文主要是介绍折腾你的浏览器 —— 把10000x10000的图片无损压缩到200字节!,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

  别紧张别怀疑,楼主可不是在故弄玄虚忽悠人:)事实上这还不是最小的!小弟先抛个砖,希望大家继续探索。

  本文没有耍一点花招,都是最最基础的技术。即使是再菜的菜鸟也知道,想把一亿像素的照片保存进几百字节那是完全不可能的,更何况还是无损。事实上呢也的确不可能,因为本文标题里没说是照片,而是图片,毫无实际内容的图片:)

  

  但也必须是标准的,通用的,能被各种浏览器识别的图片(PNG,GIF,JPG...)。自己代码定义的当然是不能算的~

  
  大家平时也遇到过,一些截图保存成png格式会小很多很多,而且画质完全没变。原因很简单,图片里的颜色数少,而且有大量的重复空白。经过zip压缩之后,相同二进制数据都被合并掉了,产生冗余很小的数据。而且是无损压缩,所以画质不会下降。

  所以现在来创建一个重复数据特别多的图,由于本人没有深入研究过zip的具体实现,不知道怎样才算冗余最大的数据,希望哪位懂的大虾不吝赐教。不过可以肯定的是,一张纯色图片冗余是非常大的。为了简单,用画笔创建一个10000x10000位图,随便填充个颜色,保存。MyGod, 286M!(其实再大点也没问题,但一些程序就不认了)

  然后用大名鼎鼎的工具pngout狠狠的压。一杯茶的工夫完事了。。。变成200字节了?当然是————不可能滴。不过成绩也不错:11.9k。小了20000多倍,还是灰常牛X滴~

  不过这280M的图片里99.9999%以上都是同样的内容,真正的内容仅仅是几十字节文件头而已,结果仍有10多k,多少有些不甘心。但光有文件头,没有实际数据内容,图片也是不能被识别的。也许对于deflate这样的压缩算法,已经是竭尽全力了。会不会在这11.9k的数据里,仍然有很大的冗余?一般来说,经过压缩的文件再压是毫无意义的,甚至还会变大。

  不过对于一颗超新星来说,即使坍塌了几万倍也远没达到致密状态,只有黑洞才是它真正的目标。

  但图片内部只能压缩一次,讨论继续压缩有何意义呢?别忘了,这不是一般的图片,这是一张放在网络上的图片。也许你早就想到了,在网络传输的时候,我们可以使用gzip再压缩一次!

  这一压不得了,一颗真正的黑洞诞生了 ———— 202字节!

  这202字节要是挥发出来有多可怕呢?如果将它嵌在贴吧论坛的贴图里,仅仅一个就可以吃到300M的内存!多嵌几张那就更多了- -

  

  2012062214150378.png

  

  开头也说了,这还不是极限。这仅仅是利用现成工具创造的,如果能分析了解deflate算法中的细节,那肯定能创造更致密的黑洞!!!

  由于图片尺寸巨大,就不嵌在本文内了。可以去这里预览:
    http://www.etherdream.com/Test/blackhole.html

  最终压缩的文件:
    http://www.etherdream.com/Test/blackhole.png.gz

  

  当然,即使几百M的内存消耗,对于目前动辄数G内存的电脑来说可以完全无视。不过能做一个有几千倍压缩率的zip文件的话,就可以做恶作剧了:用户访问了论坛里某个几百k的内嵌图片后,硬盘里留下了几百M的缓存文件!这算不算是恶意破坏呢?

这篇关于折腾你的浏览器 —— 把10000x10000的图片无损压缩到200字节!的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1076170

相关文章

python运用requests模拟浏览器发送请求过程

《python运用requests模拟浏览器发送请求过程》模拟浏览器请求可选用requests处理静态内容,selenium应对动态页面,playwright支持高级自动化,设置代理和超时参数,根据需... 目录使用requests库模拟浏览器请求使用selenium自动化浏览器操作使用playwright

Python获取浏览器Cookies的四种方式小结

《Python获取浏览器Cookies的四种方式小结》在进行Web应用程序测试和开发时,获取浏览器Cookies是一项重要任务,本文我们介绍四种用Python获取浏览器Cookies的方式,具有一定的... 目录什么是 Cookie?1.使用Selenium库获取浏览器Cookies2.使用浏览器开发者工具

基于Python实现一个图片拆分工具

《基于Python实现一个图片拆分工具》这篇文章主要为大家详细介绍了如何基于Python实现一个图片拆分工具,可以根据需要的行数和列数进行拆分,感兴趣的小伙伴可以跟随小编一起学习一下... 简单介绍先自己选择输入的图片,默认是输出到项目文件夹中,可以自己选择其他的文件夹,选择需要拆分的行数和列数,可以通过

浏览器插件cursor实现自动注册、续杯的详细过程

《浏览器插件cursor实现自动注册、续杯的详细过程》Cursor简易注册助手脚本通过自动化邮箱填写和验证码获取流程,大大简化了Cursor的注册过程,它不仅提高了注册效率,还通过友好的用户界面和详细... 目录前言功能概述使用方法安装脚本使用流程邮箱输入页面验证码页面实战演示技术实现核心功能实现1. 随机

利用Python脚本实现批量将图片转换为WebP格式

《利用Python脚本实现批量将图片转换为WebP格式》Python语言的简洁语法和库支持使其成为图像处理的理想选择,本文将介绍如何利用Python实现批量将图片转换为WebP格式的脚本,WebP作为... 目录简介1. python在图像处理中的应用2. WebP格式的原理和优势2.1 WebP格式与传统

如何在Mac上彻底删除Edge账户? 手动卸载Edge浏览器并清理残留文件技巧

《如何在Mac上彻底删除Edge账户?手动卸载Edge浏览器并清理残留文件技巧》Mac上的Edge账户里存了不少网站密码和个人信息,结果同事一不小心打开了,简直尴尬到爆炸,想要卸载edge浏览器并清... 如果你遇到 Microsoft Edge 浏览器运行迟缓、频繁崩溃或网页加载异常等问题,可以尝试多种方

Python如何将OpenCV摄像头视频流通过浏览器播放

《Python如何将OpenCV摄像头视频流通过浏览器播放》:本文主要介绍Python如何将OpenCV摄像头视频流通过浏览器播放的问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完... 目录方法1:使用Flask + MJPEG流实现代码使用方法优点缺点方法2:使用WebSocket传输视

基于 HTML5 Canvas 实现图片旋转与下载功能(完整代码展示)

《基于HTML5Canvas实现图片旋转与下载功能(完整代码展示)》本文将深入剖析一段基于HTML5Canvas的代码,该代码实现了图片的旋转(90度和180度)以及旋转后图片的下载... 目录一、引言二、html 结构分析三、css 样式分析四、JavaScript 功能实现一、引言在 Web 开发中,

Python如何去除图片干扰代码示例

《Python如何去除图片干扰代码示例》图片降噪是一个广泛应用于图像处理的技术,可以提高图像质量和相关应用的效果,:本文主要介绍Python如何去除图片干扰的相关资料,文中通过代码介绍的非常详细,... 目录一、噪声去除1. 高斯噪声(像素值正态分布扰动)2. 椒盐噪声(随机黑白像素点)3. 复杂噪声(如伪

Python中图片与PDF识别文本(OCR)的全面指南

《Python中图片与PDF识别文本(OCR)的全面指南》在数据爆炸时代,80%的企业数据以非结构化形式存在,其中PDF和图像是最主要的载体,本文将深入探索Python中OCR技术如何将这些数字纸张转... 目录一、OCR技术核心原理二、python图像识别四大工具库1. Pytesseract - 经典O