AI视频压缩的原理及未来

2023-11-08 06:30
文章标签 ai 未来 原理 视频压缩

本文主要是介绍AI视频压缩的原理及未来,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

AI 视频压缩是一场充满潜力并得到大型科技公司支持的 AI 革命。事实上,H.265 和 ProRes 等现代视频编解码器现在正受到由 AI 支持的新型智能视频压缩的挑战。这些 AI 视频编解码器不一定要压缩视频文件,而是根据上下文和参考图像重建视频文件,以便在大幅减少文件大小的情况下保持质量。

继续阅读,了解以下有关AI视频压缩的更多信息。

今天使用哪些视频编解码器?

顾名思义,编解码器实际上是 “压缩 “和 “解压 “的组合词。因为这就是编解码器的作用:压缩和解压。

视频和音频的编解码器提供 “有损 “或 “无损 “压缩。有损压缩牺牲了文件的一些数据以使文件更有效,而无损压缩则包含所有的原始数据。大多数视频编解码器都属于有损压缩。

可用的编解码器类型之间也有区别: 交付型、中间型和采集型。

交付编解码器——用于广播和播放

  • H.264 (AVC)
  • H.265 (HEVC)
  • AV1
  • VP9
  • WMV

中间编解码器——用于视频编辑

  • ProRes 422 和 4444
  • DNxHR
  • DNxHD
  • CineForm

采集编解码器——用于采集视频

  • ArriRaw
  • Blackmagic Raw
  • Redcode Raw

我们中的许多人没有意识到我们身边有多少编解码器,从电话到甚至我们消费的广播内容。事实上,看电视基本上是在实时见证压缩-解压过程。

为什么我们需要更好的视频编解码器?

我们需要更好的视频编解码器有几个原因,但主要是因为高分辨率视频文件已经变得大得离谱,而且一直在变大,部分原因是 6K、8K、甚至 12K 分辨率的内容。

从 Netflix、Amazon Prime、HBO Max 或 Disney+流式传输4K 视频也会占用大量带宽,社交媒体平台驱动的视频消费也是如此。

事实上,视频在网络世界中无处不在:

  • 全世界普通人每天观看大约84 分钟的视频。
  • 早在 2018 年,思科就预测视频将占全球所有网络流量的 82%  (当时为 75%)。
  • 到 2022 年,仅视频流就占所有移动数据消费的70% 以上。爱立信表示,到 2027 年,这一数字将增加到 80%。

以上对于视频创作者和消费者来说是个好消息,但问题是视频占用了大量空间。消费者也已经习惯于按需提供高质量视频。

最重要的是,传统的编解码器是愚蠢的,因为它们不知道自己在做什么或正在压缩什么图像——它们只是压缩和解压缩像素,仅此而已。

什么是AI视频压缩?

传统的视频压缩会删除一些视觉信息,以减小视频的整体文件大小。AI 视频压缩检查视频的内容以在更小的范围内重新创建它。换句话说,它创建了原始视频的超逼真副本。

这是因为“AI 视频压缩”是基于机器学习 (ML) 的视频压缩(有时称为神经压缩)。机器学习算法或模型学习执行任务并根据人类提供的相关训练数据(在本例中为视频资料)进行评估。

这些模型已经学会了人脸是什么样子以及如何移动的概念模式,以及更广泛的环境模式,例如“船通常出现在水上”。

事实上,目前已经存在多种 AI 视频编解码器,包括:

  • NVIDIA 的 Maxine
  • 谷歌的 VP9
  • AIVC
  • AccMPEG

让我们来看看 AI 视频压缩究竟是如何工作的。

AI 压缩的工作原理

说明 AI 视频压缩工作原理的最简单方法之一是将其视为一件矢量艺术作品。

矢量艺术是:

  • 从参考图像创建。
  • 使用数学元素重新创建图像资产。
  • 可无限扩展。

NVIDIA 的 Maxine 视频编解码器等 AI 压缩器的运行方式类似。他们使用参考图像(例如,每分钟一帧画面)来确定色彩平衡并隔离其他控制点,例如背景、前景、主体的面部和运动。

编解码器在压缩时对这些数据进行映射,然后在解压时通过一个称为重新合成的过程填补细节,对其进行重建。

为什么要这样做?

视频背景

如前所述,传统的编解码器不会对被压缩的媒体进行背景分析。他们在逐帧的水平上查看数据,看看哪些内容可以被删除而不影响整体质量。它们不知道视频中是否有说话的人、在高速公路上行驶的汽车、正在捕食的熊等等。这可能导致对其他重要数据的苛刻压缩。

带宽友好

通过只发送每一帧的基本信息,本质上是通过发送数学元素(小)而不是像素(大)——并在运行中重建帧,AI 压缩是带宽友好的并且可以无限扩展。通过这种方式,AI 编解码器与thispersondoesnotexist背后的技术并没有什么不同,它可以为不存在的人创建逼真的图像。

升级

但这些编解码器不仅仅是压缩视频;它们还可以通过其无限的可扩展性提高视频质量。由 AI 编解码器编码的视频内容可以从头开始重建,以适应任何分辨率和帧率。在这方面,AI 视频压缩很像视频升级,它使用类似的过程来提高旧视频和电影内容的质量。

视频压缩的未来是什么?

如果你想知道目前的人工智能压缩工具是否会把大多数其他编解码器推到不重要的位置,答案是: 可能不会。

首先,如果 AI 压缩重新创建图像,它会引出一个问题,新的输出是否与原始图像一样详细?这是一个常见的反对意见——但解决方案正在发挥作用。

但主要是,设备制造商总是会制作适合其用例的编解码器。大多数相机都在设备本身的 ASIC 或 FGPA 式芯片上嵌入了定制的采集编解码器。这不会很快改变,所以我们可能会一直使用 Apple 编解码器、Sony 编解码器、ARRI 编解码器、Red 编解码器和其他设备制造商的编解码器。

制造商肯定会继续这样做,因为他们以特定于相机文件格式的方式压缩相机数据。

但对于中间和交付编解码器,AI 视频压缩是一个巨大的变化,将提供天文数字的性能优势。

AI 视频压缩简述

编解码器已经存在很长时间了,但由于高分辨率视频对带宽和内存的需求不断增长,H.265 等现代编码器最近承受着巨大的压力。

这就是为什么新一代基于 AI 的编解码器可以更有效地压缩视频,通过无限可扩展性提高视频质量,并且与传统编解码器不同——意识到它们正在编码的内容,现在已经加入了竞争。

基于机器学习和深度学习技术,这些编解码器成为视频制作和后期制作工作流程中不可或缺的工具,可能只是时间问题。

本文转载自实时互动网,文章出处《AI视频压缩的原理及未来》 

这篇关于AI视频压缩的原理及未来的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/368366

相关文章

Spring Security 单点登录与自动登录机制的实现原理

《SpringSecurity单点登录与自动登录机制的实现原理》本文探讨SpringSecurity实现单点登录(SSO)与自动登录机制,涵盖JWT跨系统认证、RememberMe持久化Token... 目录一、核心概念解析1.1 单点登录(SSO)1.2 自动登录(Remember Me)二、代码分析三、

Spring AI使用tool Calling和MCP的示例详解

《SpringAI使用toolCalling和MCP的示例详解》SpringAI1.0.0.M6引入ToolCalling与MCP协议,提升AI与工具交互的扩展性与标准化,支持信息检索、行动执行等... 目录深入探索 Spring AI聊天接口示例Function CallingMCPSTDIOSSE结束语

在MySQL中实现冷热数据分离的方法及使用场景底层原理解析

《在MySQL中实现冷热数据分离的方法及使用场景底层原理解析》MySQL冷热数据分离通过分表/分区策略、数据归档和索引优化,将频繁访问的热数据与冷数据分开存储,提升查询效率并降低存储成本,适用于高并发... 目录实现冷热数据分离1. 分表策略2. 使用分区表3. 数据归档与迁移在mysql中实现冷热数据分

三频BE12000国补到手2549元! ROG 魔盒Pro WIFI7电竞AI路由器上架

《三频BE12000国补到手2549元!ROG魔盒ProWIFI7电竞AI路由器上架》近日,华硕带来了ROG魔盒ProWIFI7电竞AI路由器(ROGSTRIXGR7Pro),目前新... 华硕推出了ROG 魔盒Pro WIFI7电竞AI路由器(ROG STRIX GR7 Phttp://www.cppcn

从原理到实战深入理解Java 断言assert

《从原理到实战深入理解Java断言assert》本文深入解析Java断言机制,涵盖语法、工作原理、启用方式及与异常的区别,推荐用于开发阶段的条件检查与状态验证,并强调生产环境应使用参数验证工具类替代... 目录深入理解 Java 断言(assert):从原理到实战引言:为什么需要断言?一、断言基础1.1 语

MySQL中的表连接原理分析

《MySQL中的表连接原理分析》:本文主要介绍MySQL中的表连接原理分析,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1、背景2、环境3、表连接原理【1】驱动表和被驱动表【2】内连接【3】外连接【4编程】嵌套循环连接【5】join buffer4、总结1、背景

深度解析Spring AOP @Aspect 原理、实战与最佳实践教程

《深度解析SpringAOP@Aspect原理、实战与最佳实践教程》文章系统讲解了SpringAOP核心概念、实现方式及原理,涵盖横切关注点分离、代理机制(JDK/CGLIB)、切入点类型、性能... 目录1. @ASPect 核心概念1.1 AOP 编程范式1.2 @Aspect 关键特性2. 完整代码实

Java Stream的distinct去重原理分析

《JavaStream的distinct去重原理分析》Javastream中的distinct方法用于去除流中的重复元素,它返回一个包含过滤后唯一元素的新流,该方法会根据元素的hashcode和eq... 目录一、distinct 的基础用法与核心特性二、distinct 的底层实现原理1. 顺序流中的去重

Spring @Scheduled注解及工作原理

《Spring@Scheduled注解及工作原理》Spring的@Scheduled注解用于标记定时任务,无需额外库,需配置@EnableScheduling,设置fixedRate、fixedDe... 目录1.@Scheduled注解定义2.配置 @Scheduled2.1 开启定时任务支持2.2 创建

Spring Boot 实现 IP 限流的原理、实践与利弊解析

《SpringBoot实现IP限流的原理、实践与利弊解析》在SpringBoot中实现IP限流是一种简单而有效的方式来保障系统的稳定性和可用性,本文给大家介绍SpringBoot实现IP限... 目录一、引言二、IP 限流原理2.1 令牌桶算法2.2 漏桶算法三、使用场景3.1 防止恶意攻击3.2 控制资源