音视频学习–关于绿屏的6种检测方案

2023-10-29 18:50

本文主要是介绍音视频学习–关于绿屏的6种检测方案,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1. 问题背景

最近和网友聊天时被问道绿屏问题,类似这样的效果:

本文福利, 免费领取C++音视频学习资料包、技术视频/代码,内容包括(音视频开发,面试题,FFmpeg ,webRTC ,rtmp ,hls ,rtsp ,ffplay ,编解码,推拉流,srs)↓↓↓↓↓↓见下面↓↓文章底部点击免费领取↓↓

2. 问题分析

其实绿屏本质就是yuv数据为0了,导致yuv转换为rgb时候成为全绿的颜色。

其实绿屏本质就是yuv数据为0了,导致yuv转换为rgb时候成为全绿的颜色。

YUV和RGB的转换:Y = 0.299 R + 0.587 G + 0.114 BU = -0.1687 R - 0.3313 G + 0.5 B + 128V = 0.5 R - 0.4187 G - 0.0813 B + 128R = Y + 1.402 (V-128)G= Y - 0.34414 (U-128) - 0.71414 (V-128)B= Y + 1.772 (U-128)

如果将yuv都是0带入到上面公式:

R = 1.402 * (-128) = -126.598G = -0.34414(-128) - 0.71414(-128) = 44.04992 + 91.40992 = 135.45984B = 1.772 * (-128) = -126.228

差不多就是R = -126, G = 135, B = -126
其中RGB有取值范围, 都是[0, 255]
所以最后就是R=0, G=135, B=0
查看颜色表:rgb(0,135,0) 差不多就是绿色

而我们解码时yuv初始化就是默认都是0值,这个就是绿屏的显示主要原因。

所以我们要解决绿屏问题主要两个方向:

(1)yuv数据为0时,不显示绿屏,而显示黑屏

(2)排查解码失败的原因。

其中第二个原因由于部分是平台硬解,特别是解码问题需要厂商硬件支持,如果没有软硬件配合,就无法解决问题。但是硬件方面通常涉及到很多问题,需要与厂商沟通和合作,因此这个过程可能需要一定的时间。所以优先从yuv检测着手进行:

之前和小伙伴讨论,可以检测yuv数据是否全0值来判断:如果输入的YUV数据中确实包含了像素值为0的情况,那么检测数据是否全0值可能有一定的参考价值。例如,如果一个视频帧中所有像素的亮度、色度和红色通道的值都为0,则该视频帧可能被视为无效或不良的帧。

3. 解决方案

3.1. opencv检测

针对该问题和新来的小伙伴讨论了一下,他们公司之前也有类似检测机制,不过他们的检测是在opencv中完成的,

具体实现如下:

  • 将输入图像从YUV色彩空间转换到BGR色彩空间。
  • 选取图像中心区域(100×100像素),并计算其中绿色像素的数量。
  • 计算绿色像素占总像素数的比例,并与阈值0.8进行比较。如果大于阈值,则判定输入图像为绿屏图像。
  • 如果判定为绿屏图像,则输出日志信息并返回true;否则返回false。

其相关代码如下:

3.2. 图像全域检测

针对一帧图像,一次判断每个像素点的值,如果全零或者一定阈值个数为0,即判断该帧图像为绿屏帧,进行丢弃,相关代码:

这个方法检测效率太低了,一帧图像需要几百毫秒,不满足实时性要求,所以增加一个阈值500,达到阈值之后就判断为绿屏,相关代码如下:

该方案原则上要检测所有图像数据,大概需要检测500左右个像素。

然后这个方法也有缺陷,如果绿屏刚好在500个像素之后才发生呢?就无法起到检测后面绿屏的视频帧了。

3.3. 固定角落检测

针对上述问题进行改进:依次判断左上,右上,左下,右下,边长为10的正方形的数据,对于每个正方形,使用两重循环遍历像素,并计算出在一维数据中的索引。然后判断该索引处的像素值即可。该方法可以大幅度提升检测的效率。仅需要检测400个像素点即可。

3.4 四角检测优化版

后来我们在四角监测机制上又做了改进:涉及4个角落,10*10的正方向,上述算法检测效率太低了,所以增加了一个改进型的4角检测机制,目前检测仅需要100个像素点即可。

3.5 随机检测

为了减少检测像素的数量,想到可以用随机检测两个10*10正方向的方案进行 ,相关代码如下:

虽然现在仅需要检测200个像素点即可,但是经过讨论该方案可能存在一定缺陷:

如果随机的两个正方向都在某半部分,而绿屏是在另外部分,那检测就会失效了,例如:

3.6 增强随机检测

在上面问题基础上,重新优化了一轮:将一帧图像划分为两部分,上下各一半;然后在其中一般随机选择10*10的部分进行检测,相关代码如下:

 

4. 问题总结

针对一个问题,我们可以采用不同的方案来解决它。为了提高方案的效率和健壮性,我们可以执行以下步骤:

  1. 分析问题:对于一个问题,我们需要深入分析其特性、难点和局限性等,以便确定合适的解决方案。在分析过程中,可以考虑使用实验、模拟、仿真、数据分析等方法来验证和评估不同方案的优缺点。
  2. 设计和测试方案:基于分析结果,设计出可行的解决方案,并进行测试和评估。在测试时,可以采用一些标准测试用例或者真实场景数据来模拟和检测不同方案的性能和功能。
  3. 优化方案:基于测试结果,对不同方案进行优化和改进,以提高方案的效率和健壮性。优化方案的方法包括但不限于算法优化、代码优化、并行化等。
  4. 多种方案比较:最终,我们需要比较不同方案的性能、可靠性、扩展性、可维护性等指标,并选择最佳的解决方案。比较时,还需要结合实际应用场景和需求来进行判断和权衡。

本文福利, 免费领取C++音视频学习资料包、技术视频/代码,内容包括(音视频开发,面试题,FFmpeg ,webRTC ,rtmp ,hls ,rtsp ,ffplay ,编解码,推拉流,srs)↓↓↓↓↓↓见下面↓↓文章底部点击免费领取↓↓

这篇关于音视频学习–关于绿屏的6种检测方案的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/302655

相关文章

防止Linux rm命令误操作的多场景防护方案与实践

《防止Linuxrm命令误操作的多场景防护方案与实践》在Linux系统中,rm命令是删除文件和目录的高效工具,但一旦误操作,如执行rm-rf/或rm-rf/*,极易导致系统数据灾难,本文针对不同场景... 目录引言理解 rm 命令及误操作风险rm 命令基础常见误操作案例防护方案使用 rm编程 别名及安全删除

Python实现批量CSV转Excel的高性能处理方案

《Python实现批量CSV转Excel的高性能处理方案》在日常办公中,我们经常需要将CSV格式的数据转换为Excel文件,本文将介绍一个基于Python的高性能解决方案,感兴趣的小伙伴可以跟随小编一... 目录一、场景需求二、技术方案三、核心代码四、批量处理方案五、性能优化六、使用示例完整代码七、小结一、

C#使用Spire.Doc for .NET实现HTML转Word的高效方案

《C#使用Spire.Docfor.NET实现HTML转Word的高效方案》在Web开发中,HTML内容的生成与处理是高频需求,然而,当用户需要将HTML页面或动态生成的HTML字符串转换为Wor... 目录引言一、html转Word的典型场景与挑战二、用 Spire.Doc 实现 HTML 转 Word1

使用Python实现Word文档的自动化对比方案

《使用Python实现Word文档的自动化对比方案》我们经常需要比较两个Word文档的版本差异,无论是合同修订、论文修改还是代码文档更新,人工比对不仅效率低下,还容易遗漏关键改动,下面通过一个实际案例... 目录引言一、使用python-docx库解析文档结构二、使用difflib进行差异比对三、高级对比方

Unity新手入门学习殿堂级知识详细讲解(图文)

《Unity新手入门学习殿堂级知识详细讲解(图文)》Unity是一款跨平台游戏引擎,支持2D/3D及VR/AR开发,核心功能模块包括图形、音频、物理等,通过可视化编辑器与脚本扩展实现开发,项目结构含A... 目录入门概述什么是 UnityUnity引擎基础认知编辑器核心操作Unity 编辑器项目模式分类工程

Python脚本轻松实现检测麦克风功能

《Python脚本轻松实现检测麦克风功能》在进行音频处理或开发需要使用麦克风的应用程序时,确保麦克风功能正常是非常重要的,本文将介绍一个简单的Python脚本,能够帮助我们检测本地麦克风的功能,需要的... 目录轻松检测麦克风功能脚本介绍一、python环境准备二、代码解析三、使用方法四、知识扩展轻松检测麦

Python多线程应用中的卡死问题优化方案指南

《Python多线程应用中的卡死问题优化方案指南》在利用Python语言开发某查询软件时,遇到了点击搜索按钮后软件卡死的问题,本文将简单分析一下出现的原因以及对应的优化方案,希望对大家有所帮助... 目录问题描述优化方案1. 网络请求优化2. 多线程架构优化3. 全局异常处理4. 配置管理优化优化效果1.

Python学习笔记之getattr和hasattr用法示例详解

《Python学习笔记之getattr和hasattr用法示例详解》在Python中,hasattr()、getattr()和setattr()是一组内置函数,用于对对象的属性进行操作和查询,这篇文章... 目录1.getattr用法详解1.1 基本作用1.2 示例1.3 原理2.hasattr用法详解2.

MySQL容灾备份的实现方案

《MySQL容灾备份的实现方案》进行MySQL的容灾备份是确保数据安全和业务连续性的关键步骤,容灾备份可以分为本地备份和远程备份,主要包括逻辑备份和物理备份两种方式,下面就来具体介绍一下... 目录一、逻辑备份1. 使用mysqldump进行逻辑备份1.1 全库备份1.2 单库备份1.3 单表备份2. 恢复

redis中session会话共享的三种方案

《redis中session会话共享的三种方案》本文探讨了分布式系统中Session共享的三种解决方案,包括粘性会话、Session复制以及基于Redis的集中存储,具有一定的参考价值,感兴趣的可以了... 目录三种解决方案粘性会话(Sticky Sessions)Session复制Redis统一存储Spr