FFMPEG下利用Intel VPP_QSV插件实现基于GPU的图像缩放和色彩空间转换 (二) - C++代码实现

本文主要是介绍FFMPEG下利用Intel VPP_QSV插件实现基于GPU的图像缩放和色彩空间转换 (二) - C++代码实现,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

前面一篇文章弄清楚了VPP_QSV插件的ffmpeg命令行命令,下面开始用C++代码实现VPP_QSV插件的C++代码实现。

 

C++使用滤镜的流程可以参考雷神的文章

最简单的基于FFmpeg的AVfilter的例子-纯净版

基本的流程如图

 

网上讨论FFMPEG硬件加速滤镜编程的文章不算太多,大概是基于GPU硬件的滤镜太依赖硬件导致用的人不多,所以大多数是讨论基于软件滤镜插件的实现方法和过程。硬件滤镜的实现的方法基本类似,但是有2个地方是不一样的。

  1. 硬件滤镜里分配frame buffer需要在显存里分配,所以涉及到要处理AVCodecContext结构体的2个硬件相关的成员变量 hw_device_ctx和hw_frames_ctx,需要按照要求把他们传给对应的filter
  2. 初始化滤镜的位置必须要在ffmpeg解出第一个视频帧以后才能初始化,因为qsv解码器是在第一次调用avcodec_send_packet()后开始解码video frame时才会用callback函数的方式在里面设置有效的hw_frames_ctx,这部分代码之后才能获取正确的hw_frames_ctx并把它传给滤镜的输入端"buffer"。

 

所以在使用Intel QSV硬件加速滤镜的流程就变成了 (Nvidia GPU的硬件加速滤镜流程和Intel的不一样,所以本文没有参考意义), 其中红色的模块为改动部分

 

流程中的关键函数如下所示:

get_format() 这个是QSV硬件解码时的回调函数,在这里初始化hw_frames_ctx, 一般在开始解码流时会被调用一次

init_filter()  这个在get_format()被调用后才能正常初始话,如果按照雷神的流程在程序开始就初始化会碰到各种各样的错误,怀疑vpp_qsv的初始话需要在qsv decoder初始化之后(个人猜的,代码实在太多了,看不下去)。

av_buffersrc_parameters_set(buffersrc_ctx, ...) 需要把qsv decoder的hw_frames_ctx传给buffersrc滤镜

 

整个代码修改自FFMPEG官方的例程https://github.com/FFmpeg/FFmpeg/blob/master/doc/examples/qsvdec.c

代码里vpp_qsv的设置

//不管原始视频分辨率是多少,一律缩放到1024x768
const char *filter_descr = "vpp_qsv=w=1024:h=768";

代码里主循环部分

//主循环部分,从码流里读一个frame的数据,decode_packet负责解码,如果解出了图像帧则got_frame为1/* actual decoding */while (ret >= 0) {ret = av_read_frame(input_ctx, &pkt);//std::cout << "read_frame" << std::endl;if (ret < 0)break;if (pkt.stream_index == video_st->index){//std::cout << "  -- video_frame" << std::endl;//ret = decode_packet(&decode, decoder_ctx, frame, sw_frame, &pkt, output_ctx);ret = decode_packet(decoder_ctx, frame, &got_frame, &pkt);if (got_frame){//第一次解出图像帧时会初始化一次滤镜if (!filter_ctx->initiallized) {//init buffer/buffersink and vpp filter hereret = init_filter(filter_ctx,filter_ctx->dec_ctx, filter_descr);if (ret < 0)return ret;}//pts is only used for encodingframe->pts = av_frame_get_best_effort_timestamp(frame);//直接显示decode_packet返回的frame, 这是解码器输出的nv12原始数据//display_qsv_frame(frame, sw_frame);ret = get_filtered_frame(frame, filt_frame);//显示滤镜输出的filt_frame,这是硬件做缩放后的nv12数据ret = display_qsv_frame(filt_frame, sw_frame);frm_counter++;av_frame_unref(frame);av_frame_unref(filt_frame);}//std::cout << "  -- frm_counter = " << frm_counter << std::endl;}else{std::cout << "  -------- other_frame" << std::endl;}av_packet_unref(&pkt);}

 

初始化滤镜函数

static int init_filter(FilteringContext* fctx, AVCodecContext *dec_ctx, const char *filter_spec)
{char args[512];int ret = 0;AVFilter *buffersrc = NULL;AVFilter *buffersink = NULL;AVFilterContext *buffersrc_ctx = NULL;AVFilterContext *buffersink_ctx = NULL;AVFilterInOut *outputs = avfilter_inout_alloc();AVFilterInOut *inputs = avfilter_inout_alloc();AVFilterGraph *filter_graph = avfilter_graph_alloc();if (!outputs || !inputs || !filter_graph) {ret = AVERROR(ENOMEM);goto end;}if (dec_ctx->codec_type == AVMEDIA_TYPE_VIDEO) {buffersrc = (AVFilter *)avfilter_get_by_name("buffer");buffersink = (AVFilter *)avfilter_get_by_name("buffersink");if (!buffersrc || !buffersink) {av_log(NULL, AV_LOG_ERROR, "filtering source or sink element not found\n");ret = AVERROR_UNKNOWN;goto end;}snprintf(args, sizeof(args),"video_size=%dx%d:pix_fmt=%d:time_base=%d/%d:pixel_aspect=%d/%d"":frame_rate=%d/%d",dec_ctx->width, dec_ctx->height, AV_PIX_FMT_QSV, // dec_ctx->pix_fmt,dec_ctx->time_base.num, dec_ctx->time_base.den,dec_ctx->sample_aspect_ratio.num,dec_ctx->sample_aspect_ratio.den,dec_ctx->framerate.num, dec_ctx->framerate.den);ret = avfilter_graph_create_filter(&buffersrc_ctx, buffersrc, "in",args, NULL, filter_graph);if (ret < 0) {av_log(NULL, AV_LOG_ERROR, "Cannot create buffer source\n");goto end;}//这里比初始化软件滤镜多的一步,将hw_frames_ctx传给buffersrc, 这样buffersrc就知道传给它的是硬件解码器,数据在显存内if (dec_ctx->hw_frames_ctx) {AVBufferSrcParameters *par = av_buffersrc_parameters_alloc();par->hw_frames_ctx = dec_ctx->hw_frames_ctx;ret = av_buffersrc_parameters_set(buffersrc_ctx, par);av_freep(&par);if (ret < 0)goto end;}ret = avfilter_graph_create_filter(&buffersink_ctx, buffersink, "out",NULL, NULL, filter_graph);if (ret < 0) {av_log(NULL, AV_LOG_ERROR, "Cannot create buffer sink\n");goto end;}}else {ret = AVERROR_UNKNOWN;goto end;}/* Endpoints for the filter graph. */outputs->name = av_strdup("in");outputs->filter_ctx = buffersrc_ctx;outputs->pad_idx = 0;outputs->next = NULL;inputs->name = av_strdup("out");inputs->filter_ctx = buffersink_ctx;inputs->pad_idx = 0;inputs->next = NULL;if (!outputs->name || !inputs->name) {ret = AVERROR(ENOMEM);goto end;}if ((ret = avfilter_graph_parse_ptr(filter_graph, filter_spec,&inputs, &outputs, NULL)) < 0)goto end;if ((ret = avfilter_graph_config(filter_graph, NULL)) < 0)goto end;/* Fill FilteringContext */fctx->buffersrc_ctx = buffersrc_ctx;fctx->buffersink_ctx = buffersink_ctx;fctx->filter_graph = filter_graph;fctx->initiallized = 1;end:avfilter_inout_free(&inputs);avfilter_inout_free(&outputs);return ret;
}

 

运行程序,可以看到不论视频文件分辨率是多少,显示的视频分辨率始终是1024x768, 此时可以看到GPU的占用率,说明解码和缩放都走的是Intel集成显卡硬件。对比传统的硬件解码后调用av_hwframe_transfer_data()读出原始视频数据后再用sws_scale()来做软件缩放并显示,在原始视频是高分辨率时性能提升明显,因为av_hwframe_transfer_data()读原始视频数据时占用了大量的CPU时间和资源, 而使用vpp_qsv滤镜缩放后,从GPU读出视频帧数据的分辨率始终为1024x768。 另外如果使用上篇文章里修改过的FFMPEG库,vpp_qsv还可以顺便把NV12数据转成RGB32, 这样CPU连YUV2RGB都可以省了,直接显示RGB32数据或者简单的把RGB32转成RGB24(NCHW)格式就可以丢给OpenVINO做基于CPU的推理了

 

最后完整项目奉上,仅供参考 https://gitee.com/tisandman/qsv_dec

这篇关于FFMPEG下利用Intel VPP_QSV插件实现基于GPU的图像缩放和色彩空间转换 (二) - C++代码实现的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/300999

相关文章

基于Python Playwright进行前端性能测试的脚本实现

《基于PythonPlaywright进行前端性能测试的脚本实现》在当今Web应用开发中,性能优化是提升用户体验的关键因素之一,本文将介绍如何使用Playwright构建一个自动化性能测试工具,希望... 目录引言工具概述整体架构核心实现解析1. 浏览器初始化2. 性能数据收集3. 资源分析4. 关键性能指

使用Redis快速实现共享Session登录的详细步骤

《使用Redis快速实现共享Session登录的详细步骤》在Web开发中,Session通常用于存储用户的会话信息,允许用户在多个页面之间保持登录状态,Redis是一个开源的高性能键值数据库,广泛用于... 目录前言实现原理:步骤:使用Redis实现共享Session登录1. 引入Redis依赖2. 配置R

SpringBoot实现RSA+AES自动接口解密的实战指南

《SpringBoot实现RSA+AES自动接口解密的实战指南》在当今数据泄露频发的网络环境中,接口安全已成为开发者不可忽视的核心议题,RSA+AES混合加密方案因其安全性高、性能优越而被广泛采用,本... 目录一、项目依赖与环境准备1.1 Maven依赖配置1.2 密钥生成与配置二、加密工具类实现2.1

在Java中实现线程之间的数据共享的几种方式总结

《在Java中实现线程之间的数据共享的几种方式总结》在Java中实现线程间数据共享是并发编程的核心需求,但需要谨慎处理同步问题以避免竞态条件,本文通过代码示例给大家介绍了几种主要实现方式及其最佳实践,... 目录1. 共享变量与同步机制2. 轻量级通信机制3. 线程安全容器4. 线程局部变量(ThreadL

python使用Akshare与Streamlit实现股票估值分析教程(图文代码)

《python使用Akshare与Streamlit实现股票估值分析教程(图文代码)》入职测试中的一道题,要求:从Akshare下载某一个股票近十年的财务报表包括,资产负债表,利润表,现金流量表,保存... 目录一、前言二、核心知识点梳理1、Akshare数据获取2、Pandas数据处理3、Matplotl

Django开发时如何避免频繁发送短信验证码(python图文代码)

《Django开发时如何避免频繁发送短信验证码(python图文代码)》Django开发时,为防止频繁发送验证码,后端需用Redis限制请求频率,结合管道技术提升效率,通过生产者消费者模式解耦业务逻辑... 目录避免频繁发送 验证码1. www.chinasem.cn避免频繁发送 验证码逻辑分析2. 避免频繁

分布式锁在Spring Boot应用中的实现过程

《分布式锁在SpringBoot应用中的实现过程》文章介绍在SpringBoot中通过自定义Lock注解、LockAspect切面和RedisLockUtils工具类实现分布式锁,确保多实例并发操作... 目录Lock注解LockASPect切面RedisLockUtils工具类总结在现代微服务架构中,分布

Java使用Thumbnailator库实现图片处理与压缩功能

《Java使用Thumbnailator库实现图片处理与压缩功能》Thumbnailator是高性能Java图像处理库,支持缩放、旋转、水印添加、裁剪及格式转换,提供易用API和性能优化,适合Web应... 目录1. 图片处理库Thumbnailator介绍2. 基本和指定大小图片缩放功能2.1 图片缩放的

精选20个好玩又实用的的Python实战项目(有图文代码)

《精选20个好玩又实用的的Python实战项目(有图文代码)》文章介绍了20个实用Python项目,涵盖游戏开发、工具应用、图像处理、机器学习等,使用Tkinter、PIL、OpenCV、Kivy等库... 目录① 猜字游戏② 闹钟③ 骰子模拟器④ 二维码⑤ 语言检测⑥ 加密和解密⑦ URL缩短⑧ 音乐播放

Python使用Tenacity一行代码实现自动重试详解

《Python使用Tenacity一行代码实现自动重试详解》tenacity是一个专为Python设计的通用重试库,它的核心理念就是用简单、清晰的方式,为任何可能失败的操作添加重试能力,下面我们就来看... 目录一切始于一个简单的 API 调用Tenacity 入门:一行代码实现优雅重试精细控制:让重试按我