opencl 的使用例子fft。

2024-05-15 00:18
文章标签 使用 例子 fft opencl

本文主要是介绍opencl 的使用例子fft。,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

https://www.cnblogs.com/ahfuzhang/p/11083423.html

 

opencv-3.4.3\modules\core\include\opencv2\core.hpp:2157

CV_EXPORTS_W void dft(InputArray src, OutputArray dst, int flags = 0, int nonzeroRows = 0);

2.函数实现

opencv-3.4.3\modules\core\src\dxt.cpp:3315

void cv::dft( InputArray _src0, OutputArray _dst, int flags, int nonzero_rows )
{CV_INSTRUMENT_REGION()#ifdef HAVE_CLAMDFFTCV_OCL_RUN(ocl::haveAmdFft() && ocl::Device::getDefault().type() != ocl::Device::TYPE_CPU &&_dst.isUMat() && _src0.dims() <= 2 && nonzero_rows == 0,ocl_dft_amdfft(_src0, _dst, flags))
#endif#ifdef HAVE_OPENCLCV_OCL_RUN(_dst.isUMat() && _src0.dims() <= 2,ocl_dft(_src0, _dst, flags, nonzero_rows))
#endifMat src0 = _src0.getMat(), src = src0;bool inv = (flags & DFT_INVERSE) != 0;int type = src.type();int depth = src.depth();CV_Assert( type == CV_32FC1 || type == CV_32FC2 || type == CV_64FC1 || type == CV_64FC2 );// Fail if DFT_COMPLEX_INPUT is specified, but src is not 2 channels.CV_Assert( !((flags & DFT_COMPLEX_INPUT) && src.channels() != 2) );if( !inv && src.channels() == 1 && (flags & DFT_COMPLEX_OUTPUT) )_dst.create( src.size(), CV_MAKETYPE(depth, 2) );else if( inv && src.channels() == 2 && (flags & DFT_REAL_OUTPUT) )_dst.create( src.size(), depth );else_dst.create( src.size(), type );Mat dst = _dst.getMat();int f = 0;if (src.isContinuous() && dst.isContinuous())f |= CV_HAL_DFT_IS_CONTINUOUS;if (inv)f |= CV_HAL_DFT_INVERSE;if (flags & DFT_ROWS)f |= CV_HAL_DFT_ROWS;if (flags & DFT_SCALE)f |= CV_HAL_DFT_SCALE;if (src.data == dst.data)f |= CV_HAL_DFT_IS_INPLACE;Ptr<hal::DFT2D> c = hal::DFT2D::create(src.cols, src.rows, depth, src.channels(), dst.channels(), f, nonzero_rows);c->apply(src.data, src.step, dst.data, dst.step);
}

3. opencl的调用

#ifdef HAVE_OPENCLCV_OCL_RUN(_dst.isUMat() && _src0.dims() <= 2,ocl_dft(_src0, _dst, flags, nonzero_rows))
#endif

ocl的函数实现:
opencv-3.4.3\modules\core\src\dxt.cpp:2161

static bool ocl_dft(InputArray _src, OutputArray _dst, int flags, int nonzero_rows)
{int type = _src.type(), cn = CV_MAT_CN(type), depth = CV_MAT_DEPTH(type);Size ssize = _src.size();bool doubleSupport = ocl::Device::getDefault().doubleFPConfig() > 0;if (!(cn == 1 || cn == 2)|| !(depth == CV_32F || (depth == CV_64F && doubleSupport))|| ((flags & DFT_REAL_OUTPUT) && (flags & DFT_COMPLEX_OUTPUT)))return false;// if is not a multiplication of prime numbers { 2, 3, 5 }if (ssize.area() != getOptimalDFTSize(ssize.area()))return false;UMat src = _src.getUMat();bool inv = (flags & DFT_INVERSE) != 0 ? 1 : 0;if( nonzero_rows <= 0 || nonzero_rows > _src.rows() )nonzero_rows = _src.rows();bool is1d = (flags & DFT_ROWS) != 0 || nonzero_rows == 1;FftType fftType = determineFFTType(cn == 1, cn == 2,(flags & DFT_REAL_OUTPUT) != 0, (flags & DFT_COMPLEX_OUTPUT) != 0, inv);UMat output;if (fftType == C2C || fftType == R2C){// complex output_dst.create(src.size(), CV_MAKETYPE(depth, 2));output = _dst.getUMat();}else{// real outputif (is1d){_dst.create(src.size(), CV_MAKETYPE(depth, 1));output = _dst.getUMat();}else{_dst.create(src.size(), CV_MAKETYPE(depth, 1));output.create(src.size(), CV_MAKETYPE(depth, 2));}}bool result = false;if (!inv){int nonzero_cols = fftType == R2R ? output.cols/2 + 1 : output.cols;result = ocl_dft_rows(src, output, nonzero_rows, flags, fftType);if (!is1d)result = result && ocl_dft_cols(output, _dst, nonzero_cols, flags, fftType);}else{if (fftType == C2C){// complex outputresult = ocl_dft_rows(src, output, nonzero_rows, flags, fftType);if (!is1d)result = result && ocl_dft_cols(output, output, output.cols, flags, fftType);}else{if (is1d){result = ocl_dft_rows(src, output, nonzero_rows, flags, fftType);}else{int nonzero_cols = src.cols/2 + 1;result = ocl_dft_cols(src, output, nonzero_cols, flags, fftType);result = result && ocl_dft_rows(output, _dst, nonzero_rows, flags, fftType);}}}return result;
}

4.ocl_dft()里面的row/col的调用函数

函数原型:

static bool ocl_dft_rows(InputArray _src, OutputArray _dst, int nonzero_rows, int flags, int fftType)
static bool ocl_dft_cols(InputArray _src, OutputArray _dst, int nonzero_cols, int flags, int fftType)

看其中一个的源码:

static bool ocl_dft_rows(InputArray _src, OutputArray _dst, int nonzero_rows, int flags, int fftType)
{int type = _src.type(), depth = CV_MAT_DEPTH(type);Ptr<OCL_FftPlan> plan = OCL_FftPlanCache::getInstance().getFftPlan(_src.cols(), depth);return plan->enqueueTransform(_src, _dst, nonzero_rows, flags, fftType, true);
}

5.fft计算的对象池

每个确定尺寸的fft计算之前,需要建立一系列的初始化数据;如果每次计算相同尺寸都建立这些初始化数据,明显很浪费。
于是建立一个对象池,每出现一个fft计算的新尺寸,就缓存一个对象。空间换时间(但是长期运行场景要注意内存消耗)。

    Ptr<OCL_FftPlan> OCL_FftPlanCache::getFftPlan(int dft_size, int depth){int key = (dft_size << 16) | (depth & 0xFFFF);std::map<int, Ptr<OCL_FftPlan> >::iterator f = planStorage.find(key);if (f != planStorage.end()){return f->second;}else{Ptr<OCL_FftPlan> newPlan = Ptr<OCL_FftPlan>(new OCL_FftPlan(dft_size, depth));planStorage[key] = newPlan;return newPlan;}}

6. fft对象

opencv-3.4.3\modules\core\src\dxt.cpp:1881
struct OCL_FftPlan
初始化在构造函数:OCL_FftPlan(int _size, int _depth)
计算使用这个方法: bool enqueueTransform(InputArray _src, OutputArray _dst, int num_dfts, int flags, int fftType, bool rows = true) const
方法的主要代码是构造核函数的编译参数。

6.1 opencl核函数的编译、绑定参数、执行

enqueueTransform()方法的核心代码如下:

        ocl::Kernel k(kernel_name.c_str(), ocl::core::fft_oclsrc, options);if (k.empty())return false;k.args(ocl::KernelArg::ReadOnly(src), ocl::KernelArg::WriteOnly(dst), ocl::KernelArg::ReadOnlyNoSize(twiddles), thread_count, num_dfts);return k.run(2, globalsize, localsize, false);

ocl::Kernel 对象用于编译opencl的核函数。
ocl::KernelArg 用于绑定核函数的执行参数。
k.run() 执行核函数。

6.2 核函数的定义

ocl::core::fft_oclsrc 这个常量对象定义了核函数的源码,搜索了所有的.h, .hpp, .cpp都没有找到定义。
源码这部分代码是编译过程生成的。
定义在:
opencv-3.4.3/build/modules/core/opencl_kernels_core.hpp:21

extern struct cv::ocl::internal::ProgramEntry fft_oclsrc;

实现在:
opencv-3.4.3/build/modules/core/opencl_kernels_core.cpp:770

struct cv::ocl::internal::ProgramEntry fft_oclsrc={moduleName, "fft",
"#define SQRT_2 0.707106781188f\n"

看来只是用一个脚本,把opencl的核函数代码转换成为C++字符串而已。

6.3 核函数的定义文件

最终找到opencl fft的核函数的文件:
opencv-3.4.3\modules\core\src\opencl\fft.cl

这里有一个明显的问题,核函数每次调用都要编译一次。并未看见哪里缓存了编译的结果。

7.cv::dft()可能的优化点

  • 每次调用核函数都要编译,应该缓存ocl::Kernel对象
  • 把C函数的风格修改为面向对象风格,把UMat数据upload/核函数运行/UMat数据download等部分都加入异步队列。使得连续计算多个dft()的时候,可以避免CPU等待GPU的结果。

这篇关于opencl 的使用例子fft。的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/990261

相关文章

Spring IoC 容器的使用详解(最新整理)

《SpringIoC容器的使用详解(最新整理)》文章介绍了Spring框架中的应用分层思想与IoC容器原理,通过分层解耦业务逻辑、数据访问等模块,IoC容器利用@Component注解管理Bean... 目录1. 应用分层2. IoC 的介绍3. IoC 容器的使用3.1. bean 的存储3.2. 方法注

Python内置函数之classmethod函数使用详解

《Python内置函数之classmethod函数使用详解》:本文主要介绍Python内置函数之classmethod函数使用方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地... 目录1. 类方法定义与基本语法2. 类方法 vs 实例方法 vs 静态方法3. 核心特性与用法(1编程客

Linux中压缩、网络传输与系统监控工具的使用完整指南

《Linux中压缩、网络传输与系统监控工具的使用完整指南》在Linux系统管理中,压缩与传输工具是数据备份和远程协作的桥梁,而系统监控工具则是保障服务器稳定运行的眼睛,下面小编就来和大家详细介绍一下它... 目录引言一、压缩与解压:数据存储与传输的优化核心1. zip/unzip:通用压缩格式的便捷操作2.

使用Python实现可恢复式多线程下载器

《使用Python实现可恢复式多线程下载器》在数字时代,大文件下载已成为日常操作,本文将手把手教你用Python打造专业级下载器,实现断点续传,多线程加速,速度限制等功能,感兴趣的小伙伴可以了解下... 目录一、智能续传:从崩溃边缘抢救进度二、多线程加速:榨干网络带宽三、速度控制:做网络的好邻居四、终端交互

Python中注释使用方法举例详解

《Python中注释使用方法举例详解》在Python编程语言中注释是必不可少的一部分,它有助于提高代码的可读性和维护性,:本文主要介绍Python中注释使用方法的相关资料,需要的朋友可以参考下... 目录一、前言二、什么是注释?示例:三、单行注释语法:以 China编程# 开头,后面的内容为注释内容示例:示例:四

Go语言数据库编程GORM 的基本使用详解

《Go语言数据库编程GORM的基本使用详解》GORM是Go语言流行的ORM框架,封装database/sql,支持自动迁移、关联、事务等,提供CRUD、条件查询、钩子函数、日志等功能,简化数据库操作... 目录一、安装与初始化1. 安装 GORM 及数据库驱动2. 建立数据库连接二、定义模型结构体三、自动迁

ModelMapper基本使用和常见场景示例详解

《ModelMapper基本使用和常见场景示例详解》ModelMapper是Java对象映射库,支持自动映射、自定义规则、集合转换及高级配置(如匹配策略、转换器),可集成SpringBoot,减少样板... 目录1. 添加依赖2. 基本用法示例:简单对象映射3. 自定义映射规则4. 集合映射5. 高级配置匹

Spring 框架之Springfox使用详解

《Spring框架之Springfox使用详解》Springfox是Spring框架的API文档工具,集成Swagger规范,自动生成文档并支持多语言/版本,模块化设计便于扩展,但存在版本兼容性、性... 目录核心功能工作原理模块化设计使用示例注意事项优缺点优点缺点总结适用场景建议总结Springfox 是

嵌入式数据库SQLite 3配置使用讲解

《嵌入式数据库SQLite3配置使用讲解》本文强调嵌入式项目中SQLite3数据库的重要性,因其零配置、轻量级、跨平台及事务处理特性,可保障数据溯源与责任明确,详细讲解安装配置、基础语法及SQLit... 目录0、惨痛教训1、SQLite3环境配置(1)、下载安装SQLite库(2)、解压下载的文件(3)、

使用Python绘制3D堆叠条形图全解析

《使用Python绘制3D堆叠条形图全解析》在数据可视化的工具箱里,3D图表总能带来眼前一亮的效果,本文就来和大家聊聊如何使用Python实现绘制3D堆叠条形图,感兴趣的小伙伴可以了解下... 目录为什么选择 3D 堆叠条形图代码实现:从数据到 3D 世界的搭建核心代码逐行解析细节优化应用场景:3D 堆叠图