昇腾 - AscendCL C++应用开发 Host与Device的数据传输 函数的封装

2024-08-22 03:12

本文主要是介绍昇腾 - AscendCL C++应用开发 Host与Device的数据传输 函数的封装,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

昇腾 - AscendCL C++应用开发 Host与Device的数据传输 函数的封装

flyfish

aclrtGetRunMode

函数功能:获取当前昇腾AI软件栈的运行模式。
aclError aclrtGetRunMode(aclrtRunMode *runMode)

参数说明:runMode 运行模式的指针。
ACL_DEVICE:昇腾AI软件栈运行在Device的Control CPU或板端环境上。

Atlas 训练系列产品,Atlas A2训练系列产品/Atlas 800I A2推理产品,不支持该选项。

ACL_HOST:昇腾AI软件栈运行在Host CPU上。

对当前昇腾AI软件栈的运行模式函数进行封装

int GetRunMode()
{aclrtRunMode runMode;aclrtGetRunMode(&runMode);if (runMode==ACL_HOST) {return 1;}return 0;
}

区分昇腾AI软件栈运行在哪

Host指与Device相连接的X86服务器、ARM服务器,会利用Device提供的NN(Neural-Network )计算能力,完成业务。

Device指安装了昇腾AI处理器的硬件设备,利用PCIe接口与Host侧连接,为Host提供NN计算能力。

如果查询结果为ACL_HOST,则数据传输时涉及申请Host上的内存。
如果查询结果为ACL_DEVICE,则数据传输时仅需申请Device上的内存。

ImageProc imageProcess;
ImageData frame;
ImageSize modelSize(modelWidth, modelHeight);
int isHost = GetRunMode();ImageData dst;
imageProcess.Resize(frame, dst, modelSize, RESIZE_PROPORTIONAL_UPPER_LEFT);
MsgData msgData;
msgData.data = dst.data;
msgData.size = dst.size;
msgData.videoEnd = false;
cv::Mat yuyvImg(frame.height*1.5, frame.width, CV_8UC1);
if (isHost) {//昇腾AI软件栈运行在Host CPU上的处理方式void* hostDataBuffer = CopyDataToHost(frame.data.get(), frame.size);memcpy(yuyvImg.data, (unsigned char*)hostDataBuffer, frame.size);FreeHostMem(hostDataBuffer);hostDataBuffer = nullptr;} else {//昇腾AI软件栈运行在Device的Control CPU或板端环境上memcpy(yuyvImg.data, (unsigned char*)frame.data.get(), frame.size);}
cv::cvtColor(yuyvImg, msgData.srcImg, cv::COLOR_YUV2RGB_NV21);

从Host到Device的数据传输 函数的封装

void* CopyDataToDevice(void* data, uint32_t size) {void* devicePtr = nullptr;aclError aclRet = aclrtMalloc(&devicePtr, size, ACL_MEM_MALLOC_NORMAL_ONLY);CHECK_RET(aclRet == ACL_SUCCESS, LOG_PRINT("[ERROR] aclrtMalloc failed. ERROR: %d", aclRet); return nullptr);aclrtRunMode runMode;aclrtGetRunMode(&runMode);if (runMode == ACL_HOST) {aclRet = aclrtMemcpy(devicePtr, size, data, size, ACL_MEMCPY_HOST_TO_DEVICE);if (aclRet != ACL_SUCCESS) {LOG_PRINT("[ERROR] aclrtMemcpy failed. ERROR: %d", aclRet);aclrtFree(devicePtr);devicePtr = nullptr;return devicePtr;}} else {aclRet = aclrtMemcpy(devicePtr, size, data, size, ACL_MEMCPY_DEVICE_TO_DEVICE);if (aclRet != ACL_SUCCESS) {LOG_PRINT("[ERROR] aclrtMemcpy failed. ERROR: %d", aclRet);aclrtFree(devicePtr);devicePtr = nullptr;return devicePtr;}}return devicePtr;
}

从Device到Host的数据传输 函数的封装

void* CopyDataToHost(void* data, uint32_t size) {void* hostPtr = nullptr;aclError aclRet = aclrtMallocHost(&hostPtr, size);CHECK_RET(aclRet == ACL_SUCCESS, LOG_PRINT("[ERROR] aclrtMalloc failed. ERROR: %d", aclRet); return nullptr);aclrtRunMode runMode;aclrtGetRunMode(&runMode);if (runMode == ACL_HOST) {aclRet = aclrtMemcpy(hostPtr, size, data, size, ACL_MEMCPY_DEVICE_TO_HOST);if (aclRet != ACL_SUCCESS) {LOG_PRINT("[ERROR] aclrtMemcpy failed. ERROR: %d", aclRet);aclrtFreeHost(hostPtr);hostPtr = nullptr;return hostPtr;}} else {aclRet = aclrtMemcpy(hostPtr, size, data, size, ACL_MEMCPY_DEVICE_TO_HOST);if (aclRet != ACL_SUCCESS) {LOG_PRINT("[ERROR] aclrtMemcpy failed. ERROR: %d", aclRet);aclrtFreeHost(hostPtr);hostPtr = nullptr;return hostPtr;}}return hostPtr;
}

内存释放的封装 使用完内存中的数据后,需及时释放资源

void FreeHostMem(void*& hostPtr) {aclrtFreeHost(hostPtr);hostPtr = nullptr;
}void FreeDeviceMem(void*& devicePtr) {aclrtFree(devicePtr);devicePtr = nullptr;
}

void*& 是 C++ 中的一种参数类型,表示一个指向 void* 类型的引用。为了理解它的含义,分两步来解释:

void*: 这是一个通用指针类型,可以指向任何类型的数据,但它本身不携带类型信息。通常用来处理原始内存块或不确定类型的指针。

& (引用): 在 C++ 中,引用(reference)是一种别名,它允许直接操作原对象而不创建副本。void*& 是一个指向 void* 类型的引用,意味着可以在函数中直接操作传入的 void* 指针,而不需要复制指针的值。

例如在 FreeHostMem 函数中,void*& hostPtr 作为参数传入,意味着这个函数可以修改 hostPtr 指针的值,并且这些修改会反映在调用者的变量中。这在函数内部将 hostPtr 设置为 nullptr 后,调用者也会看到指针被设置为 nullptr,防止悬空指针的出现

aclrtMemcpy 函数原型

aclError aclrtMemcpy(void *dst, size_t destMax, const void *src, size_t count, aclrtMemcpyKind kind)
dst:目的内存地址指针。
destMax:目的内存地址的最大内存长度,单位Byte。
src:源内存地址指针。
count:内存复制的长度,单位Byte。
kind:内存复制的类型,预留参数,配置枚举值中的值无效,系统内部会根据源内存地址指针、目的内存地址指针判断是否可以将源地址的数据复制到目的地址,如果不可以,则系统会返回报错。

typedef enum aclrtMemcpyKind {
ACL_MEMCPY_HOST_TO_HOST, // Host内的内存复制
ACL_MEMCPY_HOST_TO_DEVICE, // Host到Device的内存复制
ACL_MEMCPY_DEVICE_TO_HOST, // Device到Host的内存复制
ACL_MEMCPY_DEVICE_TO_DEVICE, // Device内或Device间的内存复制
} aclrtMemcpyKind;

这篇关于昇腾 - AscendCL C++应用开发 Host与Device的数据传输 函数的封装的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1095071

相关文章

CSS中的Static、Relative、Absolute、Fixed、Sticky的应用与详细对比

《CSS中的Static、Relative、Absolute、Fixed、Sticky的应用与详细对比》CSS中的position属性用于控制元素的定位方式,不同的定位方式会影响元素在页面中的布... css 中的 position 属性用于控制元素的定位方式,不同的定位方式会影响元素在页面中的布局和层叠关

SpringBoot3应用中集成和使用Spring Retry的实践记录

《SpringBoot3应用中集成和使用SpringRetry的实践记录》SpringRetry为SpringBoot3提供重试机制,支持注解和编程式两种方式,可配置重试策略与监听器,适用于临时性故... 目录1. 简介2. 环境准备3. 使用方式3.1 注解方式 基础使用自定义重试策略失败恢复机制注意事项

Windows下C++使用SQLitede的操作过程

《Windows下C++使用SQLitede的操作过程》本文介绍了Windows下C++使用SQLite的安装配置、CppSQLite库封装优势、核心功能(如数据库连接、事务管理)、跨平台支持及性能优... 目录Windows下C++使用SQLite1、安装2、代码示例CppSQLite:C++轻松操作SQ

C++中RAII资源获取即初始化

《C++中RAII资源获取即初始化》RAII通过构造/析构自动管理资源生命周期,确保安全释放,本文就来介绍一下C++中的RAII技术及其应用,具有一定的参考价值,感兴趣的可以了解一下... 目录一、核心原理与机制二、标准库中的RAII实现三、自定义RAII类设计原则四、常见应用场景1. 内存管理2. 文件操

C++中零拷贝的多种实现方式

《C++中零拷贝的多种实现方式》本文主要介绍了C++中零拷贝的实现示例,旨在在减少数据在内存中的不必要复制,从而提高程序性能、降低内存使用并减少CPU消耗,零拷贝技术通过多种方式实现,下面就来了解一下... 目录一、C++中零拷贝技术的核心概念二、std::string_view 简介三、std::stri

C++高效内存池实现减少动态分配开销的解决方案

《C++高效内存池实现减少动态分配开销的解决方案》C++动态内存分配存在系统调用开销、碎片化和锁竞争等性能问题,内存池通过预分配、分块管理和缓存复用解决这些问题,下面就来了解一下... 目录一、C++内存分配的性能挑战二、内存池技术的核心原理三、主流内存池实现:TCMalloc与Jemalloc1. TCM

Python中help()和dir()函数的使用

《Python中help()和dir()函数的使用》我们经常需要查看某个对象(如模块、类、函数等)的属性和方法,Python提供了两个内置函数help()和dir(),它们可以帮助我们快速了解代... 目录1. 引言2. help() 函数2.1 作用2.2 使用方法2.3 示例(1) 查看内置函数的帮助(

Python实例题之pygame开发打飞机游戏实例代码

《Python实例题之pygame开发打飞机游戏实例代码》对于python的学习者,能够写出一个飞机大战的程序代码,是不是感觉到非常的开心,:本文主要介绍Python实例题之pygame开发打飞机... 目录题目pygame-aircraft-game使用 Pygame 开发的打飞机游戏脚本代码解释初始化部

C++ 函数 strftime 和时间格式示例详解

《C++函数strftime和时间格式示例详解》strftime是C/C++标准库中用于格式化日期和时间的函数,定义在ctime头文件中,它将tm结构体中的时间信息转换为指定格式的字符串,是处理... 目录C++ 函数 strftipythonme 详解一、函数原型二、功能描述三、格式字符串说明四、返回值五

使用Python开发一个现代化屏幕取色器

《使用Python开发一个现代化屏幕取色器》在UI设计、网页开发等场景中,颜色拾取是高频需求,:本文主要介绍如何使用Python开发一个现代化屏幕取色器,有需要的小伙伴可以参考一下... 目录一、项目概述二、核心功能解析2.1 实时颜色追踪2.2 智能颜色显示三、效果展示四、实现步骤详解4.1 环境配置4.