昇腾 - AscendCL C++应用开发 Host与Device的数据传输 函数的封装

2024-08-22 03:12

本文主要是介绍昇腾 - AscendCL C++应用开发 Host与Device的数据传输 函数的封装,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

昇腾 - AscendCL C++应用开发 Host与Device的数据传输 函数的封装

flyfish

aclrtGetRunMode

函数功能:获取当前昇腾AI软件栈的运行模式。
aclError aclrtGetRunMode(aclrtRunMode *runMode)

参数说明:runMode 运行模式的指针。
ACL_DEVICE:昇腾AI软件栈运行在Device的Control CPU或板端环境上。

Atlas 训练系列产品,Atlas A2训练系列产品/Atlas 800I A2推理产品,不支持该选项。

ACL_HOST:昇腾AI软件栈运行在Host CPU上。

对当前昇腾AI软件栈的运行模式函数进行封装

int GetRunMode()
{aclrtRunMode runMode;aclrtGetRunMode(&runMode);if (runMode==ACL_HOST) {return 1;}return 0;
}

区分昇腾AI软件栈运行在哪

Host指与Device相连接的X86服务器、ARM服务器,会利用Device提供的NN(Neural-Network )计算能力,完成业务。

Device指安装了昇腾AI处理器的硬件设备,利用PCIe接口与Host侧连接,为Host提供NN计算能力。

如果查询结果为ACL_HOST,则数据传输时涉及申请Host上的内存。
如果查询结果为ACL_DEVICE,则数据传输时仅需申请Device上的内存。

ImageProc imageProcess;
ImageData frame;
ImageSize modelSize(modelWidth, modelHeight);
int isHost = GetRunMode();ImageData dst;
imageProcess.Resize(frame, dst, modelSize, RESIZE_PROPORTIONAL_UPPER_LEFT);
MsgData msgData;
msgData.data = dst.data;
msgData.size = dst.size;
msgData.videoEnd = false;
cv::Mat yuyvImg(frame.height*1.5, frame.width, CV_8UC1);
if (isHost) {//昇腾AI软件栈运行在Host CPU上的处理方式void* hostDataBuffer = CopyDataToHost(frame.data.get(), frame.size);memcpy(yuyvImg.data, (unsigned char*)hostDataBuffer, frame.size);FreeHostMem(hostDataBuffer);hostDataBuffer = nullptr;} else {//昇腾AI软件栈运行在Device的Control CPU或板端环境上memcpy(yuyvImg.data, (unsigned char*)frame.data.get(), frame.size);}
cv::cvtColor(yuyvImg, msgData.srcImg, cv::COLOR_YUV2RGB_NV21);

从Host到Device的数据传输 函数的封装

void* CopyDataToDevice(void* data, uint32_t size) {void* devicePtr = nullptr;aclError aclRet = aclrtMalloc(&devicePtr, size, ACL_MEM_MALLOC_NORMAL_ONLY);CHECK_RET(aclRet == ACL_SUCCESS, LOG_PRINT("[ERROR] aclrtMalloc failed. ERROR: %d", aclRet); return nullptr);aclrtRunMode runMode;aclrtGetRunMode(&runMode);if (runMode == ACL_HOST) {aclRet = aclrtMemcpy(devicePtr, size, data, size, ACL_MEMCPY_HOST_TO_DEVICE);if (aclRet != ACL_SUCCESS) {LOG_PRINT("[ERROR] aclrtMemcpy failed. ERROR: %d", aclRet);aclrtFree(devicePtr);devicePtr = nullptr;return devicePtr;}} else {aclRet = aclrtMemcpy(devicePtr, size, data, size, ACL_MEMCPY_DEVICE_TO_DEVICE);if (aclRet != ACL_SUCCESS) {LOG_PRINT("[ERROR] aclrtMemcpy failed. ERROR: %d", aclRet);aclrtFree(devicePtr);devicePtr = nullptr;return devicePtr;}}return devicePtr;
}

从Device到Host的数据传输 函数的封装

void* CopyDataToHost(void* data, uint32_t size) {void* hostPtr = nullptr;aclError aclRet = aclrtMallocHost(&hostPtr, size);CHECK_RET(aclRet == ACL_SUCCESS, LOG_PRINT("[ERROR] aclrtMalloc failed. ERROR: %d", aclRet); return nullptr);aclrtRunMode runMode;aclrtGetRunMode(&runMode);if (runMode == ACL_HOST) {aclRet = aclrtMemcpy(hostPtr, size, data, size, ACL_MEMCPY_DEVICE_TO_HOST);if (aclRet != ACL_SUCCESS) {LOG_PRINT("[ERROR] aclrtMemcpy failed. ERROR: %d", aclRet);aclrtFreeHost(hostPtr);hostPtr = nullptr;return hostPtr;}} else {aclRet = aclrtMemcpy(hostPtr, size, data, size, ACL_MEMCPY_DEVICE_TO_HOST);if (aclRet != ACL_SUCCESS) {LOG_PRINT("[ERROR] aclrtMemcpy failed. ERROR: %d", aclRet);aclrtFreeHost(hostPtr);hostPtr = nullptr;return hostPtr;}}return hostPtr;
}

内存释放的封装 使用完内存中的数据后,需及时释放资源

void FreeHostMem(void*& hostPtr) {aclrtFreeHost(hostPtr);hostPtr = nullptr;
}void FreeDeviceMem(void*& devicePtr) {aclrtFree(devicePtr);devicePtr = nullptr;
}

void*& 是 C++ 中的一种参数类型,表示一个指向 void* 类型的引用。为了理解它的含义,分两步来解释:

void*: 这是一个通用指针类型,可以指向任何类型的数据,但它本身不携带类型信息。通常用来处理原始内存块或不确定类型的指针。

& (引用): 在 C++ 中,引用(reference)是一种别名,它允许直接操作原对象而不创建副本。void*& 是一个指向 void* 类型的引用,意味着可以在函数中直接操作传入的 void* 指针,而不需要复制指针的值。

例如在 FreeHostMem 函数中,void*& hostPtr 作为参数传入,意味着这个函数可以修改 hostPtr 指针的值,并且这些修改会反映在调用者的变量中。这在函数内部将 hostPtr 设置为 nullptr 后,调用者也会看到指针被设置为 nullptr,防止悬空指针的出现

aclrtMemcpy 函数原型

aclError aclrtMemcpy(void *dst, size_t destMax, const void *src, size_t count, aclrtMemcpyKind kind)
dst:目的内存地址指针。
destMax:目的内存地址的最大内存长度,单位Byte。
src:源内存地址指针。
count:内存复制的长度,单位Byte。
kind:内存复制的类型,预留参数,配置枚举值中的值无效,系统内部会根据源内存地址指针、目的内存地址指针判断是否可以将源地址的数据复制到目的地址,如果不可以,则系统会返回报错。

typedef enum aclrtMemcpyKind {
ACL_MEMCPY_HOST_TO_HOST, // Host内的内存复制
ACL_MEMCPY_HOST_TO_DEVICE, // Host到Device的内存复制
ACL_MEMCPY_DEVICE_TO_HOST, // Device到Host的内存复制
ACL_MEMCPY_DEVICE_TO_DEVICE, // Device内或Device间的内存复制
} aclrtMemcpyKind;

这篇关于昇腾 - AscendCL C++应用开发 Host与Device的数据传输 函数的封装的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1095071

相关文章

Django开发时如何避免频繁发送短信验证码(python图文代码)

《Django开发时如何避免频繁发送短信验证码(python图文代码)》Django开发时,为防止频繁发送验证码,后端需用Redis限制请求频率,结合管道技术提升效率,通过生产者消费者模式解耦业务逻辑... 目录避免频繁发送 验证码1. www.chinasem.cn避免频繁发送 验证码逻辑分析2. 避免频繁

分布式锁在Spring Boot应用中的实现过程

《分布式锁在SpringBoot应用中的实现过程》文章介绍在SpringBoot中通过自定义Lock注解、LockAspect切面和RedisLockUtils工具类实现分布式锁,确保多实例并发操作... 目录Lock注解LockASPect切面RedisLockUtils工具类总结在现代微服务架构中,分布

Spring Boot集成/输出/日志级别控制/持久化开发实践

《SpringBoot集成/输出/日志级别控制/持久化开发实践》SpringBoot默认集成Logback,支持灵活日志级别配置(INFO/DEBUG等),输出包含时间戳、级别、类名等信息,并可通过... 目录一、日志概述1.1、Spring Boot日志简介1.2、日志框架与默认配置1.3、日志的核心作用

MySQL常用字符串函数示例和场景介绍

《MySQL常用字符串函数示例和场景介绍》MySQL提供了丰富的字符串函数帮助我们高效地对字符串进行处理、转换和分析,本文我将全面且深入地介绍MySQL常用的字符串函数,并结合具体示例和场景,帮你熟练... 目录一、字符串函数概述1.1 字符串函数的作用1.2 字符串函数分类二、字符串长度与统计函数2.1

Python标准库之数据压缩和存档的应用详解

《Python标准库之数据压缩和存档的应用详解》在数据处理与存储领域,压缩和存档是提升效率的关键技术,Python标准库提供了一套完整的工具链,下面小编就来和大家简单介绍一下吧... 目录一、核心模块架构与设计哲学二、关键模块深度解析1.tarfile:专业级归档工具2.zipfile:跨平台归档首选3.

使用IDEA部署Docker应用指南分享

《使用IDEA部署Docker应用指南分享》本文介绍了使用IDEA部署Docker应用的四步流程:创建Dockerfile、配置IDEADocker连接、设置运行调试环境、构建运行镜像,并强调需准备本... 目录一、创建 dockerfile 配置文件二、配置 IDEA 的 Docker 连接三、配置 Do

深入浅出SpringBoot WebSocket构建实时应用全面指南

《深入浅出SpringBootWebSocket构建实时应用全面指南》WebSocket是一种在单个TCP连接上进行全双工通信的协议,这篇文章主要为大家详细介绍了SpringBoot如何集成WebS... 目录前言为什么需要 WebSocketWebSocket 是什么Spring Boot 如何简化 We

Java Stream流之GroupBy的用法及应用场景

《JavaStream流之GroupBy的用法及应用场景》本教程将详细介绍如何在Java中使用Stream流的groupby方法,包括基本用法和一些常见的实际应用场景,感兴趣的朋友一起看看吧... 目录Java Stream流之GroupBy的用法1. 前言2. 基础概念什么是 GroupBy?Stream

python中列表应用和扩展性实用详解

《python中列表应用和扩展性实用详解》文章介绍了Python列表的核心特性:有序数据集合,用[]定义,元素类型可不同,支持迭代、循环、切片,可执行增删改查、排序、推导式及嵌套操作,是常用的数据处理... 目录1、列表定义2、格式3、列表是可迭代对象4、列表的常见操作总结1、列表定义是处理一组有序项目的

python使用try函数详解

《python使用try函数详解》Pythontry语句用于异常处理,支持捕获特定/多种异常、else/final子句确保资源释放,结合with语句自动清理,可自定义异常及嵌套结构,灵活应对错误场景... 目录try 函数的基本语法捕获特定异常捕获多个异常使用 else 子句使用 finally 子句捕获所