关于需要写一篇有关DPC++的博客来完成操作系统上机作业这件事

2024-01-26 16:20

本文主要是介绍关于需要写一篇有关DPC++的博客来完成操作系统上机作业这件事,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

 第一次写博客,各种操作还不熟悉,写的不好还请见谅。

首先什么是DPC++

        DPC++是Data Parallel C++(数据并行C++)的首字母缩写,它是Intel为了将SYCL引入LLVM和oneAPI所开发的开源项目。SYCL是为了提高各种加速设备上的编程效率而开发的一种高级别的编程模型,简单来说它是一种跨平台的抽象层,用户不需要关心底层的加速器具体是什么,按照标准编写统一的代码就可以在各种平台上运行。可以说SYCL大大提高了编写异构计算代码的可移植性和编程效率,已经成为了异构计算的行业标准。

环境准备

介绍两种本人实操过的两种环境

一、Dpcpp编译器的本地安装

https://github.com/intel/llvm/releases

链接是GitHub上Dpcpp的压缩包,Windows下载最新的win压缩包即可,下载完成后在特定目录解压 (例如,C:/opt),把llvm编译器的bin目录添加到系统环境变量PATH (如C:/opt/dpcpp_compiler/bin)

二、基于Intel DevCloud环境

这个不知道怎么上传PDF文件到CSDN中,回头再试试。整体来说就是提供了一个可以运行DPC++代码的环境,但现阶段也只能运行云上提供的代码,自己的写的总是运行错误,还不清楚是什么原因(可能是版本的不同至语法的差异),回头再解决吧。

不能写入和运行自己的代码的问题已解决,详情参照Hello World示例的云平台操作。

DevCloud注册链接:https://idzcn.com/devcloud.htm

点击网址注册账号

 注册完成后,一般情况下,系统会同时自动跳转到账号激活步骤进行账号激活。如果系统未能自动跳转,请点击https://www.intel.com/content/www/cn/zh/secure/forms/devcloud-enrollment/account-provisioning.html

激活完成,系统会跳转到 Intel Developer Cloud 主站。点击主站右侧 oneAPI 相关服务的链接,跳转 进入 DevCloud for oneAPI 专项服务的登录页面。如果系统未能自动跳转,请点击https://devcloud.intel.com/oneapi

在 DevCloud for oneAPI 专项服务页面中,点击右上角或页面中的“Sign In”链接,输入完成登录。

用户可以通过点击网页左侧“Get Started”进入该选项的页面,在“Get Started”选项页面中, 用户可以 通过点击页面最右下角 Connect with Jupyter* Lab 中的“Launch JupyterLab*”按钮直接启动 Jupypter 服 务。

 启动 Jupyter 服务的过程中,系统可能会再次提示确认登入信息,并开始部署并启动相关远程服务。 其中可能会有若干次系统显示的部署进展提示信息。

 

Hello World示例

接下来尝试在本地运行第一个示例代码

#include <CL/sycl.hpp>
#include <iostream>
using namespace sycl;
const std::string secret {
"Ifmmp-!xpsme\"\012J(n!tpssz-!Ebwf/!"
"J(n!bgsbje!J!dbo(u!ep!uibu/!.!IBM\01"};
const auto sz = secret.size();
int main() {
queue Q;
char *result = malloc_shared<char>(sz, Q);
std::memcpy(result, secret.data(), sz);
Q.parallel_for(sz, [=] (auto &i) {
result[i] -= 1;
}).wait();
std::cout << result << "\n";
return 0;
}

(说实话,这代码看不懂,特别是中间有一段乱码差不多的东西,不知道是来干什么的,不过单纯用来当成示例代码还是可以的,毕竟学啥语言第一句都是“Hello World”)

用你平时顺手的C++编译器输入上述代码,保存好(尽量是全英文的路径,我没试过带中文路径的 ,毕竟这是外国人开发的,带中文的路径可能不好使),打开你的cmd窗口来到保存cpp文件的文件夹下,输入编译指令(将test替换成自己写的cpp文件名)

clang++ -fsycl test.cpp –o test.exe

 如果没有报错则编译成功,这时文件夹下会产生一个.exe文件,这时输入

test.exe

 执行.exe文件,如果输出如上则成功。

一些可能可以解决问题的方法:

1、看看自己的CPU是不是Intel的,如果不是,将无法完成实验。

2、尝试更新显卡驱动。

云平台运行(与本地类似)

进入JupyterLab

创建一个用以保存自己写的代码的文件夹(例如:code)(右击即可创建文件夹)

创建一个新的NoteBook 

进入NoteBook,输入与本地操作相同的代码

首行需要加上一句%%writefile code/test.cpp(code是文件名,test.cpp是为这段代码保存的文件名,意为将某某文件写入某某文件夹下),点击上方的三角形,代码框的底部会出现一行类似writing code/test.cpp的输出,这时这段代码才保存在指定文件夹下。

 打开一个终端,并进入刚创建的文件夹下,输入ls可以看见刚写入的cpp文件

 

 现在开始编译和执行cpp文件(将test替换成自己保存的cpp文件名称),编译指令为 

icpx -fsycl test.cpp -o test.exe

执行指令为

./test.exe

运行结果可以参照下图

(附:在云端可以直接在终端通过vim直接在指定目录的文件夹下创建cpp文件,其余操作与上述操作相同。)

几个实例代码

DPC++设备选择方式1:默认的设备选择器

#include <CL/sycl.hpp>
#include <iostream>
using namespace sycl;
int main(){queue Q;std::cout << "Select device: "<<Q.get_device().get_info<info::device::name>() << "\n";return 0;
}

输出的是默认的device,结果可以参考下图

 

DPC++设备选择方式2:使用host_selector

#include <CL/sycl.hpp>
#include <iostream>
using namespace sycl;
int main(){queue Q (host_selector{} );std::cout << "Select device: "<<Q.get_device().get_info<info::device::name>() << "\n";std::cout <<" -> Device vendor: " <<Q.get_device().get_info<info::device::vendor>() << "\n";return 0;
}

新版本的sycl已经不再支持host_selector操作,在DevCloud中无法执行,可以尝试下载旧版本的本地编译器尝试。

DPC++设备选择方式3:使用cpu_selector

#include <CL/sycl.hpp>
#include <iostream>
using namespace sycl;
int main(){queue Q ( cpu_selector_v );std::cout << "Select device: "<<Q.get_device().get_info<info::device::name>() << "\n";std::cout <<" -> Device vendor: " <<Q.get_device().get_info<info::device::vendor>() << "\n";return 0;
}

该运行结果显示出cpu设备选择器,结果可以参考下图

DPC++设备选择方式4:使用多个设备选择器

#include <CL/sycl.hpp>
#include <iostream>
using namespace sycl;int main(){queue my_default_queue(default_selector_v);queue my_accelerator_queue(accelerator_selector_v);std::cout << "Selected device 1:" << my_default_queue.get_device().get_info<info::device::name>() << "\n";std::cout << "Selected device 2:" << my_accelerator_queue.get_device().get_info<info::device::name>() << "\n";return 0;
}

代码中的accelerator_selector_v为选择一个加速器设备(如 FPGA、ASIC 等);default_selector_v为选择最佳的可用设备,在DevCloud中无GPU设备,故使用的是CPU,可以在本地编译器上尝试选择GPU,结果可以参考下图

向数组中填充数据

#include <CL/sycl.hpp>
#include <array>
#include <iostream>
using namespace sycl;int main(){constexpr int size = 16;std::array<int,size> data;buffer  B {data};queue Q{};std::cout << "Selected device is : " << Q.get_device().get_info<info::device::name>() << "\n";Q.submit([&](handler& h){accessor acc{B,h};h.parallel_for(size,[=](auto&idx){acc[idx] = idx;});});return 0;
}

结果可以参考下图

这段代码使用SYCL(ComputeCpp)库实现了并行计算的示例。它创建了一个队列,选择一个计算设备,并在该设备上执行并行任务。任务使用访问器访问缓冲区,并在每个迭代中将索引值赋给缓冲区中的元素。代码的主要目的是展示SYCL的基本用法,以及如何利用SYCL库在异构计算设备上进行并行计算。

 

 

这篇关于关于需要写一篇有关DPC++的博客来完成操作系统上机作业这件事的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/647358

相关文章

C++中unordered_set哈希集合的实现

《C++中unordered_set哈希集合的实现》std::unordered_set是C++标准库中的无序关联容器,基于哈希表实现,具有元素唯一性和无序性特点,本文就来详细的介绍一下unorder... 目录一、概述二、头文件与命名空间三、常用方法与示例1. 构造与析构2. 迭代器与遍历3. 容量相关4

C++中悬垂引用(Dangling Reference) 的实现

《C++中悬垂引用(DanglingReference)的实现》C++中的悬垂引用指引用绑定的对象被销毁后引用仍存在的情况,会导致访问无效内存,下面就来详细的介绍一下产生的原因以及如何避免,感兴趣... 目录悬垂引用的产生原因1. 引用绑定到局部变量,变量超出作用域后销毁2. 引用绑定到动态分配的对象,对象

一篇文章彻底搞懂macOS如何决定java环境

《一篇文章彻底搞懂macOS如何决定java环境》MacOS作为一个功能强大的操作系统,为开发者提供了丰富的开发工具和框架,下面:本文主要介绍macOS如何决定java环境的相关资料,文中通过代码... 目录方法一:使用 which命令方法二:使用 Java_home工具(Apple 官方推荐)那问题来了,

C++读写word文档(.docx)DuckX库的使用详解

《C++读写word文档(.docx)DuckX库的使用详解》DuckX是C++库,用于创建/编辑.docx文件,支持读取文档、添加段落/片段、编辑表格,解决中文乱码需更改编码方案,进阶功能含文本替换... 目录一、基本用法1. 读取文档3. 添加段落4. 添加片段3. 编辑表格二、进阶用法1. 文本替换2

C++中处理文本数据char与string的终极对比指南

《C++中处理文本数据char与string的终极对比指南》在C++编程中char和string是两种用于处理字符数据的类型,但它们在使用方式和功能上有显著的不同,:本文主要介绍C++中处理文本数... 目录1. 基本定义与本质2. 内存管理3. 操作与功能4. 性能特点5. 使用场景6. 相互转换核心区别

Linux中查看操作系统及其版本信息的多种方法

《Linux中查看操作系统及其版本信息的多种方法》在服务器运维或者部署系统中,经常需要确认服务器的系统版本、cpu信息等,在Linux系统中,有多种方法可以查看操作系统及其版本信息,以下是一些常用的方... 目录1. lsb_pythonrelease 命令2. /etc/os-release 文件3. h

C++右移运算符的一个小坑及解决

《C++右移运算符的一个小坑及解决》文章指出右移运算符处理负数时左侧补1导致死循环,与除法行为不同,强调需注意补码机制以正确统计二进制1的个数... 目录我遇到了这么一个www.chinasem.cn函数由此可以看到也很好理解总结我遇到了这么一个函数template<typename T>unsigned

C++统计函数执行时间的最佳实践

《C++统计函数执行时间的最佳实践》在软件开发过程中,性能分析是优化程序的重要环节,了解函数的执行时间分布对于识别性能瓶颈至关重要,本文将分享一个C++函数执行时间统计工具,希望对大家有所帮助... 目录前言工具特性核心设计1. 数据结构设计2. 单例模式管理器3. RAII自动计时使用方法基本用法高级用法

深入解析C++ 中std::map内存管理

《深入解析C++中std::map内存管理》文章详解C++std::map内存管理,指出clear()仅删除元素可能不释放底层内存,建议用swap()与空map交换以彻底释放,针对指针类型需手动de... 目录1️、基本清空std::map2️、使用 swap 彻底释放内存3️、map 中存储指针类型的对象

C++ STL-string类底层实现过程

《C++STL-string类底层实现过程》本文实现了一个简易的string类,涵盖动态数组存储、深拷贝机制、迭代器支持、容量调整、字符串修改、运算符重载等功能,模拟标准string核心特性,重点强... 目录实现框架一、默认成员函数1.默认构造函数2.构造函数3.拷贝构造函数(重点)4.赋值运算符重载函数