[CUDA] 使用thrust::sort()函数排序

2024-03-11 12:28

本文主要是介绍[CUDA] 使用thrust::sort()函数排序,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、简介

本文介绍了如何使用thrust::sort()函数对device_vector<int>容器,或者int*指针表示的内存(显存)处的数据进行排序。

二、示例代码

1. 排序 device_vector<int>中的数据

main.cu文件内容:

#include <iostream>
#include <cuda_runtime.h>
#include <thrust/device_vector.h>
#include <thrust/device_ptr.h>
#include <thrust/host_vector.h>
#include <thrust/sort.h>
#include <algorithm>
#include <random>
#include <chrono>using namespace std;
int main()
{int min = 0, max = 100;random_device seed;                           // 硬件生成随机数种子ranlux48 engine(seed());                      // 利用种子生成随机数引擎uniform_int_distribution<> distrib(min, max); // 设置随机数范围,并为均匀分布int n = 10;thrust::host_vector<int> data_host(n);thrust::device_vector<int> data_device(n);/* 在host_vector上生成随机数 */for (int i = 0; i < n; i++){data_host[i] = distrib(engine);}std::cout << "Before sorting:\n";for (int i = 0; i < n; i++){std::cout << data_host[i] << ",";}std::cout << "\n";/* 在device端进行排序 */data_device = data_host;                              // 将host端的数据拷贝到device端thrust::sort(data_device.begin(), data_device.end()); // 进行排序data_host = data_device;                              // 将排序完成后的device端的数据拷贝回host端std::cout << "After sorting:\n";for (int i = 0; i < n; i++){std::cout << data_host[i] << ",";}std::cout << "\n";return 0;
}

CMakeLists.txt文件内容:

cmake_minimum_required(VERSION 3.8 FATAL_ERROR)
project(HelloWolrd LANGUAGES CXX CUDA)
set(CMAKE_CXX_STANDARD 14)
set(CMAKE_CXX_STANDARD_REQUIRED ON)
# CUDA设置
find_package(CUDA REQUIRED)
# 指定生成目标
cuda_add_executable(HelloWorld main.cu)

程序输出结果:

Before sorting:
85,73,8,0,77,68,93,31,85,76,
After sorting:
0,8,31,68,73,76,77,85,85,93,

2. 排序 int*指针中的数据

main.cu文件内容:

#include <iostream>
#include <cuda_runtime.h>
#include <thrust/device_vector.h>
#include <thrust/device_ptr.h>
#include <thrust/host_vector.h>
#include <thrust/sort.h>
#include <algorithm>
#include <random>
#include <chrono>using namespace std;
int main()
{int min = 0, max = 100;random_device seed;                           // 硬件生成随机数种子ranlux48 engine(seed());                      // 利用种子生成随机数引擎uniform_int_distribution<> distrib(min, max); // 设置随机数范围,并为均匀分布int n = 10;int *data_host = new int[n];/* 生成随机数 */for (int i = 0; i < n; i++){data_host[i] = distrib(engine);}std::cout << "Befor sorting:\n";for (int i = 0; i < n; i++){std::cout << data_host[i] << ",";}std::cout << "\n";    /*数据拷贝到device端*/int *data_device = nullptr;cudaMalloc((void **)&data_device, n * sizeof(int));cudaMemcpy(data_device, data_host, n * sizeof(int), cudaMemcpyHostToDevice);/*使用thrust::sort()排序*/// thrust::sort()只支持迭代器,因此需要将int*指针转为device_ptr<int>容器类型thrust::device_ptr<int> t_ptr(data_device);thrust::sort(t_ptr, t_ptr + n);/*数据拷贝回host端*/cudaMemcpy(data_host, data_device, n * sizeof(int), cudaMemcpyDeviceToHost);std::cout << "After sorting:\n";for (int i = 0; i < n; i++){std::cout << data_host[i] << ",";}std::cout << "\n";/*释放内存*/delete[] data_host;cudaFree(data_device);return 0;
}

CMakeLists.txt文件内容同上。
程序输出结果:

Befor sorting:
5,82,71,3,90,69,8,0,23,81,
After sorting:
0,3,5,8,23,69,71,81,82,90,

三、自定义排序

更多自定义排序请参考thrust官方代码仓库:NVIDIA/thrust。

这篇关于[CUDA] 使用thrust::sort()函数排序的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/797798

相关文章

Spring IoC 容器的使用详解(最新整理)

《SpringIoC容器的使用详解(最新整理)》文章介绍了Spring框架中的应用分层思想与IoC容器原理,通过分层解耦业务逻辑、数据访问等模块,IoC容器利用@Component注解管理Bean... 目录1. 应用分层2. IoC 的介绍3. IoC 容器的使用3.1. bean 的存储3.2. 方法注

Python内置函数之classmethod函数使用详解

《Python内置函数之classmethod函数使用详解》:本文主要介绍Python内置函数之classmethod函数使用方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地... 目录1. 类方法定义与基本语法2. 类方法 vs 实例方法 vs 静态方法3. 核心特性与用法(1编程客

Python函数作用域示例详解

《Python函数作用域示例详解》本文介绍了Python中的LEGB作用域规则,详细解析了变量查找的四个层级,通过具体代码示例,展示了各层级的变量访问规则和特性,对python函数作用域相关知识感兴趣... 目录一、LEGB 规则二、作用域实例2.1 局部作用域(Local)2.2 闭包作用域(Enclos

Linux中压缩、网络传输与系统监控工具的使用完整指南

《Linux中压缩、网络传输与系统监控工具的使用完整指南》在Linux系统管理中,压缩与传输工具是数据备份和远程协作的桥梁,而系统监控工具则是保障服务器稳定运行的眼睛,下面小编就来和大家详细介绍一下它... 目录引言一、压缩与解压:数据存储与传输的优化核心1. zip/unzip:通用压缩格式的便捷操作2.

使用Python实现可恢复式多线程下载器

《使用Python实现可恢复式多线程下载器》在数字时代,大文件下载已成为日常操作,本文将手把手教你用Python打造专业级下载器,实现断点续传,多线程加速,速度限制等功能,感兴趣的小伙伴可以了解下... 目录一、智能续传:从崩溃边缘抢救进度二、多线程加速:榨干网络带宽三、速度控制:做网络的好邻居四、终端交互

Python中注释使用方法举例详解

《Python中注释使用方法举例详解》在Python编程语言中注释是必不可少的一部分,它有助于提高代码的可读性和维护性,:本文主要介绍Python中注释使用方法的相关资料,需要的朋友可以参考下... 目录一、前言二、什么是注释?示例:三、单行注释语法:以 China编程# 开头,后面的内容为注释内容示例:示例:四

MySQL count()聚合函数详解

《MySQLcount()聚合函数详解》MySQL中的COUNT()函数,它是SQL中最常用的聚合函数之一,用于计算表中符合特定条件的行数,本文给大家介绍MySQLcount()聚合函数,感兴趣的朋... 目录核心功能语法形式重要特性与行为如何选择使用哪种形式?总结深入剖析一下 mysql 中的 COUNT

Go语言数据库编程GORM 的基本使用详解

《Go语言数据库编程GORM的基本使用详解》GORM是Go语言流行的ORM框架,封装database/sql,支持自动迁移、关联、事务等,提供CRUD、条件查询、钩子函数、日志等功能,简化数据库操作... 目录一、安装与初始化1. 安装 GORM 及数据库驱动2. 建立数据库连接二、定义模型结构体三、自动迁

ModelMapper基本使用和常见场景示例详解

《ModelMapper基本使用和常见场景示例详解》ModelMapper是Java对象映射库,支持自动映射、自定义规则、集合转换及高级配置(如匹配策略、转换器),可集成SpringBoot,减少样板... 目录1. 添加依赖2. 基本用法示例:简单对象映射3. 自定义映射规则4. 集合映射5. 高级配置匹

MySQL 中 ROW_NUMBER() 函数最佳实践

《MySQL中ROW_NUMBER()函数最佳实践》MySQL中ROW_NUMBER()函数,作为窗口函数为每行分配唯一连续序号,区别于RANK()和DENSE_RANK(),特别适合分页、去重... 目录mysql 中 ROW_NUMBER() 函数详解一、基础语法二、核心特点三、典型应用场景1. 数据分