想了解并行计算框架但无从下手开始学习?

2023-11-01 14:59

本文主要是介绍想了解并行计算框架但无从下手开始学习?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

关于并行计算框架的一些理解及学习路径

  • 并行计算框架中各种方式介绍
    • 1.openMP
    • 2.MPI
    • 3.CUDA

并行计算框架中各种方式介绍

并行计算主要分为两大方向,主机端的CPU并行和设备端的GPU并行。
CPU端的并行主要有openMPMPI等方式。
GPU端的并行方式主流的有NVIDIA 的CUDA架构(GPU端的加速方式已经比较成熟,各种TOP500的超算都在大量使用GPU加速卡,包括我们的天河二号超算之前就曾经用过Intel Xeon Phi )

1.openMP

1.事实上,openMP作为一种比较易用的并行方式(但需要在编译器中打开openMP支持),支持C,C++,Fortran三种编程语言。

2.C openMP的学习资料比较多,我个人是在“超算习堂”中学习基础语法的,比如最常用的对循环的并行化,多线程的控制等等,后面倒不是经常用到了,该平台完全开放免费,还可以学习MPI等其他并行框架(保姆级教学)
在这里插入图片描述

3.Fortran openMP是我最近才接触到的,由于导师的祖传代码是用fortran写的(-_-),我只能选择自学fortran。不过幸运的是,openMP 用C和Fortran的写法差别并不大,有了C openMP的基础会好很多。
这里我推荐这个在Fcode上找到的资源《使用OpenMP 进行 Fortran95并行计算》网页下面下面有个中文版,要是各位够猛,点那个英文版也是可以的。

2.MPI

这个没学过,先挖个坑,以后回来说。

3.CUDA

在这里插入图片描述

这个是NVIDIA 自家推出的GPU计算框架,暂时支持五种编程语言(如上图咯)
我本人就准备主攻CUDA方向,手上的资料中比较推荐机械工业出版社这本CUDA并行程序设计,主要C语言描述。
在这里插入图片描述

1.个人认为,CUDA C的适用性最好,我是用VS 2019搭建的CUDA C环境,CUDA可以去英伟达官网下,链接CUDA下载点我
注意,先下载VS,再下载CUDA,要不然很可能连接不上出错。
CUDA C的初阶学习也可以在上面提到的超算习堂进行。

2.而fortran的环境搭建详细步骤可以参考这篇文章fortran环境搭建
我个人是用第二种,可以再次依靠着VS2019 (反正在上一点搭建CUDA C环境的时候已经下了)。
但无论是第一种还是第二种都有个问题,很严重,就是没法对fortran代码使用CUDA并行化,对此,我只找到了使用PGI编译器一种解决方法,找了很多论坛也没看到其他方法(那岂不是刚刚都在说废话啊喂 ),如果使用PGI编译器的话,还需要在linux系统下使用专业的算卡,我暂时也没有什么好办法了 ,所以对fortran代码的并行优化我暂时都是在CPU端用openMP做的。

这篇关于想了解并行计算框架但无从下手开始学习?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/323809

相关文章

GSON框架下将百度天气JSON数据转JavaBean

《GSON框架下将百度天气JSON数据转JavaBean》这篇文章主要为大家详细介绍了如何在GSON框架下实现将百度天气JSON数据转JavaBean,文中的示例代码讲解详细,感兴趣的小伙伴可以了解下... 目录前言一、百度天气jsON1、请求参数2、返回参数3、属性映射二、GSON属性映射实战1、类对象映

Unity新手入门学习殿堂级知识详细讲解(图文)

《Unity新手入门学习殿堂级知识详细讲解(图文)》Unity是一款跨平台游戏引擎,支持2D/3D及VR/AR开发,核心功能模块包括图形、音频、物理等,通过可视化编辑器与脚本扩展实现开发,项目结构含A... 目录入门概述什么是 UnityUnity引擎基础认知编辑器核心操作Unity 编辑器项目模式分类工程

Python学习笔记之getattr和hasattr用法示例详解

《Python学习笔记之getattr和hasattr用法示例详解》在Python中,hasattr()、getattr()和setattr()是一组内置函数,用于对对象的属性进行操作和查询,这篇文章... 目录1.getattr用法详解1.1 基本作用1.2 示例1.3 原理2.hasattr用法详解2.

解决若依微服务框架启动报错的问题

《解决若依微服务框架启动报错的问题》Invalidboundstatement错误通常由MyBatis映射文件未正确加载或Nacos配置未读取导致,需检查XML的namespace与方法ID是否匹配,... 目录ruoyi-system模块报错报错详情nacos文件目录总结ruoyi-systnGLNYpe

Python Web框架Flask、Streamlit、FastAPI示例详解

《PythonWeb框架Flask、Streamlit、FastAPI示例详解》本文对比分析了Flask、Streamlit和FastAPI三大PythonWeb框架:Flask轻量灵活适合传统应用... 目录概述Flask详解Flask简介安装和基础配置核心概念路由和视图模板系统数据库集成实际示例Stre

Olingo分析和实践之OData框架核心组件初始化(关键步骤)

《Olingo分析和实践之OData框架核心组件初始化(关键步骤)》ODataSpringBootService通过初始化OData实例和服务元数据,构建框架核心能力与数据模型结构,实现序列化、URI... 目录概述第一步:OData实例创建1.1 OData.newInstance() 详细分析1.1.1

Spring 框架之Springfox使用详解

《Spring框架之Springfox使用详解》Springfox是Spring框架的API文档工具,集成Swagger规范,自动生成文档并支持多语言/版本,模块化设计便于扩展,但存在版本兼容性、性... 目录核心功能工作原理模块化设计使用示例注意事项优缺点优点缺点总结适用场景建议总结Springfox 是

Python的端到端测试框架SeleniumBase使用解读

《Python的端到端测试框架SeleniumBase使用解读》:本文主要介绍Python的端到端测试框架SeleniumBase使用,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全... 目录SeleniumBase详细介绍及用法指南什么是 SeleniumBase?SeleniumBase

Go学习记录之runtime包深入解析

《Go学习记录之runtime包深入解析》Go语言runtime包管理运行时环境,涵盖goroutine调度、内存分配、垃圾回收、类型信息等核心功能,:本文主要介绍Go学习记录之runtime包的... 目录前言:一、runtime包内容学习1、作用:① Goroutine和并发控制:② 垃圾回收:③ 栈和

Android学习总结之Java和kotlin区别超详细分析

《Android学习总结之Java和kotlin区别超详细分析》Java和Kotlin都是用于Android开发的编程语言,它们各自具有独特的特点和优势,:本文主要介绍Android学习总结之Ja... 目录一、空安全机制真题 1:Kotlin 如何解决 Java 的 NullPointerExceptio