MPJ Express 内容总结

2023-11-23 15:50
文章标签 总结 内容 express mpj

本文主要是介绍MPJ Express 内容总结,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Towords Scalable Java HPC with Hybrid and Native Communication Devices in MPJ Express 内容总结

2.相关工作

本文关注:

clipboard.png

  • 当前的一些实现

clipboard.png

  • Open MPI Java Bindings 只能使用Open MPI 座位底层通信库。

  • 随着处理器核数的增加,需要混合并行计算。

  • Hybrid MPI 使用单线程MPI进程。

  • 在Hybrid MPI中,单节点的多核处理器通过共享堆内存进行通信。因此需要安装一个自定义堆内存管理器,用来把共享堆内存的分配给MPI进程,这些进程可以相互访问其内存。

clipboard.png

  • 在Java领域提出MPJ Express。

clipboard.png

3.MPJ Express 架构

clipboard.png

4.MPJ Express中的缓冲层

  • 利用池机制。

clipboard.png

  • API的使用

    • 在MPJ Express 高层,点对点通信中:

    clipboard.png

  • 举例:发送一个int型数组的10个元素

    clipboard.png

  • Java:

    • JDK1.4引入NIO,在NIO中,JVM操作一系列buffer类来对文件和socket进行读写。ByteBuffer类实现了一个字节数组,但存储在JVM堆内存外部(所谓的直接字节缓冲区)。
      所以,当用户想传一个int型数组的10个元素时,可将其复制到一个ByteBuffer中,类似的,如果想传递一个派生数据类型,则可以把派生数据类型中的每个基本数据类型打包,存到ByteBuffer中,这样软件的高层个底层就可以通过缓冲层提供的的功能对基本数据类型和高级数据类型进行通信。对于专用网络,NIO可以直接读取直接字节缓冲区,这样可以消除使用JNI带来的额外复制。

clipboard.png

  • 缓冲策略利用池机制来降低通信开销————减少通信buffer的创建时间。

4.1 Open MPI Java 和 FastMPJ 中的缓冲层

通信层中是否有缓冲对Java消息库的性能影响极大

clipboard.png

  • 由于缺乏统一标准,Java MPI库为了性能最优,其遵循的标准各不相同。由此提出:要解决标准统一的问题。

5.通信device的实现

clipboard.png

5.1 Hybrid device

  • hybrid device 的设计

    • 基于现有的device进行设计,这样可以选用任何一个网络device进行节点间通信,同时有利于代码的服用,便于以后维护。

  • 实现hybrid device时,首先遇到的问题:

clipboard.png

  • MPJ Express 运行时系统负责启动计算节点上的进程。

  • bybdev的设计具有在使用运行时系统的单个计算节点上启动一个或多个网络device实例的灵活性

  • smpdev是一个多个通信device,在那里,不同的线程代表不同的MPJ Express进程,每一个线程有一个包含UUID的进程ID(PID)

  • smpdev的一个具有挑战性的需求是:smpdev依赖于xdev层中各线程中的共享变量,而用户程序中的变量禁止共享。

    • 解决:smpdev和bybdev用过一种智能的类加载机制来满足这个要求。这个类加载机制是:MPJ Express软件的不同包被分为2组,然后分别用不同的的类加载器进行加载。

  • 用户通过指定进程数和可用节点数来执行并行Java应用。基于此:

    1. MPJ Express运行时动态地决定每个节点中运行的线程数

    2. hybdev创建一个连接网络中所有JVM的网络device实例

    3. 每个节点创建一个smpdev实例

    4. smpdev线程共享网络device,以便在网络中进行通信

  • 网络中的每个节点用网络device的PID进行标识,这个PID座位网络ID

  • 网络中的smpdev线程用他们的PID进行标识,这些PID也叫作线程ID

  • 每个节点仅使用一个网络device或固定数量的线程使得MPJ Express 能够利用更多的Java线程而不是进程,这样可以极大地减少device的初始化时间和网络资源开销。

5.1.2通信

clipboard.png

  • 到达的信息被放入队列,用户调用MPI.Recv()取出消息

clipboard.png

  • smpdev和niodev实现了RecvQueue以用来保存当前用户发出的Recv()方法请求后还没有完全接受的信息。

  • ArriveQueue用来保存已经完全接受到的信息,但Recv()方法不是由用户发出的

  • 网络device座位smpdev线程间的共享网络通道。

    • 当同一节点中的2个线程想获得一条来自某个远程source的信息时,就会发生接受错误。任何线程都能得到被定向到对等县城的信息。

      • 解决:在key中增加destination线程的UUID,这样,niodev就能区分destination线程。source和destination的UUID在信息的头部

  • MPJ Express 可以用MPI.ANY_SOURCE来检测通配符信息

    • 在hybdev中,首先要解决用哪个device来检索这样的信息

    • 解决:在hybdev中启动一个新进程,该进程在smpdev队列和正在被使用的网络device中搜索通配符信息,找到后取出信息。

5.1.3 控制网络拥塞
  • hybdev通信device利用单个计算节点中的多线程,这些单个计算节点在节点间通信时,共享单个网络通道,在之前的试验中发现,共享单个网络通道会在这个通道上发生拥塞(尤其是在多核节点中)。

    • 解决:每个节点引入多个网络通达————>每个节点创建多个bybdev实例,每个实例在单独的JVM中。这样,每个节点有多个hybdev实例,每个bybdev实例有自己的用于多节点通信的网络通道。bybdev的实例数有每个节点创建的的进程数决定,而进程是MPJ Express软件的可配参数。

5.2 Native Device

clipboard.png

clipboard.png

clipboard.png

  • 对于点对点通信,native device 使用叫作mpjbuf的MPJ Express中间缓冲层。

  • mpjbuf实现类 ————> NIO Buffer

  • 使用NIO Buffer 时,应用数据以字节形式被复制到ByteBuffer中,然后送到mpjdev层 ,java NIO yong allocateDirect()方法吧ByteBuffer分配到JVM内存外面,这样native device就能直接获取ByteBuffer内存。native device得到地址后,把地址传给底层的本地MPI库。此处要注意,因为正在使用ByteBuffer进行数据通信,MPI_BYTE数据类型被用作所有的点对点通信。

6.性能评估

clipboard.png

clipboard.png

这篇关于MPJ Express 内容总结的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/419024

相关文章

SQL中JOIN操作的条件使用总结与实践

《SQL中JOIN操作的条件使用总结与实践》在SQL查询中,JOIN操作是多表关联的核心工具,本文将从原理,场景和最佳实践三个方面总结JOIN条件的使用规则,希望可以帮助开发者精准控制查询逻辑... 目录一、ON与WHERE的本质区别二、场景化条件使用规则三、最佳实践建议1.优先使用ON条件2.WHERE用

Nginx Location映射规则总结归纳与最佳实践

《NginxLocation映射规则总结归纳与最佳实践》Nginx的location指令是配置请求路由的核心机制,其匹配规则直接影响请求的处理流程,下面给大家介绍NginxLocation映射规则... 目录一、Location匹配规则与优先级1. 匹配模式2. 优先级顺序3. 匹配示例二、Proxy_pa

Python实现自动化Word文档样式复制与内容生成

《Python实现自动化Word文档样式复制与内容生成》在办公自动化领域,高效处理Word文档的样式和内容复制是一个常见需求,本文将展示如何利用Python的python-docx库实现... 目录一、为什么需要自动化 Word 文档处理二、核心功能实现:样式与表格的深度复制1. 表格复制(含样式与内容)2

Android学习总结之Java和kotlin区别超详细分析

《Android学习总结之Java和kotlin区别超详细分析》Java和Kotlin都是用于Android开发的编程语言,它们各自具有独特的特点和优势,:本文主要介绍Android学习总结之Ja... 目录一、空安全机制真题 1:Kotlin 如何解决 Java 的 NullPointerExceptio

MySQL基本查询示例总结

《MySQL基本查询示例总结》:本文主要介绍MySQL基本查询示例总结,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录Create插入替换Retrieve(读取)select(确定列)where条件(确定行)null查询order by语句li

Java如何将文件内容转换为MD5哈希值

《Java如何将文件内容转换为MD5哈希值》:本文主要介绍Java如何将文件内容转换为MD5哈希值的实现方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录Java文件内容转换为MD5哈希值一个完整的Java示例代码代码解释注意事项总结Java文件内容转换为MD5

使用Python自动化生成PPT并结合LLM生成内容的代码解析

《使用Python自动化生成PPT并结合LLM生成内容的代码解析》PowerPoint是常用的文档工具,但手动设计和排版耗时耗力,本文将展示如何通过Python自动化提取PPT样式并生成新PPT,同时... 目录核心代码解析1. 提取 PPT 样式到 jsON关键步骤:代码片段:2. 应用 JSON 样式到

全解析CSS Grid 的 auto-fill 和 auto-fit 内容自适应

《全解析CSSGrid的auto-fill和auto-fit内容自适应》:本文主要介绍了全解析CSSGrid的auto-fill和auto-fit内容自适应的相关资料,详细内容请阅读本文,希望能对你有所帮助... css  Grid 的 auto-fill 和 auto-fit/* 父元素 */.gri

Linux区分SSD和机械硬盘的方法总结

《Linux区分SSD和机械硬盘的方法总结》在Linux系统管理中,了解存储设备的类型和特性是至关重要的,不同的存储介质(如固态硬盘SSD和机械硬盘HDD)在性能、可靠性和适用场景上有着显著差异,本文... 目录一、lsblk 命令简介基本用法二、识别磁盘类型的关键参数:ROTA查询 ROTA 参数ROTA

Qt实现网络数据解析的方法总结

《Qt实现网络数据解析的方法总结》在Qt中解析网络数据通常涉及接收原始字节流,并将其转换为有意义的应用层数据,这篇文章为大家介绍了详细步骤和示例,感兴趣的小伙伴可以了解下... 目录1. 网络数据接收2. 缓冲区管理(处理粘包/拆包)3. 常见数据格式解析3.1 jsON解析3.2 XML解析3.3 自定义