Nvidia DGX 系统分析和探讨

2024-04-15 21:28
文章标签 nvidia 探讨 系统分析 dgx

本文主要是介绍Nvidia DGX 系统分析和探讨,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

NVIDIA DGX 互联结构

在这里插入图片描述
NVIDIA DGX 是Nvidia 推出的turnkey 解决方案,其中按照组合关系:

  • DGX GB200 System: NVL72
    • 36 Nvidia Grace CPU
    • 72 BlackWell GPU
    • 每台机柜包含18 个GB200 计算节点,每个节点包含2 个GB200s
    • 9 个NVSwitches Tray 节点,每个2 颗 NVSwitch 芯片
    • 节点间使用nvlink 进行互联,互联线缆使用铜(Cooper),不需要光收发器(铜进光退)

    1.4 exaFLOPS of AI performance, 30 terabytes (TB) of fast memory, and 130 terabytes per second (TB/s) of bidirectional GPU bandwidth.

在这里插入图片描述
下图为1U 高度的NVL72 单节点实物形态,其中每个节点包含两组GB200s 系统,整合水冷散热。

![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/987b768da14344eab5fc9201aecc41ed.png在这里插入图片描述

实物NVL72 机柜
![实物NVL72 机柜](https://img-blog.csdnimg.cn/direct/5398d8a1102a4a35acec66e85dc9e4d8.png
在这里插入图片描述

  • DGX SuperPOD™:最多576 组DGX GB200 系统组成超级pod
  • DGX GB200 BasePod

Rank 之间的互联通过 Infiniband
Rank 内的互联通 Nvlink

NVidia发布了GB200 NVL72 解决方案架构, 我们以公开的资料进一步探讨下NV的DGX 内部互联结构.

![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/c1fe6b6b88ba4226a0dfae63dd771c5f.png在这里插入图片描述

DGX 软件架构

作为TurnKey 解决方案, DGX 具备完备的软件栈, 实现开箱即用的交付.
在这里插入图片描述

这篇关于Nvidia DGX 系统分析和探讨的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/906967

相关文章

Java内存区域与内存溢出异常的详细探讨

《Java内存区域与内存溢出异常的详细探讨》:本文主要介绍Java内存区域与内存溢出异常的相关资料,分析异常原因并提供解决策略,如参数调整、代码优化等,帮助开发者排查内存问题,需要的朋友可以参考下... 目录一、引言二、Java 运行时数据区域(一)程序计数器(二)Java 虚拟机栈(三)本地方法栈(四)J

如何在Ubuntu上安装NVIDIA显卡驱动? Ubuntu安装英伟达显卡驱动教程

《如何在Ubuntu上安装NVIDIA显卡驱动?Ubuntu安装英伟达显卡驱动教程》Windows系统不同,Linux系统通常不会自动安装专有显卡驱动,今天我们就来看看Ubuntu系统安装英伟达显卡... 对于使用NVIDIA显卡的Ubuntu用户来说,正确安装显卡驱动是获得最佳图形性能的关键。与Windo

一台电脑对应一个IP地址吗?‌探讨两台电脑共用IP的可能性

在当今数字化时代,‌IP地址作为网络世界中的“门牌号”,‌扮演着至关重要的角色。‌它负责在网络上唯一标识每一台设备,‌使得数据能够在庞大的互联网中准确无误地传输。‌然而,‌对于IP地址与电脑之间的对应关系,‌许多人可能存有疑惑:‌一台电脑是否必须对应一个IP地址?‌两台电脑又是否可以共用一个IP地址呢?‌本文将深入探讨这些问题,‌带您一窥IP地址背后的奥秘。‌ 一台电脑对应一个IP地址吗?‌

使用Python控制Excel应用:打开与关闭工作簿的技术性探讨

目录 引言 一、安装必要的库 1. xlwings 2. openpyxl 二、使用xlwings打开和关闭Excel工作簿 2.1 启动和退出Excel 2.2 打开和关闭工作簿 2.3 创建新工作簿 三、使用openpyxl打开和关闭Excel工作簿 3.1 打开工作簿 3.2 保存和关闭工作簿 四、案例分析 4.1 读取Excel文件中的数据 4.2 写入数据到E

Kubernetes的alpha.kubernetes.io/nvidia-gpu无法限制GPU个数

问题描述: Pod.yaml文件中关于GPU资源的设置如下: 然而在docker中运行GPU程序时,发现宿主机上的两块GPU都在跑。甚至在yaml文件中删除关于GPU的请求,在docker中都可以运行GPU。 原因: 上例说明alpha.kubernetes.io/nvidia-gpu无效。查看yaml文件,发现该docker开启了特权模式(privileged:ture): 而

Ubuntu安装docker及nvidia-docker2

Ubuntu 通过apt安装 Ubuntu安装docker后再安装nvidia-docker2时经常出现版本不匹配的问题,可以分以下两步安装: # 安装dockerexport VERSION=18.06.1-ce && curl -sSL get.docker.com | sh# 安装nvidia-docker2curl -s -L https://nvidia.github.io/nv

AI超周期现状 - NVIDIA、苹果以及人工智能的整体需求

于2024年6月6日在中国杭州拍摄的英伟达和苹果的标志。到6月5日,东部时间,英伟达的市值超过3万亿美元,正式超越苹果的市值,成为全球市值第二大的科技巨头。值得注意的是,短短3个多月时间里,英伟达的市值就从2万亿美元飙升至3万亿美元。(由Costfoto摄于NurPhoto,经盖蒂图片社批准) 在九月初经历了几天的市场动荡后,又有一波关于人工智能超级周期是否已结束的讨论。如果没有结束,那接下来会

Kafka的分区数与多线程消费探讨

大数据技术与架构 点击右侧关注,大数据开发领域最强公众号! 暴走大数据 点击右侧关注,暴走大数据! 典型的high-level Consumer的API如下: Properties props = new Properties(); props.put("zookeeper.connect", "xxxx:2181"); props.put("zookeeper.conne

centos 安装 nvidia的两种方式

大部分 Linux 发行版都使用开源的显卡驱动 nouveau,对于 nvidia 显卡来说,还是闭源的官方驱动的效果更好。最明显的一点是,在使用 SAC 拾取震相的时候,使用官方显卡驱动在刷新界面的时候要快很多。 对于 CentOS 用户而言,有两种安装 NVIDIA 显卡驱动的方法,从 ELRepo 源中安装或从源码编译驱动。对于一般的 CentOS 用户,建议使用第一种方法。 注意

java 深拷贝探讨

java 深拷贝探讨 本文将讨论以下4个问题 1. java Cloneable接口实现深拷贝2. java 序列化实现深拷贝3. 号称最快的深拷贝二方库cloning源码分析4. 几种拷贝方式速度的比较 深拷贝的概念本文就不说了。在C++中实现深拷贝一般情况下重载赋值操作符 “=” 来实现同一个类的对象间的深拷贝,所以很自然的在java中我们也同样可以定义一个copy函数,在函数内