NVIDIA RTX A6000/RTX3090/3080/3070深度学习训练/GPU服务器硬件配置推荐2021

本文主要是介绍NVIDIA RTX A6000/RTX3090/3080/3070深度学习训练/GPU服务器硬件配置推荐2021,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

本方案中,推荐配置报价更新日期:2021/03/06

变更原因:

1)近期唯利是图的厂家将RTX显卡大部分卖给挖矿的,造成断货、暴涨

2)RTX A6000上市、增加新GPU配置方案

3)GX630M保证6块GPU卡全部在Pcie 16X(6个 16x)带宽,而不是市场其他品牌机型是4个16x+2个8x

 

nvidia的 Ampere架构-RTX 3090上市,该卡是第一个拥有超1万个流处理器的最强算力GPU卡,由于该卡外形尺寸巨大,长度达313mm,厚度3个槽,另外功耗到350w,常规GPU计算机/工作站最多支持1~2块,市场上是否有支持更多RTX3090的硬件配置?
西安坤隆公司的UltraLAB GX630M深度学习工作站可支持到最大6块RTX3090卡或7块RTX3070,用于深度学习训练和推理,该配置的深度学习工作站的张量计算单元(Tensor Core)FP16性能理论达到1.7PTflops

(一)UltraLAB深度学习工作站支持RTX30情况

 

No

机型

关键配置

备注

1

GX380i

/GX390i

intel第9/10代高频

(8核@5Ghz-10核5.2GHz)

最大2块RTX30系列

内存最大128GB

静音级

2块RTX3090性能超4块Titan RTX,

2块RTX3080性能超4块RTX2080ti

2

GT410P

intel第10代至尊处理器

(10核4.6GHz-18核4.2GHz),

内存最大256GB

最大5块RTX30系列,

20个硬盘位

静音级

4块RTX3080性能超7块Titan RTX和8块2080Ti

3

GX630M

2颗Xeon(最大56核)

最大6-7块RTX30系列

20个硬盘位

静音级

是目前具有最高GPU算力的工作站


UltraLAB深度学习工作站-GPU配备规格

下表是UltraLAB深度学习机型可供配置组合(按最高性能指标降序)

 

No

型号

卡数

CUDA核数

FP32 (单位Tflops)

张量计算FP16(单位Tflops)

显存带宽GBs

显存合计GB

应用推荐

 

1

A6000

7

75264

280

2184

768

336

CNN+RNN

2

RTX3090

7

73472

249

1995

936

168

CNN+RNN

3

A6000

6

64512

240

1872

768

288

CNN+RNN

4

RTX3080

8

69632

238

1904

760

80

CNN

5

Tesla V100

16

81920

238

1760

653

192

CNN+RNN

6

RTX3090

6

62976

213

1710

936

144

CNN+RNN

7

RTX3080

6

52224

179

1428

760

60

CNN

8

RTX3090

5

52480

178

1425

936

120

CNN+RNN

9

A6000

4

83968

160

1248

768

192

CNN+RNN

10

RTX3080

5

43520

149

1190

760

50

CNN

11

RTX3090

4

41984

142

1140

936

96

CNN+RNN

12

RTX3070

7

41216

142

1141

448

56

CNN

13

RTX2080Ti

9

39168

121

990

616

99

CNN

14

RTX3070

6

35328

122

978

448

48

CNN

15

RTX3080

4

34816

119

952

760

40

CNN

16

Titan RTX

7

32256

114

910

672

168

CNN+RNN

17

RTX2080Ti

8

34816

108

880

616

88

CNN

18

RTX3090

3

41984

107

855

936

72

CNN+RNN

19

RTX3070

5

29440

102

815

448

40

CNN

20

RTX3080

3

34816

89

714

760

40

CNN

21

RTX3070

4

23552

81

652

448

32

CNN

22

A6000

2

21504

80

624

768

96

CNN+RNN

23

RTX3090

2

20992

71

570

936

48

CNN+RNN

24

Titan RTX

4

18432

65

520

672

96

CNN+RNN

25

RTX3070

3

23552

61

489

448

24

CNN

26

RTX3080

2

17408

60

476

760

20

CNN

27

RTX2080Ti

4

17408

54

440

616

44

CNN

28

RTX2080s

4

12288

44

252

496

32

CNN

29

RTX3070

2

11776

41

326

448

16

CNN

30

A6000

1

10752

40

312

768

48

CNN+RNN

31

RTX3090

1

10496

36

285

936

24

CNN+RNN

32

Titan RTX

2

9216

32

260

672

48

CNN+RNN

33

RTX3080

1

8704

30

238

760

10

CNN

34

RTX2080Ti

2

8704

28

220

616

22

CNN

35

RTX2080s

2

3072

22

126

496

16

CNN

36

RTX3070

1

5888

20

163

448

8

CNN

37

Titan RTX

1

4608

16

130

672

24

CNN+RNN

38

TITAN V

1

5120

14.90

110

652.80

12

 

39

RTX2080Ti

1

4352

13

110

616

11

CNN

 

 

从上述表格看:

(1) 6块RTX3090(6个全pcie 16x)已经接近nvidia DGX-2性能

(2) 4块RTX3090性能超9块RTX2080Ti或7块Titan RTX

(3)2块RTX3080性能超4块Titan RTX

(二)UltraLAB 深度学习工作站配置方案2020v4

2.1 图灵超算工作站GX380i配置方案-科研型

 

GX480i-01.jpg

 

No

产品型号

主要配置

显存

CUDA处理器FP16性能指标

单位:Tflops

张量处理器FP16性能指标

单位:Tflops

理想算法

价格

1.1

UltraLAB GX380i 14932-SAX

intel第9代处理器(6核@4.9Ghz) /32GB DDR4/RTX3080 10GB/960GB SSD /4TB SATA/双塔式(2000w) /23"图显

10GB

30

238

CNNRNN

¥35,500

1.2

UltraLAB GX380i 14932-SBT

intel第9代处理器(8核@4.9Ghz) /32GB DDR4/

RTX3090 24GB/1.9TB SSD /8TB SATA/双塔式(2000w) /23"图显

24GB

36

285

CNNRNN

¥49,990

1.3

UltraLAB GX380i 14932-SA2X

intel第9代处理器(8核@4.9Ghz ) /32GB DDR4 /2*RTX3070/1.9TB SSD /6TB SATA/双塔式(2000w)/23"图显

16GB

41

326

CNN

¥49,990

1.4

UltraLAB GX390i 15064-SB2X

intel第10代处理器(10核@5.0Ghz) /64GB DDR4 /2*RTX3080/1.9TB SSD /6TB SATA/双塔式(2000w)/23"图显

20GB

60

476

CNN

¥62,600

1.5

UltraLAB GX390i 15096-SC2T

intel第10代处理器(10核5.0Ghz) /96GB DDR4 /2*RTX3090/3.84TB SSD /8TB SATA/双塔式(2000w)/23"图显

48GB

71

570

CNNRNN

¥79,990

1.6UltraLAB GX390i 15096-SC2E

intel第10代处理器(10核5.0Ghz) /96GB DDR4 /2*A6000/3.84TB SSD /8TB SATA/双塔式(2000w)/23"图显

96GB80624

CNNRNN

¥145,000


2.2 图灵超算工作站(GT410P)配置推荐-高性能型
 

GX490M-4.jpg

 

No

产品型号

主要配置

显存

CUDA处理器FP16性能指标

单位:Tflops

张量处理器FP16性能指标

单位:Tflops

理想算法

价格

2.1

UltraLAB GT410P 14664-MB4X

intel第10代至尊处理器

(10核4.6Ghz )、64GB DDR4 /4*RTX3070/2TB SSD M2.SSD +6TB SATA/双塔式(双2000w) /27"-4K图显

32GB

81

652

CNN

¥94,500

2.2

UltraLAB GT410P 14596-MB5X

intel第10代至尊处理器

(12核4.5Ghz )、96GB DDR4 /5*RTX3070/2TB SSD M2.SSD +8TB SATA/双塔式(双2000w) /27"-4K图显

40GB

102

815

CNN

¥110,000

2.3

UltraLAB GT410P 145128-PC3T

intel第10代至尊处理器

(12核4.5Ghz )、128GB DDR4 /3*RTX3090/ 4TB Pci-SSD+ 10TB SATA/ 双塔式(双2000w)/27"-4K图显

72GB

107

855

CNNRNN

¥135,000

2.4

UltraLAB GT410P 14596-PC4X

intel第10代至尊处理器

(12核4.5Ghz )、96GB DDR4 /4*RTX3080/4TB Pci-SSD+ 10TB SATA/双塔式(双2000w) /27"-4K图显

40GB

119

952

CNN

¥119,000

2.5

UltraLAB GT410P 144192-PC4T

intel第10代至尊处理器

(14核4.4Ghz )、192GB DDR4 /4*RTX30904TB Pci-SSD+ 12TB SATA/双塔式(双2000w) /27"-4K图显

96GB

142

1140

CNNRNN

¥159,990

2.6

UltraLAB GT410P 144128-PC5X

intel第10代至尊处理器

(14核4.4Ghz )、128GB DDR4 /5*RTX3080/4TB Pci-SSD+ 10TB SATA/双塔式(双2000w) /27"-4K图显

50GB

149

1190

CNN

¥139,990

2.7

UltraLAB GT410P 144256-PD5T

intel第10代至尊处理器

(14核4.4Ghz)、256GB DDR4 /5*RTX3090/6.4TB Pci-SSD+ 12TB SATA/双塔式(双2000w) /27"-4K图显

120GB

178

1425

CNNRNN

¥185,000

2.8UltraLAB GT410P 144256-PD5E

intel第10代至尊处理器

(14核4.4Ghz)、256GB DDR4 /5*A6000/6.4TB Pci-SSD+ 12TB SATA/双塔式(双2000w) /27"-4K图显

240GB2001560

CNNRNN

¥335,000

 


2.3 图灵超算工作站(GX630M)配置推荐-极致型

 

GX480M-02D1.jpg

 

No

产品型号

主要配置

显存

CUDA处理器FP16性能指标

单位:Tflops

张量处理器FP16性能指标

单位:Tflops

理想算法

价格

3.1

UltraLAB GX630M 243192-MB6X

2*Xeon金6244(16核4.3GHz)/睿频4.4GHz/192GB DDR4 /6*RTX3070 /1.92TB SSD+2TB M2.SSD/42TB存储/双塔式(双2000w)/27"-4K图显

48GB

122

978

CNN

¥199,990

3.2

UltraLAB GX630M 243256-MB7X

2*Xeon金6244(16核4.3GHz)/睿频4.4GHz/192GB DDR4 /7*RTX3070 /1.92TB SSD+2TB M2.SSD/56TB存储/双塔式(双2000w)/27"-4K图显

56GB

142

1141

CNN

¥220,000

3.3

ltraLAB GX630M 243256-PC5X

2*Xeon金6244(16核4.3GHz)/睿频4.4GHz/256GB DDR4 /5*RTX3080 /1.92TB SSD+4TB P-SSD/70TB存储/双塔式(双2000w)/27"-4K图显

50GB

149

1190

CNN

¥223,000

3.4UltraLAB GX630M 241384-PC6X

2*Xeon金6246(24核4.1GHz)/睿频4.2GHz /384GB DDR4 /6*RTX3080 /1.9TB SSD+4TB P-SSD/70TB并行存储/双塔式(双2000w)/27"-4K图显

60GB1791428CNN¥248,000

3.5

UltraLAB GX630M 243192-MB4T

2*Xeon金6244(16核4.3GHz)/睿频4.3GHz/192GB DDR4 /4*RTX3090 /1.9TB SSD+2TB M2.SSD/56TB存储/双塔式(双2000w)/27"-4K图显

96GB1421140

CNNRNN

¥256,000

3.6

UltraLAB GX630M 241384-PD5T2*Xeon金6246(24核4.1GHz)/睿频4.2GHz /384GB DDR4 /5*RTX3090 /1.92TB SSD+4TB P-SSD/90TB并行存储/双塔/27"-4K图120GB1781425

CNNRNN

¥299,000

3.7

UltraLAB GX630M 243768-180T6T

2*Xeon金6256(24核4.3GHz)/   睿频4.5GHz /768GB DDR4 /6*RTX3090(三槽)/3.84TB SSD +180TB并行存储/双塔式(双2000w)/32"-4K图显

144GB

213

1710

性能近16块Titan V

¥375,000

 3.8UltraLAB GX630M 243768-180T7T

2*Xeon金6256(24核4.3GHz)/   睿频4.5GHz /768GB DDR4 /7*RTX3090(双槽)/4TB P-SSD +180TB并行存储/双塔式(双2000w)/32"-4K图显

168GB2491990

最快最完美,性能超DGX-2

 ¥399,900
 3.9UltraLAB GX630M 243384-150T4E

2*Xeon金6256(24核4.3GHz)/睿频4.5GHz /384GB DDR4 /4*A6000  /4TB P-SSD+150TB并行存储/双塔式(双2000w)/32"-4K图显

192GB1601250

CNN+  RNN+  推理

 ¥399,900

3.10

UltraLAB GX630M 2331T-150T7E

2*Xeon金6254(36核3.9GHz)/睿频4.0GHz/1TB DDR4 /7*A6000 /双3.84TB SSD+6.4TB-P-SSD/240TB 并行存储/双塔式(双2000w) /32"-4K图显

336GB

280

2180

最强最完整

¥650,000

 

上述配置可以看出:

(1)UltraLAB GX630M大部分配置都已超越9块RTX2080ti/7块Titan RTX性能

(2)UltraLAB GX630M(编号3.7)的配置规格,其性能已经接近nvidia DGX-2,但其价格是DGX-2的1/10价格

 

欢迎测试验证

 

 

这篇关于NVIDIA RTX A6000/RTX3090/3080/3070深度学习训练/GPU服务器硬件配置推荐2021的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/757101

相关文章

MySQL数据库双机热备的配置方法详解

《MySQL数据库双机热备的配置方法详解》在企业级应用中,数据库的高可用性和数据的安全性是至关重要的,MySQL作为最流行的开源关系型数据库管理系统之一,提供了多种方式来实现高可用性,其中双机热备(M... 目录1. 环境准备1.1 安装mysql1.2 配置MySQL1.2.1 主服务器配置1.2.2 从

Java中Redisson 的原理深度解析

《Java中Redisson的原理深度解析》Redisson是一个高性能的Redis客户端,它通过将Redis数据结构映射为Java对象和分布式对象,实现了在Java应用中方便地使用Redis,本文... 目录前言一、核心设计理念二、核心架构与通信层1. 基于 Netty 的异步非阻塞通信2. 编解码器三、

Java HashMap的底层实现原理深度解析

《JavaHashMap的底层实现原理深度解析》HashMap基于数组+链表+红黑树结构,通过哈希算法和扩容机制优化性能,负载因子与树化阈值平衡效率,是Java开发必备的高效数据结构,本文给大家介绍... 目录一、概述:HashMap的宏观结构二、核心数据结构解析1. 数组(桶数组)2. 链表节点(Node

Java 虚拟线程的创建与使用深度解析

《Java虚拟线程的创建与使用深度解析》虚拟线程是Java19中以预览特性形式引入,Java21起正式发布的轻量级线程,本文给大家介绍Java虚拟线程的创建与使用,感兴趣的朋友一起看看吧... 目录一、虚拟线程简介1.1 什么是虚拟线程?1.2 为什么需要虚拟线程?二、虚拟线程与平台线程对比代码对比示例:三

Python函数作用域与闭包举例深度解析

《Python函数作用域与闭包举例深度解析》Python函数的作用域规则和闭包是编程中的关键概念,它们决定了变量的访问和生命周期,:本文主要介绍Python函数作用域与闭包的相关资料,文中通过代码... 目录1. 基础作用域访问示例1:访问全局变量示例2:访问外层函数变量2. 闭包基础示例3:简单闭包示例4

Linux云服务器手动配置DNS的方法步骤

《Linux云服务器手动配置DNS的方法步骤》在Linux云服务器上手动配置DNS(域名系统)是确保服务器能够正常解析域名的重要步骤,以下是详细的配置方法,包括系统文件的修改和常见问题的解决方案,需要... 目录1. 为什么需要手动配置 DNS?2. 手动配置 DNS 的方法方法 1:修改 /etc/res

mysql8.0.43使用InnoDB Cluster配置主从复制

《mysql8.0.43使用InnoDBCluster配置主从复制》本文主要介绍了mysql8.0.43使用InnoDBCluster配置主从复制,文中通过示例代码介绍的非常详细,对大家的学习或者... 目录1、配置Hosts解析(所有服务器都要执行)2、安装mysql shell(所有服务器都要执行)3、

java程序远程debug原理与配置全过程

《java程序远程debug原理与配置全过程》文章介绍了Java远程调试的JPDA体系,包含JVMTI监控JVM、JDWP传输调试命令、JDI提供调试接口,通过-Xdebug、-Xrunjdwp参数配... 目录背景组成模块间联系IBM对三个模块的详细介绍编程使用总结背景日常工作中,每个程序员都会遇到bu

macOS彻底卸载Python的超完整指南(推荐!)

《macOS彻底卸载Python的超完整指南(推荐!)》随着python解释器的不断更新升级和项目开发需要,有时候会需要升级或者降级系统中的python的版本,系统中留存的Pytho版本如果没有卸载干... 目录MACOS 彻底卸载 python 的完整指南重要警告卸载前检查卸载方法(按安装方式)1. 卸载

JDK8(Java Development kit)的安装与配置全过程

《JDK8(JavaDevelopmentkit)的安装与配置全过程》文章简要介绍了Java的核心特点(如跨平台、JVM机制)及JDK/JRE的区别,重点讲解了如何通过配置环境变量(PATH和JA... 目录Java特点JDKJREJDK的下载,安装配置环境变量总结Java特点说起 Java,大家肯定都