NVIDIA RTX A6000/RTX3090/3080/3070深度学习训练/GPU服务器硬件配置推荐2021

本文主要是介绍NVIDIA RTX A6000/RTX3090/3080/3070深度学习训练/GPU服务器硬件配置推荐2021,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

本方案中,推荐配置报价更新日期:2021/03/06

变更原因:

1)近期唯利是图的厂家将RTX显卡大部分卖给挖矿的,造成断货、暴涨

2)RTX A6000上市、增加新GPU配置方案

3)GX630M保证6块GPU卡全部在Pcie 16X(6个 16x)带宽,而不是市场其他品牌机型是4个16x+2个8x

 

nvidia的 Ampere架构-RTX 3090上市,该卡是第一个拥有超1万个流处理器的最强算力GPU卡,由于该卡外形尺寸巨大,长度达313mm,厚度3个槽,另外功耗到350w,常规GPU计算机/工作站最多支持1~2块,市场上是否有支持更多RTX3090的硬件配置?
西安坤隆公司的UltraLAB GX630M深度学习工作站可支持到最大6块RTX3090卡或7块RTX3070,用于深度学习训练和推理,该配置的深度学习工作站的张量计算单元(Tensor Core)FP16性能理论达到1.7PTflops

(一)UltraLAB深度学习工作站支持RTX30情况

 

No

机型

关键配置

备注

1

GX380i

/GX390i

intel第9/10代高频

(8核@5Ghz-10核5.2GHz)

最大2块RTX30系列

内存最大128GB

静音级

2块RTX3090性能超4块Titan RTX,

2块RTX3080性能超4块RTX2080ti

2

GT410P

intel第10代至尊处理器

(10核4.6GHz-18核4.2GHz),

内存最大256GB

最大5块RTX30系列,

20个硬盘位

静音级

4块RTX3080性能超7块Titan RTX和8块2080Ti

3

GX630M

2颗Xeon(最大56核)

最大6-7块RTX30系列

20个硬盘位

静音级

是目前具有最高GPU算力的工作站


UltraLAB深度学习工作站-GPU配备规格

下表是UltraLAB深度学习机型可供配置组合(按最高性能指标降序)

 

No

型号

卡数

CUDA核数

FP32 (单位Tflops)

张量计算FP16(单位Tflops)

显存带宽GBs

显存合计GB

应用推荐

 

1

A6000

7

75264

280

2184

768

336

CNN+RNN

2

RTX3090

7

73472

249

1995

936

168

CNN+RNN

3

A6000

6

64512

240

1872

768

288

CNN+RNN

4

RTX3080

8

69632

238

1904

760

80

CNN

5

Tesla V100

16

81920

238

1760

653

192

CNN+RNN

6

RTX3090

6

62976

213

1710

936

144

CNN+RNN

7

RTX3080

6

52224

179

1428

760

60

CNN

8

RTX3090

5

52480

178

1425

936

120

CNN+RNN

9

A6000

4

83968

160

1248

768

192

CNN+RNN

10

RTX3080

5

43520

149

1190

760

50

CNN

11

RTX3090

4

41984

142

1140

936

96

CNN+RNN

12

RTX3070

7

41216

142

1141

448

56

CNN

13

RTX2080Ti

9

39168

121

990

616

99

CNN

14

RTX3070

6

35328

122

978

448

48

CNN

15

RTX3080

4

34816

119

952

760

40

CNN

16

Titan RTX

7

32256

114

910

672

168

CNN+RNN

17

RTX2080Ti

8

34816

108

880

616

88

CNN

18

RTX3090

3

41984

107

855

936

72

CNN+RNN

19

RTX3070

5

29440

102

815

448

40

CNN

20

RTX3080

3

34816

89

714

760

40

CNN

21

RTX3070

4

23552

81

652

448

32

CNN

22

A6000

2

21504

80

624

768

96

CNN+RNN

23

RTX3090

2

20992

71

570

936

48

CNN+RNN

24

Titan RTX

4

18432

65

520

672

96

CNN+RNN

25

RTX3070

3

23552

61

489

448

24

CNN

26

RTX3080

2

17408

60

476

760

20

CNN

27

RTX2080Ti

4

17408

54

440

616

44

CNN

28

RTX2080s

4

12288

44

252

496

32

CNN

29

RTX3070

2

11776

41

326

448

16

CNN

30

A6000

1

10752

40

312

768

48

CNN+RNN

31

RTX3090

1

10496

36

285

936

24

CNN+RNN

32

Titan RTX

2

9216

32

260

672

48

CNN+RNN

33

RTX3080

1

8704

30

238

760

10

CNN

34

RTX2080Ti

2

8704

28

220

616

22

CNN

35

RTX2080s

2

3072

22

126

496

16

CNN

36

RTX3070

1

5888

20

163

448

8

CNN

37

Titan RTX

1

4608

16

130

672

24

CNN+RNN

38

TITAN V

1

5120

14.90

110

652.80

12

 

39

RTX2080Ti

1

4352

13

110

616

11

CNN

 

 

从上述表格看:

(1) 6块RTX3090(6个全pcie 16x)已经接近nvidia DGX-2性能

(2) 4块RTX3090性能超9块RTX2080Ti或7块Titan RTX

(3)2块RTX3080性能超4块Titan RTX

(二)UltraLAB 深度学习工作站配置方案2020v4

2.1 图灵超算工作站GX380i配置方案-科研型

 

GX480i-01.jpg

 

No

产品型号

主要配置

显存

CUDA处理器FP16性能指标

单位:Tflops

张量处理器FP16性能指标

单位:Tflops

理想算法

价格

1.1

UltraLAB GX380i 14932-SAX

intel第9代处理器(6核@4.9Ghz) /32GB DDR4/RTX3080 10GB/960GB SSD /4TB SATA/双塔式(2000w) /23"图显

10GB

30

238

CNNRNN

¥35,500

1.2

UltraLAB GX380i 14932-SBT

intel第9代处理器(8核@4.9Ghz) /32GB DDR4/

RTX3090 24GB/1.9TB SSD /8TB SATA/双塔式(2000w) /23"图显

24GB

36

285

CNNRNN

¥49,990

1.3

UltraLAB GX380i 14932-SA2X

intel第9代处理器(8核@4.9Ghz ) /32GB DDR4 /2*RTX3070/1.9TB SSD /6TB SATA/双塔式(2000w)/23"图显

16GB

41

326

CNN

¥49,990

1.4

UltraLAB GX390i 15064-SB2X

intel第10代处理器(10核@5.0Ghz) /64GB DDR4 /2*RTX3080/1.9TB SSD /6TB SATA/双塔式(2000w)/23"图显

20GB

60

476

CNN

¥62,600

1.5

UltraLAB GX390i 15096-SC2T

intel第10代处理器(10核5.0Ghz) /96GB DDR4 /2*RTX3090/3.84TB SSD /8TB SATA/双塔式(2000w)/23"图显

48GB

71

570

CNNRNN

¥79,990

1.6UltraLAB GX390i 15096-SC2E

intel第10代处理器(10核5.0Ghz) /96GB DDR4 /2*A6000/3.84TB SSD /8TB SATA/双塔式(2000w)/23"图显

96GB80624

CNNRNN

¥145,000


2.2 图灵超算工作站(GT410P)配置推荐-高性能型
 

GX490M-4.jpg

 

No

产品型号

主要配置

显存

CUDA处理器FP16性能指标

单位:Tflops

张量处理器FP16性能指标

单位:Tflops

理想算法

价格

2.1

UltraLAB GT410P 14664-MB4X

intel第10代至尊处理器

(10核4.6Ghz )、64GB DDR4 /4*RTX3070/2TB SSD M2.SSD +6TB SATA/双塔式(双2000w) /27"-4K图显

32GB

81

652

CNN

¥94,500

2.2

UltraLAB GT410P 14596-MB5X

intel第10代至尊处理器

(12核4.5Ghz )、96GB DDR4 /5*RTX3070/2TB SSD M2.SSD +8TB SATA/双塔式(双2000w) /27"-4K图显

40GB

102

815

CNN

¥110,000

2.3

UltraLAB GT410P 145128-PC3T

intel第10代至尊处理器

(12核4.5Ghz )、128GB DDR4 /3*RTX3090/ 4TB Pci-SSD+ 10TB SATA/ 双塔式(双2000w)/27"-4K图显

72GB

107

855

CNNRNN

¥135,000

2.4

UltraLAB GT410P 14596-PC4X

intel第10代至尊处理器

(12核4.5Ghz )、96GB DDR4 /4*RTX3080/4TB Pci-SSD+ 10TB SATA/双塔式(双2000w) /27"-4K图显

40GB

119

952

CNN

¥119,000

2.5

UltraLAB GT410P 144192-PC4T

intel第10代至尊处理器

(14核4.4Ghz )、192GB DDR4 /4*RTX30904TB Pci-SSD+ 12TB SATA/双塔式(双2000w) /27"-4K图显

96GB

142

1140

CNNRNN

¥159,990

2.6

UltraLAB GT410P 144128-PC5X

intel第10代至尊处理器

(14核4.4Ghz )、128GB DDR4 /5*RTX3080/4TB Pci-SSD+ 10TB SATA/双塔式(双2000w) /27"-4K图显

50GB

149

1190

CNN

¥139,990

2.7

UltraLAB GT410P 144256-PD5T

intel第10代至尊处理器

(14核4.4Ghz)、256GB DDR4 /5*RTX3090/6.4TB Pci-SSD+ 12TB SATA/双塔式(双2000w) /27"-4K图显

120GB

178

1425

CNNRNN

¥185,000

2.8UltraLAB GT410P 144256-PD5E

intel第10代至尊处理器

(14核4.4Ghz)、256GB DDR4 /5*A6000/6.4TB Pci-SSD+ 12TB SATA/双塔式(双2000w) /27"-4K图显

240GB2001560

CNNRNN

¥335,000

 


2.3 图灵超算工作站(GX630M)配置推荐-极致型

 

GX480M-02D1.jpg

 

No

产品型号

主要配置

显存

CUDA处理器FP16性能指标

单位:Tflops

张量处理器FP16性能指标

单位:Tflops

理想算法

价格

3.1

UltraLAB GX630M 243192-MB6X

2*Xeon金6244(16核4.3GHz)/睿频4.4GHz/192GB DDR4 /6*RTX3070 /1.92TB SSD+2TB M2.SSD/42TB存储/双塔式(双2000w)/27"-4K图显

48GB

122

978

CNN

¥199,990

3.2

UltraLAB GX630M 243256-MB7X

2*Xeon金6244(16核4.3GHz)/睿频4.4GHz/192GB DDR4 /7*RTX3070 /1.92TB SSD+2TB M2.SSD/56TB存储/双塔式(双2000w)/27"-4K图显

56GB

142

1141

CNN

¥220,000

3.3

ltraLAB GX630M 243256-PC5X

2*Xeon金6244(16核4.3GHz)/睿频4.4GHz/256GB DDR4 /5*RTX3080 /1.92TB SSD+4TB P-SSD/70TB存储/双塔式(双2000w)/27"-4K图显

50GB

149

1190

CNN

¥223,000

3.4UltraLAB GX630M 241384-PC6X

2*Xeon金6246(24核4.1GHz)/睿频4.2GHz /384GB DDR4 /6*RTX3080 /1.9TB SSD+4TB P-SSD/70TB并行存储/双塔式(双2000w)/27"-4K图显

60GB1791428CNN¥248,000

3.5

UltraLAB GX630M 243192-MB4T

2*Xeon金6244(16核4.3GHz)/睿频4.3GHz/192GB DDR4 /4*RTX3090 /1.9TB SSD+2TB M2.SSD/56TB存储/双塔式(双2000w)/27"-4K图显

96GB1421140

CNNRNN

¥256,000

3.6

UltraLAB GX630M 241384-PD5T2*Xeon金6246(24核4.1GHz)/睿频4.2GHz /384GB DDR4 /5*RTX3090 /1.92TB SSD+4TB P-SSD/90TB并行存储/双塔/27"-4K图120GB1781425

CNNRNN

¥299,000

3.7

UltraLAB GX630M 243768-180T6T

2*Xeon金6256(24核4.3GHz)/   睿频4.5GHz /768GB DDR4 /6*RTX3090(三槽)/3.84TB SSD +180TB并行存储/双塔式(双2000w)/32"-4K图显

144GB

213

1710

性能近16块Titan V

¥375,000

 3.8UltraLAB GX630M 243768-180T7T

2*Xeon金6256(24核4.3GHz)/   睿频4.5GHz /768GB DDR4 /7*RTX3090(双槽)/4TB P-SSD +180TB并行存储/双塔式(双2000w)/32"-4K图显

168GB2491990

最快最完美,性能超DGX-2

 ¥399,900
 3.9UltraLAB GX630M 243384-150T4E

2*Xeon金6256(24核4.3GHz)/睿频4.5GHz /384GB DDR4 /4*A6000  /4TB P-SSD+150TB并行存储/双塔式(双2000w)/32"-4K图显

192GB1601250

CNN+  RNN+  推理

 ¥399,900

3.10

UltraLAB GX630M 2331T-150T7E

2*Xeon金6254(36核3.9GHz)/睿频4.0GHz/1TB DDR4 /7*A6000 /双3.84TB SSD+6.4TB-P-SSD/240TB 并行存储/双塔式(双2000w) /32"-4K图显

336GB

280

2180

最强最完整

¥650,000

 

上述配置可以看出:

(1)UltraLAB GX630M大部分配置都已超越9块RTX2080ti/7块Titan RTX性能

(2)UltraLAB GX630M(编号3.7)的配置规格,其性能已经接近nvidia DGX-2,但其价格是DGX-2的1/10价格

 

欢迎测试验证

 

 

这篇关于NVIDIA RTX A6000/RTX3090/3080/3070深度学习训练/GPU服务器硬件配置推荐2021的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/757101

相关文章

mybatis映射器配置小结

《mybatis映射器配置小结》本文详解MyBatis映射器配置,重点讲解字段映射的三种解决方案(别名、自动驼峰映射、resultMap),文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定... 目录select中字段的映射问题使用SQL语句中的别名功能使用mapUnderscoreToCame

Linux下MySQL数据库定时备份脚本与Crontab配置教学

《Linux下MySQL数据库定时备份脚本与Crontab配置教学》在生产环境中,数据库是核心资产之一,定期备份数据库可以有效防止意外数据丢失,本文将分享一份MySQL定时备份脚本,并讲解如何通过cr... 目录备份脚本详解脚本功能说明授权与可执行权限使用 Crontab 定时执行编辑 Crontab添加定

Java使用jar命令配置服务器端口的完整指南

《Java使用jar命令配置服务器端口的完整指南》本文将详细介绍如何使用java-jar命令启动应用,并重点讲解如何配置服务器端口,同时提供一个实用的Web工具来简化这一过程,希望对大家有所帮助... 目录1. Java Jar文件简介1.1 什么是Jar文件1.2 创建可执行Jar文件2. 使用java

SpringBoot 多环境开发实战(从配置、管理与控制)

《SpringBoot多环境开发实战(从配置、管理与控制)》本文详解SpringBoot多环境配置,涵盖单文件YAML、多文件模式、MavenProfile分组及激活策略,通过优先级控制灵活切换环境... 目录一、多环境开发基础(单文件 YAML 版)(一)配置原理与优势(二)实操示例二、多环境开发多文件版

Vite 打包目录结构自定义配置小结

《Vite打包目录结构自定义配置小结》在Vite工程开发中,默认打包后的dist目录资源常集中在asset目录下,不利于资源管理,本文基于Rollup配置原理,本文就来介绍一下通过Vite配置自定义... 目录一、实现原理二、具体配置步骤1. 基础配置文件2. 配置说明(1)js 资源分离(2)非 JS 资

MySQL8 密码强度评估与配置详解

《MySQL8密码强度评估与配置详解》MySQL8默认启用密码强度插件,实施MEDIUM策略(长度8、含数字/字母/特殊字符),支持动态调整与配置文件设置,推荐使用STRONG策略并定期更新密码以提... 目录一、mysql 8 密码强度评估机制1.核心插件:validate_password2.密码策略级

ShardingProxy读写分离之原理、配置与实践过程

《ShardingProxy读写分离之原理、配置与实践过程》ShardingProxy是ApacheShardingSphere的数据库中间件,通过三层架构实现读写分离,解决高并发场景下数据库性能瓶... 目录一、ShardingProxy技术定位与读写分离核心价值1.1 技术定位1.2 读写分离核心价值二

深度解析Python中递归下降解析器的原理与实现

《深度解析Python中递归下降解析器的原理与实现》在编译器设计、配置文件处理和数据转换领域,递归下降解析器是最常用且最直观的解析技术,本文将详细介绍递归下降解析器的原理与实现,感兴趣的小伙伴可以跟随... 目录引言:解析器的核心价值一、递归下降解析器基础1.1 核心概念解析1.2 基本架构二、简单算术表达

深度解析Java @Serial 注解及常见错误案例

《深度解析Java@Serial注解及常见错误案例》Java14引入@Serial注解,用于编译时校验序列化成员,替代传统方式解决运行时错误,适用于Serializable类的方法/字段,需注意签... 目录Java @Serial 注解深度解析1. 注解本质2. 核心作用(1) 主要用途(2) 适用位置3

QT Creator配置Kit的实现示例

《QTCreator配置Kit的实现示例》本文主要介绍了使用Qt5.12.12与VS2022时,因MSVC编译器版本不匹配及WindowsSDK缺失导致配置错误的问题解决,感兴趣的可以了解一下... 目录0、背景:qt5.12.12+vs2022一、症状:二、原因:(可以跳过,直奔后面的解决方法)三、解决方