NVIDIA RTX A6000/RTX3090/3080/3070深度学习训练/GPU服务器硬件配置推荐2021

本文主要是介绍NVIDIA RTX A6000/RTX3090/3080/3070深度学习训练/GPU服务器硬件配置推荐2021，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

本方案中，推荐配置报价更新日期：2021/03/06

变更原因：

1）近期唯利是图的厂家将RTX显卡大部分卖给挖矿的，造成断货、暴涨

2）RTX A6000上市、增加新GPU配置方案

3）GX630M保证6块GPU卡全部在Pcie 16X（6个 16x）带宽，而不是市场其他品牌机型是4个16x+2个8x

nvidia的 Ampere架构-RTX 3090上市，该卡是第一个拥有超1万个流处理器的最强算力GPU卡，由于该卡外形尺寸巨大，长度达313mm，厚度3个槽，另外功耗到350w，常规GPU计算机/工作站最多支持1~2块，市场上是否有支持更多RTX3090的硬件配置？
西安坤隆公司的UltraLAB GX630M深度学习工作站可支持到最大6块RTX3090卡或7块RTX3070，用于深度学习训练和推理，该配置的深度学习工作站的张量计算单元（Tensor Core）FP16性能理论达到1.7PTflops

（一）UltraLAB深度学习工作站支持RTX30情况

No	机型	关键配置	备注
1	GX380i /GX390i	intel第9/10代高频 (8核@5Ghz-10核5.2GHz）最大2块RTX30系列，内存最大128GB 静音级	2块RTX3090性能超4块Titan RTX， 2块RTX3080性能超4块RTX2080ti
2	GT410P	intel第10代至尊处理器 (10核4.6GHz-18核4.2GHz），内存最大256GB 最大5块RTX30系列， 20个硬盘位静音级	4块RTX3080性能超7块Titan RTX和8块2080Ti
3	GX630M	2颗Xeon（最大56核）最大6-7块RTX30系列 20个硬盘位静音级	是目前具有最高GPU算力的工作站

UltraLAB深度学习工作站-GPU配备规格

下表是UltraLAB深度学习机型可供配置组合（按最高性能指标降序）

No	型号	卡数	CUDA核数	FP32 (单位Tflops）	张量计算FP16(单位Tflops)	显存带宽GBs	显存合计GB	应用推荐
1	A6000	7块	75264	280	2184	768	336	CNN+RNN
2	RTX3090	7块	73472	249	1995	936	168	CNN+RNN
3	A6000	6块	64512	240	1872	768	288	CNN+RNN
4	RTX3080	8块	69632	238	1904	760	80	CNN
5	Tesla V100	16块	81920	238	1760	653	192	CNN+RNN
6	RTX3090	6块	62976	213	1710	936	144	CNN+RNN
7	RTX3080	6块	52224	179	1428	760	60	CNN
8	RTX3090	5块	52480	178	1425	936	120	CNN+RNN
9	A6000	4块	83968	160	1248	768	192	CNN+RNN
10	RTX3080	5块	43520	149	1190	760	50	CNN
11	RTX3090	4块	41984	142	1140	936	96	CNN+RNN
12	RTX3070	7块	41216	142	1141	448	56	CNN
13	RTX2080Ti	9块	39168	121	990	616	99	CNN
14	RTX3070	6块	35328	122	978	448	48	CNN
15	RTX3080	4块	34816	119	952	760	40	CNN
16	Titan RTX	7块	32256	114	910	672	168	CNN+RNN
17	RTX2080Ti	8块	34816	108	880	616	88	CNN
18	RTX3090	3块	41984	107	855	936	72	CNN+RNN
19	RTX3070	5块	29440	102	815	448	40	CNN
20	RTX3080	3块	34816	89	714	760	40	CNN
21	RTX3070	4块	23552	81	652	448	32	CNN
22	A6000	2块	21504	80	624	768	96	CNN+RNN
23	RTX3090	2块	20992	71	570	936	48	CNN+RNN
24	Titan RTX	4块	18432	65	520	672	96	CNN+RNN
25	RTX3070	3块	23552	61	489	448	24	CNN
26	RTX3080	2块	17408	60	476	760	20	CNN
27	RTX2080Ti	4块	17408	54	440	616	44	CNN
28	RTX2080s	4	12288	44	252	496	32	CNN
29	RTX3070	2块	11776	41	326	448	16	CNN
30	A6000	1块	10752	40	312	768	48	CNN+RNN
31	RTX3090	1块	10496	36	285	936	24	CNN+RNN
32	Titan RTX	2块	9216	32	260	672	48	CNN+RNN
33	RTX3080	1块	8704	30	238	760	10	CNN
34	RTX2080Ti	2块	8704	28	220	616	22	CNN
35	RTX2080s	2块	3072	22	126	496	16	CNN
36	RTX3070	1块	5888	20	163	448	8	CNN
37	Titan RTX	1块	4608	16	130	672	24	CNN+RNN
38	TITAN V	1	5120	14.90	110	652.80	12
39	RTX2080Ti	1块	4352	13	110	616	11	CNN

从上述表格看：

(1) 6块RTX3090(6个全pcie 16x)已经接近nvidia DGX-2性能

(2) 4块RTX3090性能超9块RTX2080Ti或7块Titan RTX

(3）2块RTX3080性能超4块Titan RTX

（二）UltraLAB 深度学习工作站配置方案2020v4

2.1 图灵超算工作站GX380i配置方案-科研型

No	产品型号	主要配置	显存	CUDA处理器FP16性能指标单位：Tflops	张量处理器FP16性能指标单位：Tflops	理想算法	价格
1.1	UltraLAB GX380i 14932-SAX	intel第9代处理器(6核@4.9Ghz) /32GB DDR4/RTX3080 10GB/960GB SSD /4TB SATA/双塔式(2000w) /23"图显	10GB	30	238	CNN+ RNN	¥35,500
1.2	UltraLAB GX380i 14932-SBT	intel第9代处理器(8核@4.9Ghz) /32GB DDR4/ RTX3090 24GB/1.9TB SSD /8TB SATA/双塔式(2000w) /23"图显	24GB	36	285	CNN+ RNN	¥49,990
1.3	UltraLAB GX380i 14932-SA2X	intel第9代处理器(8核@4.9Ghz ) /32GB DDR4 /*2RTX3070**/1.9TB SSD /6TB SATA/双塔式(2000w)/23"图显	16GB	41	326	CNN	¥49,990
1.4	UltraLAB GX390i 15064-SB2X	intel第10代处理器(10核@5.0Ghz) /64GB DDR4 /*2RTX3080**/1.9TB SSD /6TB SATA/双塔式(2000w)/23"图显	20GB	60	476	CNN	¥62,600
1.5	UltraLAB GX390i 15096-SC2T	intel第10代处理器(10核5.0Ghz) /96GB DDR4 /*2RTX3090**/3.84TB SSD /8TB SATA/双塔式(2000w)/23"图显	48GB	71	570	CNN+ RNN	¥79,990
1.6	UltraLAB GX390i 15096-SC2E	intel第10代处理器(10核5.0Ghz) /96GB DDR4 /*2A6000**/3.84TB SSD /8TB SATA/双塔式(2000w)/23"图显	96GB	80	624	CNN+ RNN	¥145,000

2.2 图灵超算工作站（GT410P）配置推荐-高性能型

No	产品型号	主要配置	显存	CUDA处理器FP16性能指标单位：Tflops	张量处理器FP16性能指标单位：Tflops	理想算法	价格
2.1	UltraLAB GT410P 14664-MB4X	intel第10代至尊处理器 (10核4.6Ghz )、64GB DDR4 /*4RTX307**0/2TB SSD M2.SSD +6TB SATA/双塔式(双2000w) /27"-4K图显	32GB	81	652	CNN	¥94,500
2.2	UltraLAB GT410P 14596-MB5X	intel第10代至尊处理器 (12核4.5Ghz )、96GB DDR4 /*5RTX3070**/2TB SSD M2.SSD +8TB SATA/双塔式(双2000w) /27"-4K图显	40GB	102	815	CNN	¥110,000
2.3	UltraLAB GT410P 145128-PC3T	intel第10代至尊处理器 (12核4.5Ghz )、128GB DDR4 /*3RTX3090**/ 4TB Pci-SSD+ 10TB SATA/ 双塔式(双2000w)/27"-4K图显	72GB	107	855	CNN+ RNN	¥135,000
2.4	UltraLAB GT410P 14596-PC4X	intel第10代至尊处理器 (12核4.5Ghz )、96GB DDR4 /*4RTX3080**/4TB Pci-SSD+ 10TB SATA/双塔式(双2000w) /27"-4K图显	40GB	119	952	CNN	¥119,000
2.5	UltraLAB GT410P 144192-PC4T	intel第10代至尊处理器 (14核4.4Ghz )、192GB DDR4 /*4RTX3090**/ 4TB Pci-SSD+ 12TB SATA/双塔式(双2000w) /27"-4K图显	96GB	142	1140	CNN+ RNN	¥159,990
2.6	UltraLAB GT410P 144128-PC5X	intel第10代至尊处理器 (14核4.4Ghz )、128GB DDR4 /*5RTX3080**/4TB Pci-SSD+ 10TB SATA/双塔式(双2000w) /27"-4K图显	50GB	149	1190	CNN	¥139,990
2.7	UltraLAB GT410P 144256-PD5T	intel第10代至尊处理器 (14核4.4Ghz)、256GB DDR4 /*5RTX3090**/6.4TB Pci-SSD+ 12TB SATA/双塔式(双2000w) /27"-4K图显	120GB	178	1425	CNN+ RNN	¥185,000
2.8	UltraLAB GT410P 144256-PD5E	intel第10代至尊处理器 (14核4.4Ghz)、256GB DDR4 /*5A6000**/6.4TB Pci-SSD+ 12TB SATA/双塔式(双2000w) /27"-4K图显	240GB	200	1560	CNN+ RNN	¥335,000

2.3 图灵超算工作站(GX630M)配置推荐-极致型

No	产品型号	主要配置	显存	CUDA处理器FP16性能指标单位：Tflops	张量处理器FP16性能指标单位：Tflops	理想算法	价格
3.1	UltraLAB GX630M 243192-MB6X	2Xeon金6244(16核4.3GHz)/睿频4.4GHz/192GB DDR4 /6RTX3070 /1.92TB SSD+2TB M2.SSD**/42TB存储/双塔式(双2000w)/27"-4K图显	48GB	122	978	CNN	¥199,990
3.2	UltraLAB GX630M 243256-MB7X	2Xeon金6244(16核4.3GHz)/睿频4.4GHz/192GB DDR4 /7RTX3070** /1.92TB SSD+2TB M2.SSD/56TB存储/双塔式(双2000w)/27"-4K图显	56GB	142	1141	CNN	¥220,000
3.3	ltraLAB GX630M 243256-PC5X	2Xeon金6244(16核4.3GHz)/睿频4.4GHz/256GB DDR4 /5RTX3080** /1.92TB SSD+4TB P-SSD/70TB存储/双塔式(双2000w)/27"-4K图显	50GB	149	1190	CNN	¥223,000
3.4	UltraLAB GX630M 241384-PC6X	2Xeon金6246(24核4.1GHz)/睿频4.2GHz /384GB DDR4 /6RTX3080** /1.9TB SSD+4TB P-SSD/70TB并行存储/双塔式(双2000w)/27"-4K图显	60GB	179	1428	CNN	¥248,000
3.5	UltraLAB GX630M 243192-MB4T	2Xeon金6244(16核4.3GHz)/睿频4.3GHz/192GB DDR4 /4RTX3090** /1.9TB SSD+2TB M2.SSD/56TB存储/双塔式(双2000w)/27"-4K图显	96GB	142	1140	CNN+ RNN	¥256,000
3.6	UltraLAB GX630M 241384-PD5T	2Xeon金6246(24核4.1GHz)/睿频4.2GHz /384GB DDR4 /5RTX3090** /1.92TB SSD+4TB P-SSD/90TB并行存储/双塔/27"-4K图	120GB	178	1425	CNN+ RNN	¥299,000
3.7	UltraLAB GX630M 243768-180T6T	2Xeon金6256(24核4.3GHz)/ 睿频4.5GHz /768GB DDR4 /6RTX3090（三槽）**/3.84TB SSD +180TB并行存储/双塔式(双2000w)/32"-4K图显	144GB	213	1710	性能近16块Titan V	¥375,000
3.8	UltraLAB GX630M 243768-180T7T	2Xeon金6256(24核4.3GHz)/ 睿频4.5GHz /768GB DDR4 /7RTX3090(双槽)**/4TB P-SSD +180TB并行存储/双塔式(双2000w)/32"-4K图显	168GB	249	1990	最快最完美，性能超DGX-2	¥399,900
3.9	UltraLAB GX630M 243384-150T4E	2Xeon金6256(24核4.3GHz)/睿频4.5GHz /384GB DDR4 /4A6000** /4TB P-SSD+150TB并行存储/双塔式(双2000w)/32"-4K图显	192GB	160	1250	CNN+ RNN+ 推理	¥399,900
3.10	UltraLAB GX630M 2331T-150T7E	2Xeon金6254(36核3.9GHz)/睿频4.0GHz/1TB DDR4 /7A6000** /双3.84TB SSD+6.4TB-P-SSD/240TB 并行存储/双塔式(双2000w) /32"-4K图显	336GB	280	2180	最强最完整	¥650,000