“X战警”到来,百度重磅发布自主研发的超级AI计算平台X-MAN3.0

本文主要是介绍“X战警”到来,百度重磅发布自主研发的超级AI计算平台X-MAN3.0,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

“X战警”到来,百度重磅发布自主研发的超级AI计算平台X-MAN3.0

12月2日,在加拿大举行的第32届NIPS神经信息处理系统大会上,百度正式发布自主研发的超级AI计算平台X-MAN3.0。该平台专为AI深度学习场景优化设计,每秒完成2000万亿次深度神经网络计算,极大的加快了AI深度学习模型的训练速度。

NIPS作为机器学习和神经计算领域的顶级会议,吸引了机器学习、人工智能、统计等领域的众多国际专家参与。近年来,在计算机视觉、语音识别、自然语言处理等领域也出现了大量的创新应用,NIPS在AI深度学习领域的学术影响力变得举足轻重。

clipboard.png

算法、数据和计算是推动AI深度学习技术快速发展的三大要素。为支持更强的泛化能力,更高的预测精度,算法模型日趋复杂,越来越多的数据需要被及时标注和处理,计算性能成为关键。百度X-MAN超级AI计算平台提供极致的计算性能,支持超大复杂算法模型,能够快速及时处理海量数据。自2016年诞生以来,百度X-MAN超级AI计算平台历经3代发展,3次架构升级,创造6项业界第一,同时期关键技术&性能保持领先,引领行业发展趋势。目前,X-MAN系列产品已在百度大规模应用,正在助力百度AI战略快速落地。

clipboard.png

X-MAN解决的3大关键技术挑战
为提供更强的计算性能和最佳的计算效率,X-MAN在系统设计中面临了三大关键技术的挑战:如何有效提升单机计算性能、如何实现多机加速的高可扩展性以及如何均衡CPU与AI加速芯片的配比关系,以避免系统瓶颈。

在有限的单机空间内,集成更多数量、性能更强、互联带宽更高的AI加速卡,是提升单机计算性能的直接手段,但带来了高速互联、结构、散热、供电等硬件技术难题;单机训练方式难以满足超大规模数据集和复杂的模型场景下的计算力需求,大规模分布式训练成为必然,解决多机加速的可扩展性就成了关键技术难题;深度学习模型的负载差异较大,CPU密集型,计算密集型,通信密集型,存在着多种需求场景,为了避免系统性能瓶颈、充分发挥计算效率,如何快速灵活的调整CPU和AI计算芯片的配比并支持独立迭代升级成了关键的技术难题。

X-MAN的3次架构升级和9大技术特征
自2016年首次发布以来,X-MAN的三代产品各自都有着鲜明的设计理念:超高的计算密度、高效散热、兼容多元化AI加速芯片。X-MAN通过3次架构升级,有效攻克了3大技术挑战。

X-MAN1.0发布于2016年Q2,单机可以支持16个AI加速卡,最高扩展到64,实现了超高的计算密度。X-MAN1.0具备4大技术特征:硬件解耦、资源池化、PCIe Fabric技术、100G RDMA高速互联。

X-MAN2.0发布于2017年Q3,通过冷板式液冷散热技术实现了超高的散热效率。和业界主流方案一样,X-MAN2.0可以支持8卡NVLink高速互联,差异化方面,X-MAN2.0具备2大技术特征:液冷散热和灵活的IO支持。

随着AI人工智能技术的快速发展,众多AI芯片公司应运而生,AI芯片格局正呈现多元化发展趋势。此次NIPS大会上发布的X-MAN3.0,采用了硬件系统模块化、互联接口标准化、互联拓扑高灵活性的设计思路,既提升了多元化AI加速芯片的兼容性,也促进了AI加速芯片生态健康、快速、可持续的发展。X-MAN3.0具备3大关键技术特征,包括48V供电技术、标准化的AI加速卡接口定义和灵活的互联拓扑。

此次百度快速研发落地X-MAN3.0,得到了浪潮、英业达等服务器系统厂商的积极参与支持; 我们期待有更多的服务器系统合作伙伴、AI加速芯片厂商和同行加入共建开放的生态,促进整个生态圈的良性发展。

clipboard.png
X-MAN1.0

clipboard.png
X-MAN2.0

clipboard.png
X-MAN3.0

X-MAN创造了6项业界第一,引领行业技术发展趋势
凭借着对AI业务模型的深刻理解、扎实的硬件基础架构技术和对行业趋势的准确预判,百度设计了X-MAN AI计算平台系列产品,创造了6项业界第一。其中, 2016年Q2发布的X-MAN1.0创造了5个业界第一:首次实现单机扩展16片AI加速卡;首次实现4/8/16/32/64卡系统级弹性扩展;首次实现AI计算硬件解耦架构(注:Facebook 2017年Q1发布的Big Basin、微软2017年Q1发布的HGX-1等都采用了相似设计理念);首次实现PCIe Fabric技术架构,支持按需求业务动态分配AI计算资源;首次实现虚拟机多卡高速无损通信技术(native performance)。2017年Q3发布的X-MAN2.0业界首创将冷板式液冷散热技术应用到AI计算产品里,有效解决了高性能AI加速卡的散热挑战(注:Google 2018年Q2发布的TPU3.0也采用了相似技术)。

X-MAN大规模部署,助力百度AI战略快速落地
凭借着强大的单机计算性能、业界领先的多机扩展性、灵活的AI计算资源动态分配调整能力,X-MAN系列产品已在百度实现规模化部署,广泛应用于语音识别、计算机视觉、自然语音处理、无人车等基础AI技术的深度学习模型训练,将训练时间从周级别缩短到天级别;服务于百度DuerOS、Apollo、ABC Cloud等核心业务,助力百度AI战略的快速落地。

这篇关于“X战警”到来,百度重磅发布自主研发的超级AI计算平台X-MAN3.0的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/830993

相关文章

Python并行处理实战之如何使用ProcessPoolExecutor加速计算

《Python并行处理实战之如何使用ProcessPoolExecutor加速计算》Python提供了多种并行处理的方式,其中concurrent.futures模块的ProcessPoolExecu... 目录简介完整代码示例代码解释1. 导入必要的模块2. 定义处理函数3. 主函数4. 生成数字列表5.

Spring AI 实现 STDIO和SSE MCP Server的过程详解

《SpringAI实现STDIO和SSEMCPServer的过程详解》STDIO方式是基于进程间通信,MCPClient和MCPServer运行在同一主机,主要用于本地集成、命令行工具等场景... 目录Spring AI 实现 STDIO和SSE MCP Server1.新建Spring Boot项目2.a

Java计算经纬度距离的示例代码

《Java计算经纬度距离的示例代码》在Java中计算两个经纬度之间的距离,可以使用多种方法(代码示例均返回米为单位),文中整理了常用的5种方法,感兴趣的小伙伴可以了解一下... 目录1. Haversine公式(中等精度,推荐通用场景)2. 球面余弦定理(简单但精度较低)3. Vincenty公式(高精度,

macOS Sequoia 15.5 发布: 改进邮件和屏幕使用时间功能

《macOSSequoia15.5发布:改进邮件和屏幕使用时间功能》经过常规Beta测试后,新的macOSSequoia15.5现已公开发布,但重要的新功能将被保留到WWDC和... MACOS Sequoia 15.5 正式发布!本次更新为 Mac 用户带来了一系列功能强化、错误修复和安全性提升,进一步增

Maven 依赖发布与仓库治理的过程解析

《Maven依赖发布与仓库治理的过程解析》:本文主要介绍Maven依赖发布与仓库治理的过程解析,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下... 目录Maven 依赖发布与仓库治理引言第一章:distributionManagement配置的工程化实践1

在.NET平台使用C#为PDF添加各种类型的表单域的方法

《在.NET平台使用C#为PDF添加各种类型的表单域的方法》在日常办公系统开发中,涉及PDF处理相关的开发时,生成可填写的PDF表单是一种常见需求,与静态PDF不同,带有**表单域的文档支持用户直接在... 目录引言使用 PdfTextBoxField 添加文本输入域使用 PdfComboBoxField

windows和Linux使用命令行计算文件的MD5值

《windows和Linux使用命令行计算文件的MD5值》在Windows和Linux系统中,您可以使用命令行(终端或命令提示符)来计算文件的MD5值,文章介绍了在Windows和Linux/macO... 目录在Windows上:在linux或MACOS上:总结在Windows上:可以使用certuti

使用Python构建一个Hexo博客发布工具

《使用Python构建一个Hexo博客发布工具》虽然Hexo的命令行工具非常强大,但对于日常的博客撰写和发布过程,我总觉得缺少一个直观的图形界面来简化操作,下面我们就来看看如何使用Python构建一个... 目录引言Hexo博客系统简介设计需求技术选择代码实现主框架界面设计核心功能实现1. 发布文章2. 加

售价599元起! 华为路由器X1/Pro发布 配置与区别一览

《售价599元起!华为路由器X1/Pro发布配置与区别一览》华为路由器X1/Pro发布,有朋友留言问华为路由X1和X1Pro怎么选择,关于这个问题,本期图文将对这二款路由器做了期参数对比,大家看... 华为路由 X1 系列已经正式发布并开启预售,将在 4 月 25 日 10:08 正式开售,两款产品分别为华

深入理解Apache Kafka(分布式流处理平台)

《深入理解ApacheKafka(分布式流处理平台)》ApacheKafka作为现代分布式系统中的核心中间件,为构建高吞吐量、低延迟的数据管道提供了强大支持,本文将深入探讨Kafka的核心概念、架构... 目录引言一、Apache Kafka概述1.1 什么是Kafka?1.2 Kafka的核心概念二、Ka