趋动科技联合云轴科技推出GPU云原生超融合解决方案

2024-08-23 05:04

本文主要是介绍趋动科技联合云轴科技推出GPU云原生超融合解决方案,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

近日,趋动科技VirtAITech携手云轴科技ZStack推出GPU云原生超融合联合解决方案,提供全面、可扩展的云原生GPU存算一体化解决方案。

该方案基于云原生超融合及GPU资源池化技术,使得GPU资源管理变得更加简便易用,能够帮助企业用户在快速进入AI业务开发状态的同时,有效降低综合建设成本。

AI算力对基础平台提出新要求

人工智能是新一轮科技革命和产业变革的重要驱动力量,算力是推动其发展的核心要素之一。在科研实验和教育实训场景中,需要在有限资源投入的情况下获取更多算力,加速取得更多科研成果,以更好地满足教学和教研需求。但是,传统基础平台以物理服务器+物理GPU方式部署,大多存在以下问题:

成本高:物理形式分配GPU会造成资源独占,业务对资源的利用存在波峰波谷现象,按照波峰需求配置成本高昂;

管理难:GPU资源分布在多台服务器上,集中调用复杂,各科研/教研团队对资源的分配和复用易冲突;

效益低:GPU的新卡和旧卡难以整合,设备的整体资源利用率有待提升;

运维难:基础平台需要专业的技术人员进行运维管理升级,带来额外的运营成本。

联合解决方案助力GPU资源管理更易用

云轴科技ZStack联合趋动科技推出GPU云原生超融合联合解决方案,旨在提供一种全面、可扩展的云原生GPU存算一体化解决方案,通过利用云原生超融合技术及GPU资源池化技术,助力企业客户实现平台级开箱即用,快速进入AI业务开发状态,解决基础设施管理复杂问题的同时,能更加高效地使用GPU资源

联合解决方案助力GPU资源管理更易用,能够为用户提供如下价值

  • 资源利用率提升:GPU资源池化后,用户可实现集群内灵活调度/聚合GPU资源,提升GPU资源利用率,满足大规模科研场景;
  • 管理成本降低:平台级统一管理,支持多租户与资源配额管理,同时满足教学科研与高校实训场景;
  • 按需线性扩容:基于裸金属架构一站式提供云原生计算/存储/网络,解决利旧问题的同时,支持按需线性扩展;
  • 高效运维:全平台高可用机制、支持一键巡检,大幅降低现场运维门槛,面向传统行业提供更优质的产品服务。

共同推动AI+云原生创新发展浪潮

随着容器技术的不断进步和成熟,AI计算领域也逐渐受益于Kubernetes等容器平台的发展。在这个过程中,Kubernetes对GPU资源的管理尤为关键,因为企业普遍需要以不同粒度切分和灵活管理GPU资源。

ZStack Edge云原生超融合提供了一个基于Kubernetes引擎的云原生基础设施,直接在物理机上并行“容器+虚拟机”双引擎,结合分布式存储、应用市场、云边协同、一键运维、云原生灾备等能力,为中小型数据中心、分支机构、边缘计算等场景下的业务应用带来全新的交付体验与可靠保障。

OrionX则提供了专业的Kubernetes GPU资源池化功能,支持云端和数据中心部署,帮助客户提高AI资源利用率和降低TCO,提高算法工程师的工作效率。

ZStack Edge云原生超融合与趋动科技OrionX的合作使得GPU资源管理变得更加简便易用,有助于企业更高效地管理AI计算基础设施,双方的合作将加速推动AI计算与云原生的发展及落地。

关于云轴科技ZStack

云轴科技ZStack成立于2015年,创始团队由国内虚拟化、云计算领域的“黄金一代”组成,以产品化理念切入云基础软件市场,先后获阿里云、中国电信战略投资,是国家级“专精特新”小巨人企业。作为云基础软件企业,ZStack坚持自主创新,以“让每一家企业都拥有自己的云”为使命,推出自研架构的云操作系统,产品矩阵涵盖云平台/虚拟化、分布式存储、容器云平台、多云管理平台、超融合一体机、云原生超融合、数据库云平台等,全面覆盖数据中心云基础设施。目前ZStack已经落地超过400朵信创云,携手600家合作伙伴助力超过3000家企业级用户数字化转型,覆盖党政、金融、石油、电力、电信、交通、航空航天、医疗、教育、制造等行业领域。

这篇关于趋动科技联合云轴科技推出GPU云原生超融合解决方案的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1098421

相关文章

k8s按需创建PV和使用PVC详解

《k8s按需创建PV和使用PVC详解》Kubernetes中,PV和PVC用于管理持久存储,StorageClass实现动态PV分配,PVC声明存储需求并绑定PV,通过kubectl验证状态,注意回收... 目录1.按需创建 PV(使用 StorageClass)创建 StorageClass2.创建 PV

k8s中实现mysql主备过程详解

《k8s中实现mysql主备过程详解》文章讲解了在K8s中使用StatefulSet部署MySQL主备架构,包含NFS安装、storageClass配置、MySQL部署及同步检查步骤,确保主备数据一致... 目录一、k8s中实现mysql主备1.1 环境信息1.2 部署nfs-provisioner1.2.

k8s admin用户生成token方式

《k8sadmin用户生成token方式》用户使用Kubernetes1.28创建admin命名空间并部署,通过ClusterRoleBinding为jenkins用户授权集群级权限,生成并获取其t... 目录k8s admin用户生成token创建一个admin的命名空间查看k8s namespace 的

k8s搭建nfs共享存储实践

《k8s搭建nfs共享存储实践》本文介绍NFS服务端搭建与客户端配置,涵盖安装工具、目录设置及服务启动,随后讲解K8S中NFS动态存储部署,包括创建命名空间、ServiceAccount、RBAC权限... 目录1. NFS搭建1.1 部署NFS服务端1.1.1 下载nfs-utils和rpcbind1.1

Redis高性能Key-Value存储与缓存利器常见解决方案

《Redis高性能Key-Value存储与缓存利器常见解决方案》Redis是高性能内存Key-Value存储系统,支持丰富数据类型与持久化方案(RDB/AOF),本文给大家介绍Redis高性能Key-... 目录Redis:高性能Key-Value存储与缓存利器什么是Redis?为什么选择Redis?Red

k8s容器放开锁内存限制问题

《k8s容器放开锁内存限制问题》nccl-test容器运行mpirun时因NCCL_BUFFSIZE过大导致OOM,需通过修改docker服务配置文件,将LimitMEMLOCK设为infinity并... 目录问题问题确认放开容器max locked memory限制总结参考:https://Access

线上Java OOM问题定位与解决方案超详细解析

《线上JavaOOM问题定位与解决方案超详细解析》OOM是JVM抛出的错误,表示内存分配失败,:本文主要介绍线上JavaOOM问题定位与解决方案的相关资料,文中通过代码介绍的非常详细,需要的朋... 目录一、OOM问题核心认知1.1 OOM定义与技术定位1.2 OOM常见类型及技术特征二、OOM问题定位工具

Python一次性将指定版本所有包上传PyPI镜像解决方案

《Python一次性将指定版本所有包上传PyPI镜像解决方案》本文主要介绍了一个安全、完整、可离线部署的解决方案,用于一次性准备指定Python版本的所有包,然后导出到内网环境,感兴趣的小伙伴可以跟随... 目录为什么需要这个方案完整解决方案1. 项目目录结构2. 创建智能下载脚本3. 创建包清单生成脚本4

java.sql.SQLTransientConnectionException连接超时异常原因及解决方案

《java.sql.SQLTransientConnectionException连接超时异常原因及解决方案》:本文主要介绍java.sql.SQLTransientConnectionExcep... 目录一、引言二、异常信息分析三、可能的原因3.1 连接池配置不合理3.2 数据库负载过高3.3 连接泄漏

C#文件复制异常:"未能找到文件"的解决方案与预防措施

《C#文件复制异常:未能找到文件的解决方案与预防措施》在C#开发中,文件操作是基础中的基础,但有时最基础的File.Copy()方法也会抛出令人困惑的异常,当targetFilePath设置为D:2... 目录一个看似简单的文件操作问题问题重现与错误分析错误代码示例错误信息根本原因分析全面解决方案1. 确保