NVIDIA 与 Hugging Face 合作简化生成式 AI 模型部署

2024-06-04 11:12

本文主要是介绍NVIDIA 与 Hugging Face 合作简化生成式 AI 模型部署,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

NVIDIA 与 Hugging Face 合作简化生成式 AI 模型部署

随着生成式 AI 的快速发展,社区已采取两种重要方式来促进这种扩展:迅速发布最先进的基础模型,并简化它们与应用程序开发和生产的集成。

NVIDIA 通过优化基础模型来提高性能,帮助企业更快地生成代币,降低运行模型的成本,并通过 NVIDIA NIM 改善最终用户体验,从而为这一努力提供帮助。

NVIDIA NIM

NVIDIA NIM 推理微服务旨在简化和加速在任何地方(包括云、数据中心和工作站)的 NVIDIA 加速基础设施中部署生成式 AI 模型。

NIM 利用 TensorRT-LLM 推理优化引擎、行业标准 API 和预构建容器来提供低延迟、高吞吐量的 AI 推理,并根据需求进行扩展。它支持各种 LLM,包括 Llama 3、Mixtral 8x22B、Phi-3 和 Gemma,以及针对语音、图像、视频、医疗保健等领域特定领域应用的优化。

NIM 提供卓越的吞吐量,使企业能够以高达 5 倍的速度生成代币。对于生成式 AI 应用程序,代币处理是关键性能指标,而代币吞吐量的提高直接转化为企业更高的收入。

通过简化集成和部署流程,NIM 使企业能够快速从 AI 模型开发转向生产,从而提高效率、降低运营成本,并让企业专注于创新和增长。

现在,我们更进一步,推出了 Hugging Face,帮助开发人员在几分钟内运行模型。

只需单击几下即可在 Hugging Face 上部署 NIM

Hugging Face 是领先的 AI 模型平台,由于它提高了 AI 模型的可访问性,已成为 AI 开发人员的首选目的地。

利用 NVIDIA NIM 的无缝部署功能,从 Llama 3 8B 和 Llama 3 70B 开始,在您首选的云服务提供商上,所有这些都可以直接从 Hugging Face 访问。

NIM 提供卓越的吞吐量,并在多个并发请求下实现接近 100% 的利用率,使企业能够以 3 倍的速度生成文本。对于生成式 AI 应用程序,令牌处理是关键的性能指标,而令牌吞吐量的提高直接转化为企业更高的收入。

Hugging Face 上的专用 NIM 端点会在您首选的云上启动实例,自动获取和部署 NVIDIA 优化模型,只需点击几下鼠标即可开始推理,所有操作只需几分钟即可完成。

让我们仔细看看。

步骤 1:导航到 Hugging Face 上的 Llama 3 8B 或 70B 指令模型页面,单击“部署”下拉菜单,然后从菜单中选择“NVIDIA NIM 端点”。

第 2 步:出现一个新页面,其中显示“使用 NVIDIA NIM 创建新的专用端点”。选择您喜欢的 CSP 实例类型来运行模型。AWS 上的 A10G/A100 和 GCP 实例上的 A100/H100 利用 NVIDIA 优化的模型引擎来获得最佳性能。

步骤 3:在“高级配置”部分,从容器类型下拉菜单中选择“NVIDIA NIM”,然后单击“创建端点”。

步骤 4:几分钟内,推理端点即可启动并运行。

这篇关于NVIDIA 与 Hugging Face 合作简化生成式 AI 模型部署的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1029915

相关文章

使用IDEA部署Docker应用指南分享

《使用IDEA部署Docker应用指南分享》本文介绍了使用IDEA部署Docker应用的四步流程:创建Dockerfile、配置IDEADocker连接、设置运行调试环境、构建运行镜像,并强调需准备本... 目录一、创建 dockerfile 配置文件二、配置 IDEA 的 Docker 连接三、配置 Do

Spring AI使用tool Calling和MCP的示例详解

《SpringAI使用toolCalling和MCP的示例详解》SpringAI1.0.0.M6引入ToolCalling与MCP协议,提升AI与工具交互的扩展性与标准化,支持信息检索、行动执行等... 目录深入探索 Spring AI聊天接口示例Function CallingMCPSTDIOSSE结束语

三频BE12000国补到手2549元! ROG 魔盒Pro WIFI7电竞AI路由器上架

《三频BE12000国补到手2549元!ROG魔盒ProWIFI7电竞AI路由器上架》近日,华硕带来了ROG魔盒ProWIFI7电竞AI路由器(ROGSTRIXGR7Pro),目前新... 华硕推出了ROG 魔盒Pro WIFI7电竞AI路由器(ROG STRIX GR7 Phttp://www.cppcn

MySQL 主从复制部署及验证(示例详解)

《MySQL主从复制部署及验证(示例详解)》本文介绍MySQL主从复制部署步骤及学校管理数据库创建脚本,包含表结构设计、示例数据插入和查询语句,用于验证主从同步功能,感兴趣的朋友一起看看吧... 目录mysql 主从复制部署指南部署步骤1.环境准备2. 主服务器配置3. 创建复制用户4. 获取主服务器状态5

golang程序打包成脚本部署到Linux系统方式

《golang程序打包成脚本部署到Linux系统方式》Golang程序通过本地编译(设置GOOS为linux生成无后缀二进制文件),上传至Linux服务器后赋权执行,使用nohup命令实现后台运行,完... 目录本地编译golang程序上传Golang二进制文件到linux服务器总结本地编译Golang程序

如何在Ubuntu 24.04上部署Zabbix 7.0对服务器进行监控

《如何在Ubuntu24.04上部署Zabbix7.0对服务器进行监控》在Ubuntu24.04上部署Zabbix7.0监控阿里云ECS服务器,需配置MariaDB数据库、开放10050/1005... 目录软硬件信息部署步骤步骤 1:安装并配置mariadb步骤 2:安装Zabbix 7.0 Server

详解如何使用Python从零开始构建文本统计模型

《详解如何使用Python从零开始构建文本统计模型》在自然语言处理领域,词汇表构建是文本预处理的关键环节,本文通过Python代码实践,演示如何从原始文本中提取多尺度特征,并通过动态调整机制构建更精确... 目录一、项目背景与核心思想二、核心代码解析1. 数据加载与预处理2. 多尺度字符统计3. 统计结果可

SpringBoot整合Sa-Token实现RBAC权限模型的过程解析

《SpringBoot整合Sa-Token实现RBAC权限模型的过程解析》:本文主要介绍SpringBoot整合Sa-Token实现RBAC权限模型的过程解析,本文给大家介绍的非常详细,对大家的学... 目录前言一、基础概念1.1 RBAC模型核心概念1.2 Sa-Token核心功能1.3 环境准备二、表结

Web技术与Nginx网站环境部署教程

《Web技术与Nginx网站环境部署教程》:本文主要介绍Web技术与Nginx网站环境部署教程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、Web基础1.域名系统DNS2.Hosts文件3.DNS4.域名注册二.网页与html1.网页概述2.HTML概述3.

Spring AI 实现 STDIO和SSE MCP Server的过程详解

《SpringAI实现STDIO和SSEMCPServer的过程详解》STDIO方式是基于进程间通信,MCPClient和MCPServer运行在同一主机,主要用于本地集成、命令行工具等场景... 目录Spring AI 实现 STDIO和SSE MCP Server1.新建Spring Boot项目2.a