【OpenBayes 官方教程】在模型训练中使用子域名访问服务

2024-03-29 23:12

本文主要是介绍【OpenBayes 官方教程】在模型训练中使用子域名访问服务,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

本教程主要为大家讲解 OpenBayes 上如何在模型训练中使用子域名访问服务,新朋友点击下方链接注册后,即可获得 4 小时 RTX 4090 + 5 小时 CPU 的免费使用时长哦!

注册链接

https://openbayes.com/console/signup?r=yuudi_nBBTicon-default.png?t=N7T8https://openbayes.com/console/signup?r=yuudi_nBBT

首先,创建一个新的「执行」,选择「读写绑定」,指向一个模型仓库,然后点击「下一步:选择算力」。

选择 3090 的算力,镜像选择 vLLM 镜像。

开始执行后,点击「打开工作空间」。

进入到 Jupyter 工作空间后,点击 JupyterLab 左侧文件夹,点击「input」,「input0」,然后可以看到所绑定的模型文件。

回到 home 目录,点击「终端」。

输入 pip list 可以看到 vLLM 0.2.7 版本已经装好了。

然后我们可以直接通过命令进行部署:我们按照 vLLM 官方的介绍启动一个 openai 兼容的 api serve,模型路径为 input0 ,可以对照右侧「概况」栏下的数据集路径,然后我们要为模型输入一个名称(教程示例为 yi ),运行 trust-remote-code 代码,启动脚本。

可以看到它默认使用的是 8000 端口。

我们新建一个终端,输入 nvidia-smi ,可以看到模型已经加载到了显卡里。

我们通过一个 curl 命令来进行测试,可以看到这个模型里面有一个叫做「yi」的模型了。到目前为止,模型已经部署成功了,但这个模型部署只能在容器内部访问,并不能暴露到公网上。而 OpenBayes 的模型训练功能会默认把容器内的 8080 端口暴露出来,并提供一个子域名。

我们将端口改为 8080 ,然后 host 指向 0.0.0.0,我们再执行。

可以看到模型一已经指向 8080 端口了,然后我们打开右侧导航栏中的「API地址」下的链接。

可以看到列出了当前模型的信息,证明我们容器内的 8080 端口已经暴露到公网上了。

使用这个功能需要先进行实名认证,否则无法看到「API地址」下的链接。

虽然通过这个方式,我们可以直接将这个 api server 暴露到了公网上,但是由于它没有一个界面,我们并不方便进行调试和测试。下面我将介绍怎样通过一个 gradio 的脚本对已经创建的 openai 兼容服务进行一个简单的测试。

首先,我们将端口换回 8000,再次启动,然后我们借鉴 vLLM 官方的一个脚本,可以直接把 vLLM 的代码下载下来。

在它的 example 目录下有一个 gradio_openai_chatbot_webserver 的一个脚本,这个脚本就可以直接调用我们刚创建的 server 。

我们先安装依赖,一定要安装 gradio3.41 版本。

然后再安装 openai。

安装好之后,启动这个脚本,通过 -h 命令可以看到里面的参数。

model-url 我们要给一个完整的前缀,指向 v1,模型名字为刚才指定的「yi」,port 指向 8080,host 还是0.0.0.0,这样这个 gradio 就启动起来了。

我们再次打开之前的子域名,就可以看到一个 ChatBot 的界面。

我们进行一个测试,可以看到它在不停地说话,而且重复一样的话,是因为这个模型的 Stop word 有点问题,我们打开刚才的脚本,对这个进行一个调整。

我们找到这个 stop-token-ids 的参数,并把它加上,输入 7 作为 stop word。

我们刷新之前的页面,可以看到能够正常使用了。

为了让大家更好地理解,OpenBaye贝式计算也为大家录制了详细的视频教程,可以点击下方链接查看,快速上手OpenBayes平台!https://www.bilibili.com/video/BV15C4y1k7K2/?spm_id_from=333.337.search-card.all.clickicon-default.png?t=N7T8https://www.bilibili.com/video/BV15C4y1k7K2/?spm_id_from=333.337.search-card.all.click

这篇关于【OpenBayes 官方教程】在模型训练中使用子域名访问服务的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/859898

相关文章

Python pandas库自学超详细教程

《Pythonpandas库自学超详细教程》文章介绍了Pandas库的基本功能、安装方法及核心操作,涵盖数据导入(CSV/Excel等)、数据结构(Series、DataFrame)、数据清洗、转换... 目录一、什么是Pandas库(1)、Pandas 应用(2)、Pandas 功能(3)、数据结构二、安

Python使用Tenacity一行代码实现自动重试详解

《Python使用Tenacity一行代码实现自动重试详解》tenacity是一个专为Python设计的通用重试库,它的核心理念就是用简单、清晰的方式,为任何可能失败的操作添加重试能力,下面我们就来看... 目录一切始于一个简单的 API 调用Tenacity 入门:一行代码实现优雅重试精细控制:让重试按我

MySQL中EXISTS与IN用法使用与对比分析

《MySQL中EXISTS与IN用法使用与对比分析》在MySQL中,EXISTS和IN都用于子查询中根据另一个查询的结果来过滤主查询的记录,本文将基于工作原理、效率和应用场景进行全面对比... 目录一、基本用法详解1. IN 运算符2. EXISTS 运算符二、EXISTS 与 IN 的选择策略三、性能对比

使用Python构建智能BAT文件生成器的完美解决方案

《使用Python构建智能BAT文件生成器的完美解决方案》这篇文章主要为大家详细介绍了如何使用wxPython构建一个智能的BAT文件生成器,它不仅能够为Python脚本生成启动脚本,还提供了完整的文... 目录引言运行效果图项目背景与需求分析核心需求技术选型核心功能实现1. 数据库设计2. 界面布局设计3

使用IDEA部署Docker应用指南分享

《使用IDEA部署Docker应用指南分享》本文介绍了使用IDEA部署Docker应用的四步流程:创建Dockerfile、配置IDEADocker连接、设置运行调试环境、构建运行镜像,并强调需准备本... 目录一、创建 dockerfile 配置文件二、配置 IDEA 的 Docker 连接三、配置 Do

Android Paging 分页加载库使用实践

《AndroidPaging分页加载库使用实践》AndroidPaging库是Jetpack组件的一部分,它提供了一套完整的解决方案来处理大型数据集的分页加载,本文将深入探讨Paging库... 目录前言一、Paging 库概述二、Paging 3 核心组件1. PagingSource2. Pager3.

python使用try函数详解

《python使用try函数详解》Pythontry语句用于异常处理,支持捕获特定/多种异常、else/final子句确保资源释放,结合with语句自动清理,可自定义异常及嵌套结构,灵活应对错误场景... 目录try 函数的基本语法捕获特定异常捕获多个异常使用 else 子句使用 finally 子句捕获所

C++11右值引用与Lambda表达式的使用

《C++11右值引用与Lambda表达式的使用》C++11引入右值引用,实现移动语义提升性能,支持资源转移与完美转发;同时引入Lambda表达式,简化匿名函数定义,通过捕获列表和参数列表灵活处理变量... 目录C++11新特性右值引用和移动语义左值 / 右值常见的左值和右值移动语义移动构造函数移动复制运算符

Python对接支付宝支付之使用AliPay实现的详细操作指南

《Python对接支付宝支付之使用AliPay实现的详细操作指南》支付宝没有提供PythonSDK,但是强大的github就有提供python-alipay-sdk,封装里很多复杂操作,使用这个我们就... 目录一、引言二、准备工作2.1 支付宝开放平台入驻与应用创建2.2 密钥生成与配置2.3 安装ali

C#中lock关键字的使用小结

《C#中lock关键字的使用小结》在C#中,lock关键字用于确保当一个线程位于给定实例的代码块中时,其他线程无法访问同一实例的该代码块,下面就来介绍一下lock关键字的使用... 目录使用方式工作原理注意事项示例代码为什么不能lock值类型在C#中,lock关键字用于确保当一个线程位于给定实例的代码块中时