liunx服务器部署Llama2大模型

本文主要是介绍liunx服务器部署Llama2大模型，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

模型：Llama2-chat-13B-Chinese-50W
在这里插入图片描述

01 下载安装 Llama2 模型

Huggingface在国内是访问不了的，需要使用代理。在这里推荐使用 clash-for-liunx 配置代理。

安装 git-lfs，用于大文件下载

sudo apt-get install git-lfs
git lfs install

Huggingface 下载 Llama2 模型

git clone https://huggingface.co/RicardoLee/Llama2-chat-13B-Chinese-50W

这里会下载很久，耐心等待吧。另外，可能会有文件下载失败，需要自己手动下载：

wget --no-check-certificate https://huggingface.co/RicardoLee/Llama2-chat-13B-Chinese-50W/resolve/main/pytorch_model-00001-of-00003.bin
wget --no-check-certificate https://huggingface.co/RicardoLee/Llama2-chat-13B-Chinese-50W/resolve/main/pytorch_model-00002-of-00003.bin
wget --no-check-certificate https://huggingface.co/RicardoLee/Llama2-chat-13B-Chinese-50W/resolve/main/pytorch_model-00003-of-00003.bin

环境配置

安装依赖库：

python -m pip install torch==2.0.0
python -m pip install transformers==4.30.0
python -m pip install sentencepiece==0.1.97python -m pip install peft==0.10.0
python -m pip install gradio==3.50.0
python -m pip install bitsandbytes
python -m pip install accelerate
python -m pip install scipy

同时将把 gradio 里的gradio_demo.py下载到服务器

wget https://github.com/ymcui/Chinese-LLaMA-Alpaca/blob/main/scripts/inference/gradio_demo.py
mv gradio_demo.py ~/Workspace/Llama2/

部署

查看GPU状态

nvidia-smi

命令行启动

python gradio_demo.py --base_model Llama2-chat-13B-Chinese-50W --tokenizer_path Llama2-chat-13B-Chinese-50W --load_in_8bit --gpus 0

效果展示

在这里插入图片描述

这篇关于liunx服务器部署Llama2大模型的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

liunx服务器部署Llama2大模型

01 下载安装 Llama2 模型

环境配置

部署

效果展示

相关文章

Nginx分布式部署流程分析

Linux云服务器手动配置DNS的方法步骤

Linux五种IO模型的使用解读

linux部署NFS和autofs自动挂载实现过程

Nginx屏蔽服务器名称与版本信息方式(源码级修改)

通过Docker容器部署Python环境的全流程

Nginx部署HTTP/3的实现步骤

Web服务器-Nginx-高并发问题

redis-sentinel基础概念及部署流程

Linux搭建ftp服务器的步骤