怎么在Windows操作系统部署阿里开源版通义千问(Qwen2)

2024-09-02 04:44

本文主要是介绍怎么在Windows操作系统部署阿里开源版通义千问(Qwen2),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

怎么在Windows操作系统部署阿里开源版通义千问(Qwen2)

| 原创作者/编辑:凯哥Java | 分类:人工智能学习系列教程

添加图片注释,不超过 140 字(可选)

GitHub上qwen2截图

随着人工智能技术的不断进步,阿里巴巴通义千问团队近期发布了Qwen2系列开源模型,这一系列模型在多个领域展现出卓越的性能,特别是在自然语言理解、知识、代码、数学及多语言等能力上均显著超越当前领先的模型。本文将详细介绍如何在Windows操作系统上部署阿里开源版通义千问(Qwen2)模型,快速上手并体验这一强大的AI工具。

一、准备工作

在开始部署之前,请确保您的Windows系统满足以下要求:

1. 系统兼容性:确保您的Windows系统版本支持所需的软件安装。

2. 显卡驱动:如果您的计算机配备了独立显卡,请确保显卡驱动是最新的,以便更好地支持模型运行。

3. 硬盘空间:Qwen2模型文件较大,需要足够的硬盘空间来存储。

凯哥使用的电脑配置:

CPU:I7-12700F

内存:32GB

显卡:RTX3060 12G

添加图片注释,不超过 140 字(可选)

cpu和内存

添加图片注释,不超过 140 字(可选)

显卡

二、下载并安装Ollama

Ollama是一个用于运行大型AI模型的工具,支持多种模型格式,包括Qwen2。首先,您需要从Ollama的官方网站下载并安装Ollama。

  1. 访问Ollama官网:进入Ollama官网(https://ollama.com/download/windows)。

2. 下载并安装:点击“Download”按钮,选择Windows版本进行下载。下载完成后,按照提示进行安装。

这里凯哥就选择Windows版本的。

添加图片注释,不超过 140 字(可选)

ollama官网下载页面

三、下载Qwen2模型

接下来,您需要从阿里通义千问的官方仓库下载Qwen2模型。

1. 访问官方教程:访问Qwen2官方教程(实际链接以官方提供为准)。

https://qwen.readthedocs.io/zh-cn/latest/

2. 选择适合的模型:根据您的硬件条件(如显卡显存大小),选择适合的Qwen2模型版本。在官方教程中,拉到最下面,可以看到效率评估。如下图:

添加图片注释,不超过 140 字(可选)

找到效率评估

因为凯哥的显卡是12GB,所以凯哥选择Qwen2-7B-Instruct。如果你的显卡也是12GB,可以选择Qwen2-7B-Instruct版本。

添加图片注释,不超过 140 字(可选)

Qwen2-7B-Instruct不同版本内存占用

凯哥使用的下载地址:https://modelscope.cn/models/qwen/Qwen2-7B-Instruct-GGUF/files

3. 下载模型文件:在官方教程中,找到模型下载链接,下载对应的.gguf文件。注意,模型文件可能包含多个精度版本(如q8、q16等),选择适合您需求的版本。

说明:

会看到不同的后缀,q”+ 用于存储权重的位数(精度)+ 特定变体,数字越大性能越强。

数字越大,精度越高,k是在所有的attention和feed_forward张量上将精度提升2位,m是在一半的attention和feed_forward张量上将精度提升2位。

根据自己的需求选择模型,凯哥这里直接选了q8。

添加图片注释,不超过 140 字(可选)

凯哥选择的q8

四、部署Qwen2模型

下载完模型文件后,您可以使用Ollama来部署Qwen2模型。

1. 创建模型文件:在Windows上创建一个新文件夹(例如命名为“qwen”),将下载的.gguf文件放入该文件夹中。然后,在该文件夹内创建一个名为“Modelfile”的文本文件,内容填写为:

 
 

FROM ./qwen2-7b-instruct-q8_0.gguf

注意替换文件名以匹配您下载的模型文件。

2. 使用Ollama创建模型:打开命令行工具(如CMD或PowerShell),切换到包含Modelfile的文件夹。运行以下命令来创建Qwen2模型:

添加图片注释,不超过 140 字(可选)

模型创建成功

如果显示“success”,则表示模型创建成功。

3. 运行模型:创建成功后,您可以通过以下命令来运行模型:

 
 

ollama run Qwen2-7B

此时,您应该能看到一个对话框或命令行界面,您可以在这里输入文本与模型进行交互。

添加图片注释,不超过 140 字(可选)

命令行输入文案地方

在这里输入:你是谁?看看模型怎么交互的。

可以看到模型交互如下:

添加图片注释,不超过 140 字(可选)

模型交互效果

补充说明: 如果要看本地有哪些大模型:ollama list

如果要删除这个模型的话:ollama rm xxx

如果要看运行了哪些大模型:ollama ps

运行结果:

添加图片注释,不超过 140 字(可选)

运行效果

五、在Web界面中运行Qwen2

虽然直接在命令行中运行模型很方便,但为了获得更好的用户体验,您可以将Qwen2模型集成到Web界面中。

1. 安装Node.js:

首先,需要在Windows上安装Node.js。访问Node.js官网,下载并安装最新版本的Node.js。

凯哥使用的是版本号是18.6

添加图片注释,不超过 140 字(可选)

凯哥本地node版本

2. 下载ollama-webui:

从GitHub或其他源下载ollama-webui的代码。

 
 

https://github.com/ollama-webui/ollama-webui-lite

3. 设置并启动Web界面:

按照ollama-webui的文档说明,设置Node.js环境,安装依赖,并启动Web服务器。然后,在浏览器中打开Web页面,选择您的Qwen2模型即可开始对话。

3.1镜像提速:

入ollama-webui文件夹,设置国内镜像源提速:

 
 

npm config set registry http://mirrors.cloud.tencent.com/npm/

3.2 安装依赖

 
 

npm install

错误解决办法:

如果报错说要audit,则依次进行即可:

 
 

npm audit

添加图片注释,不超过 140 字(可选)

启动

3.3 启动Web界面:

命令执行完成就可以用看到如下图的访问地址:

添加图片注释,不超过 140 字(可选)

启动成功输出访问地址

打开Web页面,选择你的模型即可开始对话:

添加图片注释,不超过 140 字(可选)

访问页面

通过web和模型进行交互:

我们依然输入:你是谁?

添加图片注释,不超过 140 字(可选)

在web也没和模型交互效果

好了,至此,你就可以在自己电脑上和模型进行对话了。

大家好:我是凯哥Java(kaigejava),如果大家感兴趣,可以一起学学AI。

六、总结

通过以上步骤,您可以在Windows操作系统上成功部署阿里开源版通义千问(Qwen2)模型,并通过命令行或Web界面与模型进行交互。Qwen2系列模型凭借其卓越的性能和广泛的应用场景,将为您的AI项目提供强大的支持。

希望本文能帮助您顺利部署阿里开源版通义千问模型,享受AI技术带来的便利与乐趣。如有任何疑问,请随时查阅官方文档或寻求技术支持。

这篇关于怎么在Windows操作系统部署阿里开源版通义千问(Qwen2)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1129025

相关文章

Nginx分布式部署流程分析

《Nginx分布式部署流程分析》文章介绍Nginx在分布式部署中的反向代理和负载均衡作用,用于分发请求、减轻服务器压力及解决session共享问题,涵盖配置方法、策略及Java项目应用,并提及分布式事... 目录分布式部署NginxJava中的代理代理分为正向代理和反向代理正向代理反向代理Nginx应用场景

Linux挂载linux/Windows共享目录实现方式

《Linux挂载linux/Windows共享目录实现方式》:本文主要介绍Linux挂载linux/Windows共享目录实现方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地... 目录文件共享协议linux环境作为服务端(NFS)在服务器端安装 NFS创建要共享的目录修改 NFS 配

基于Python开发Windows自动更新控制工具

《基于Python开发Windows自动更新控制工具》在当今数字化时代,操作系统更新已成为计算机维护的重要组成部分,本文介绍一款基于Python和PyQt5的Windows自动更新控制工具,有需要的可... 目录设计原理与技术实现系统架构概述数学建模工具界面完整代码实现技术深度分析多层级控制理论服务层控制注

Linux中查看操作系统及其版本信息的多种方法

《Linux中查看操作系统及其版本信息的多种方法》在服务器运维或者部署系统中,经常需要确认服务器的系统版本、cpu信息等,在Linux系统中,有多种方法可以查看操作系统及其版本信息,以下是一些常用的方... 目录1. lsb_pythonrelease 命令2. /etc/os-release 文件3. h

Oracle数据库在windows系统上重启步骤

《Oracle数据库在windows系统上重启步骤》有时候在服务中重启了oracle之后,数据库并不能正常访问,下面:本文主要介绍Oracle数据库在windows系统上重启的相关资料,文中通过代... oracle数据库在Windows上重启的方法我这里是使用oracle自带的sqlplus工具实现的方

linux部署NFS和autofs自动挂载实现过程

《linux部署NFS和autofs自动挂载实现过程》文章介绍了NFS(网络文件系统)和Autofs的原理与配置,NFS通过RPC实现跨系统文件共享,需配置/etc/exports和nfs.conf,... 目录(一)NFS1. 什么是NFS2.NFS守护进程3.RPC服务4. 原理5. 部署5.1安装NF

linux配置podman阿里云容器镜像加速器详解

《linux配置podman阿里云容器镜像加速器详解》本文指导如何配置Podman使用阿里云容器镜像加速器:登录阿里云获取专属加速地址,修改Podman配置文件并移除https://前缀,最后拉取镜像... 目录1.下载podman2.获取阿里云个人容器镜像加速器地址3.更改podman配置文件4.使用po

通过Docker容器部署Python环境的全流程

《通过Docker容器部署Python环境的全流程》在现代化开发流程中,Docker因其轻量化、环境隔离和跨平台一致性的特性,已成为部署Python应用的标准工具,本文将详细演示如何通过Docker容... 目录引言一、docker与python的协同优势二、核心步骤详解三、进阶配置技巧四、生产环境最佳实践

Nginx部署HTTP/3的实现步骤

《Nginx部署HTTP/3的实现步骤》本文介绍了在Nginx中部署HTTP/3的详细步骤,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学... 目录前提条件第一步:安装必要的依赖库第二步:获取并构建 BoringSSL第三步:获取 Nginx

redis-sentinel基础概念及部署流程

《redis-sentinel基础概念及部署流程》RedisSentinel是Redis的高可用解决方案,通过监控主从节点、自动故障转移、通知机制及配置提供,实现集群故障恢复与服务持续可用,核心组件包... 目录一. 引言二. 核心功能三. 核心组件四. 故障转移流程五. 服务部署六. sentinel部署