【AI大模型】这可能是最简单的本地大模型工具，无须部署，一键使用

2024-05-26 00:12

文章标签 工具简单 ai 部署使用模型一键本地可能无须

本文主要是介绍【AI大模型】这可能是最简单的本地大模型工具，无须部署，一键使用，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

目录

前言

LM-Studio编辑

那么问题来了，为什么我要在本地部署大模型？

隐私性：

定制性：

成本和体验的优化：

工具功能特点和使用方式介绍：

首页提供搜索功能和一些模型的推荐

模型下载管理：

聊天界面：编辑

模型偏好设置

使用速度体验：

前言

不需要配置环境，不需要部署，不需要自己找模型。小白也可以打开即用的本地大模型使用工具来了，下面就谈一谈我的使用感受和心得：

LM-Studio

那么问题来了，为什么我要在本地部署大模型？

个人使用下来，最吸引我的有这三点：

隐私性：

网络大模型你的输入都是要上传的云端的，也就是你的隐私肯定会被大模型服务商所获得，这也是为什么那么多公司内部禁止使用网络大模型的原因。而且由于安全和审核机制，你所需要的或者发送的敏感的内容会被屏蔽。但是本地部署，数据完全由自己掌握。

定制性：

目前大部分免费使用的大模型都是通用模型，就那几种，虽然可以通过提示词约束，但是内容生成大部分时候只是差强人意。本地部署，你将拥有整个开源世界的微调模型，医疗，法律，学术，动漫，感情，你即使不去定制自己的模型，也将拥有专业的各领域专家来帮你解决你能想到的大部分问题。更不必说定制自己的专属模型的可能性。

成本和体验的优化：

首先承认大部分开源模型的上限是没有闭源模型高的，但是很多时候闭源模型的响应感受会受到网络，当前访问人数的限制。除非你愿意开会员，即使你愿意开会员，目前除了gpt-4o。大部门模型的响应是一个字一个字往外蹦的，尤其某些厂商做的恶心限制，离开网页就停止输出（某一言）如果你本地有一个还行的显卡，你会感受到原来大模型回答原来可以很迅速。

工具功能特点和使用方式介绍：

下载即exe，安装后即可使用，本体不到500m（提供mac和linux版本）

首页提供搜索功能和一些模型的推荐

你可以直接搜索并下载开源世界的大模型（目前看基本上huggingface，需要梯子）并下载使用，推荐模型会给出介绍。如他的来源是什么，他是多少参数的大模型，什么功能，是否经过量化处理，本地运行至少需求多少内存，占用多少硬盘空间。

模型下载管理：

注意！无论设置什么目录，模型目录必须有如下层级结构，否则会找不到模型：

聊天界面：

模型偏好设置

在聊天界面右上角有个设置功能，可以帮助我们更好的个性化使用，我会给出一些比较常用的参数设置解释

模型初始化角色配置

Preset 可以选择不同模型的初始化设置，你也可以设置自定义的模型使用配置，包括不限于，系统角色初始化提示词（system prompt）,回答的随机程度，系统使用内存和显存的占比等。

模型回答内容控制：

设置模型记忆上下文长度（content length），采样温度(temperature)介于 0 和 1 之间。较高的值（如 0.7）将使输出更加随机，而较低的值（如 0.2）将使其更加集中和确定性，最大生成内容长度（tokens to generate），默认-1由大模型决定生成长度。

模型内容质量控制

Top k ：模型回复时所考虑的回复质量占总体回复的质量比例，总体来说比例越高，回答的质量越高，效果也越单一。

Repeat penalty: 模型重复惩罚，越高模型回答的内容重复性越低

CPU threads: 占用线程。经过尝试，增加占用线程对模型响应速度有少量提升，效果不明显。

显存内存使用占比：

没什么可说的，显存能撑住的情况下，拉到最大，内存的速度比显存慢多了。

使用速度体验：

2060 8g 显卡，7B Q4量化模型（基于llama3 微调的中文模型）。生成token速度为31t/s左右（比大部分网络模型响应快一倍左右），感受还是很不错的，如果完全不使用显存只使用内存，速度约5t/s 只能说能用。

kimi效果：

这个软件可以直接搜索官网mstudio.ai下载。

无法下载模型的小伙伴我也在我的公众号中打包了，我所使用的中文llama3模型（Llama3-8B-Chinese-Chat-q4_0-v2_1，和原始英文模型下载（Meta-Llama-3-8B-Instruct-Q4_K_M）已经软件的整合包下载。

后台回复 LmStudio 即可 ！每天还有更多教程和AI资讯分享！

——因为热爱的AI漫谈社

这篇关于【AI大模型】这可能是最简单的本地大模型工具，无须部署，一键使用的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

http://www.chinasem.cn/article/1003010。 23002807@qq.com

相关文章

Spring Boot整合Redis注解实现增删改查功能(Redis注解使用)

Spring Boot整合Redis注解实现增删改查功能(Redis注解使用)

《SpringBoot整合Redis注解实现增删改查功能(Redis注解使用)》文章介绍了如何使用SpringBoot整合Redis注解实现增删改查功能,包括配置、实体类、Repository、Se... 目录配置Redis连接定义实体类创建Repository接口增删改查操作示例插入数据查询数据删除数据更

阅读更多...

使用python生成固定格式序号的方法详解

使用python生成固定格式序号的方法详解

《使用python生成固定格式序号的方法详解》这篇文章主要为大家详细介绍了如何使用python生成固定格式序号,文中的示例代码讲解详细,具有一定的借鉴价值,有需要的小伙伴可以参考一下... 目录生成结果验证完整生成代码扩展说明1. 保存到文本文件2. 转换为jsON格式3. 处理特殊序号格式（如带圈数字）4

阅读更多...

Java使用Swing生成一个最大公约数计算器

Java使用Swing生成一个最大公约数计算器

《Java使用Swing生成一个最大公约数计算器》这篇文章主要为大家详细介绍了Java使用Swing生成一个最大公约数计算器的相关知识,文中的示例代码讲解详细,感兴趣的小伙伴可以了解一下... 目录第一步：利用欧几里得算法计算最大公约数欧几里得算法的证明情形 1：b=0情形 2：b>0完成相关代码第二步：加

阅读更多...

Java中流式并行操作parallelStream的原理和使用方法

Java中流式并行操作parallelStream的原理和使用方法

《Java中流式并行操作parallelStream的原理和使用方法》本文详细介绍了Java中的并行流（parallelStream）的原理、正确使用方法以及在实际业务中的应用案例,并指出在使用并行流... 目录Java中流式并行操作parallelStream0. 问题的产生1. 什么是parallelS

阅读更多...

Linux join命令的使用及说明

Linux join命令的使用及说明

《Linuxjoin命令的使用及说明》`join`命令用于在Linux中按字段将两个文件进行连接,类似于SQL的JOIN,它需要两个文件按用于匹配的字段排序,并且第一个文件的换行符必须是LF,`jo... 目录一. 基本语法二. 数据准备三. 指定文件的连接key四.-a输出指定文件的所有行五.-o指定输出

阅读更多...

Linux jq命令的使用解读

Linux jq命令的使用解读

《Linuxjq命令的使用解读》jq是一个强大的命令行工具,用于处理JSON数据,它可以用来查看、过滤、修改、格式化JSON数据,通过使用各种选项和过滤器,可以实现复杂的JSON处理任务... 目录一. 简介二. 选项2.1.2.2-c2.3-r2.4-R三. 字段提取3.1 普通字段3.2 数组字段四.

阅读更多...

Linux kill正在执行的后台任务 kill进程组使用详解

Linux kill正在执行的后台任务 kill进程组使用详解

《Linuxkill正在执行的后台任务kill进程组使用详解》文章介绍了两个脚本的功能和区别,以及执行这些脚本时遇到的进程管理问题,通过查看进程树、使用`kill`命令和`lsof`命令,分析了子... 目录零. 用到的命令一. 待执行的脚本二. 执行含子进程的脚本，并kill2.1 进程查看2.2 遇到的

阅读更多...

详解SpringBoot+Ehcache使用示例

详解SpringBoot+Ehcache使用示例

《详解SpringBoot+Ehcache使用示例》本文介绍了SpringBoot中配置Ehcache、自定义get/set方式,并实际使用缓存的过程,文中通过示例代码介绍的非常详细,对大家的学习或者... 目录摘要概念内存与磁盘持久化存储：配置灵活性：编码示例引入依赖：配置ehcache.XML文件：配置

阅读更多...

Java 虚拟线程的创建与使用深度解析

Java 虚拟线程的创建与使用深度解析

《Java虚拟线程的创建与使用深度解析》虚拟线程是Java19中以预览特性形式引入,Java21起正式发布的轻量级线程,本文给大家介绍Java虚拟线程的创建与使用,感兴趣的朋友一起看看吧... 目录一、虚拟线程简介1.1 什么是虚拟线程？1.2 为什么需要虚拟线程？二、虚拟线程与平台线程对比代码对比示例：三

阅读更多...

Nginx分布式部署流程分析

Nginx分布式部署流程分析

《Nginx分布式部署流程分析》文章介绍Nginx在分布式部署中的反向代理和负载均衡作用,用于分发请求、减轻服务器压力及解决session共享问题,涵盖配置方法、策略及Java项目应用,并提及分布式事... 目录分布式部署NginxJava中的代理代理分为正向代理和反向代理正向代理反向代理Nginx应用场景

阅读更多...