【业余玩儿AI】【文档问答】实操记录0822

2024-08-23 00:36

本文主要是介绍【业余玩儿AI】【文档问答】实操记录0822,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

电梯

  • 前文回顾
  • 继续踩坑实录
    • 从头来过,docker部署Ollama
    • 我一定是被偷听了,大数据之神把我拉出泥潭
    • 时间回到白天,模型初窥
    • 时间回到开心的链接上Ollama那一刻
  • 按捺住乱撞的小鹿,我去准备下文的剧情了

前文回顾

这里书接上文,上文说到:
目标是文档问答,先是本地部署了Marker,然后又试用了popai,最后发现了Dify,于是开始在本地部署Dify.
前天,小卡拉米我七尺咔嚓几下,Dify部署很顺利,但是链接不上本地Ollama.这种问题对于刚开始学习的小卡拉米来说实在难解.

继续踩坑实录

从头来过,docker部署Ollama

我实在是想不出问题的原因,剩下几个不多的我猜测的且都不愿意相信的原因里面,只能从里面逐个尝试.比如原来下载的Ollama是windows预览版,会不会是有bug.于是卸载了用docker重新部署.
打开Ollama官网的文档hub.docker.com/r/ollama/ollama操作,说要先安装英伟达的toolkit,不会,找到一篇[小小的太阳]前辈的文章,传送门,Sxiu~~~,按着做完了,还算比较顺利,我就不赘述了.
安装完后继续按照Ollama的doc继续下载之前的qwen2:7b.

docker exec -it ollama ollama run qwen2:7b

再重新部署Dify,参照之前的流程,这次就顺利多了,越过了低级错误.
再次来到配置Ollama的页面,激动的心,颤抖的手,输入所有参数,点击确认.
哦买尬~ 依然没连上… 后面一点进展没有,按下不表…

我一定是被偷听了,大数据之神把我拉出泥潭

昨天早上,当我晃晃悠悠的在上班的地铁上消磨我那丈二和尚摸不着头脑的莫名时刻,抖音画面刚刷过一条052D在英国大门口自由航行的新闻,我还在畅想自己啥时候能把这个问题突破让我在AI的道路上也自由航行一把,就刷到了一条Dify+Ollama(Docker)的视频,然后男主当着我的面在配置Ollama的界面上敲入了一行我闻所未闻的链接

http://host.docker.internal:11434

没见过…没见过!意味着新的可能,而且那么巧,我刚刚用docker重新部署了Ollama.你们说我是不是被偷听了…
一闭眼一睁眼,一白天过去了…
晚上回到家,又是激动的心,又是颤抖的手,输入blingbling的链接,点击确认.接下来的几秒,好消息是没有error,坏消息是没有任何反应.额…当我吸足了气准备吐槽一个问题没搞定又出新状况的时候,那个表示链接状态的小灯从灰色变成绿色,哇哈哈哈,简直是天助我也~~~~~
在此,我必须感谢一下把我救出泥潭的大哥,虽然素未谋面也不知大哥身材是否伟岸,但是在我小卡拉米的心里他是伟大的!请受小卡拉米一拜~~
介绍一下大哥,抖音账号ldfmlsys
在这里插入图片描述
去大哥的账号里面翻了翻,都是讲本地知识库部署的,哇哈哈哈,你说大数据没分析我我都不相信!感兴趣的也可以去翻翻,这大哥视频下面的点评都回复的.才关注82个人,小卡拉米我都关注1000个人,一看就是专注技术的大才!是我等小卡拉米的榜样!请容小弟再拜~~

时间回到白天,模型初窥

到这里应该也能看出我今天心情不错了,这个问题卡了我三天了,很多小卡拉米被卡3天可能都已经放弃了,而我是个意志坚定的卡拉米!
这里采用倒叙的叙事方法说一下白天的事情.
白天当然也没闲着,去了Dify官网的页面摸索了一下,感兴趣的也可以去瞅瞅:Dify官网app传送门,Sxiu~~~,在里面试了一下模型链接\上传文档到知识库\参考前辈聊天机器人新建了一个基于知识库进行问答的聊天机器人.像我这么优秀,啊不,这么爱琢磨的卡拉米还是拿捏的了的.
在这个过程里面跟着工具配置的过程,了解它工作的思路和原理,原来LLM\Rerank\Embeding的模型是这么个应用流程,对RAG和Rerank有了比较直观的感受, 过程里面虽然用到了Embeding的模型,但是还没搞明白是怎么用上的,还有传说中的向量数据库,就是所谓的知识库,虽然用了,但是对我完全透明,也有需要进一步研究的.
总而言之,要了解的东西就像吹气球一样随着体积和表面积增大接触到的未知的知识是按照很多次方的速度增加的.

时间回到开心的链接上Ollama那一刻

连上之后准备万解,开始蓄力.
基于白天的收获,开始搜索免费开源可以本地部署的各种模型.
LLM模型除了qwen2,llama3.1,发现google的gemimi收费前的免费额度也很高(了解到这个也得感谢抖音美好生活的大数据之神),这种模型多到几句说不完,不过目前qwen2我觉得就够了,基于前几天的试用,感觉qwen2比llama3.1更适合我,有个能用的先用着,整明白了再优化.
Rerank的模型,在Dify的服务接口页面上找到了jina传送门,Sxiu~~~去看了一眼,这个有意思,页面上直接显示APIKey,还有这个API剩余的token数量,意思是不嫌麻烦就可以白嫖? 直接连在我的Dify上,顺利成功.
Embeding的模型,在Ollama的lib里面直接搜,找到一个pull了380多K的模型,了解了一下的确有点货,直接pull.

ollama pull nomic-embed-text:v1.5

知识库,Dify自带且免费,先不费劲了找了.

按捺住乱撞的小鹿,我去准备下文的剧情了

.
.
.

D:\mybin>python “D:\mybin\PythonScripts\getdays.py”


Since I started self-learning AI, it has been 10 days already. Keep going!

这篇关于【业余玩儿AI】【文档问答】实操记录0822的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1097850

相关文章

java中pdf模版填充表单踩坑实战记录(itextPdf、openPdf、pdfbox)

《java中pdf模版填充表单踩坑实战记录(itextPdf、openPdf、pdfbox)》:本文主要介绍java中pdf模版填充表单踩坑的相关资料,OpenPDF、iText、PDFBox是三... 目录准备Pdf模版方法1:itextpdf7填充表单(1)加入依赖(2)代码(3)遇到的问题方法2:pd

Python操作PDF文档的主流库使用指南

《Python操作PDF文档的主流库使用指南》PDF因其跨平台、格式固定的特性成为文档交换的标准,然而,由于其复杂的内部结构,程序化操作PDF一直是个挑战,本文主要为大家整理了Python操作PD... 目录一、 基础操作1.PyPDF2 (及其继任者 pypdf)2.PyMuPDF / fitz3.Fre

springboot自定义注解RateLimiter限流注解技术文档详解

《springboot自定义注解RateLimiter限流注解技术文档详解》文章介绍了限流技术的概念、作用及实现方式,通过SpringAOP拦截方法、缓存存储计数器,结合注解、枚举、异常类等核心组件,... 目录什么是限流系统架构核心组件详解1. 限流注解 (@RateLimiter)2. 限流类型枚举 (

Spring AI使用tool Calling和MCP的示例详解

《SpringAI使用toolCalling和MCP的示例详解》SpringAI1.0.0.M6引入ToolCalling与MCP协议,提升AI与工具交互的扩展性与标准化,支持信息检索、行动执行等... 目录深入探索 Spring AI聊天接口示例Function CallingMCPSTDIOSSE结束语

C#监听txt文档获取新数据方式

《C#监听txt文档获取新数据方式》文章介绍通过监听txt文件获取最新数据,并实现开机自启动、禁用窗口关闭按钮、阻止Ctrl+C中断及防止程序退出等功能,代码整合于主函数中,供参考学习... 目录前言一、监听txt文档增加数据二、其他功能1. 设置开机自启动2. 禁止控制台窗口关闭按钮3. 阻止Ctrl +

Zabbix在MySQL性能监控方面的运用及最佳实践记录

《Zabbix在MySQL性能监控方面的运用及最佳实践记录》Zabbix通过自定义脚本和内置模板监控MySQL核心指标(连接、查询、资源、复制),支持自动发现多实例及告警通知,结合可视化仪表盘,可有效... 目录一、核心监控指标及配置1. 关键监控指标示例2. 配置方法二、自动发现与多实例管理1. 实践步骤

三频BE12000国补到手2549元! ROG 魔盒Pro WIFI7电竞AI路由器上架

《三频BE12000国补到手2549元!ROG魔盒ProWIFI7电竞AI路由器上架》近日,华硕带来了ROG魔盒ProWIFI7电竞AI路由器(ROGSTRIXGR7Pro),目前新... 华硕推出了ROG 魔盒Pro WIFI7电竞AI路由器(ROG STRIX GR7 Phttp://www.cppcn

Java docx4j高效处理Word文档的实战指南

《Javadocx4j高效处理Word文档的实战指南》对于需要在Java应用程序中生成、修改或处理Word文档的开发者来说,docx4j是一个强大而专业的选择,下面我们就来看看docx4j的具体使用... 目录引言一、环境准备与基础配置1.1 Maven依赖配置1.2 初始化测试类二、增强版文档操作示例2.

Java操作Word文档的全面指南

《Java操作Word文档的全面指南》在Java开发中,操作Word文档是常见的业务需求,广泛应用于合同生成、报表输出、通知发布、法律文书生成、病历模板填写等场景,本文将全面介绍Java操作Word文... 目录简介段落页头与页脚页码表格图片批注文本框目录图表简介Word编程最重要的类是org.apach

在Spring Boot中集成RabbitMQ的实战记录

《在SpringBoot中集成RabbitMQ的实战记录》本文介绍SpringBoot集成RabbitMQ的步骤,涵盖配置连接、消息发送与接收,并对比两种定义Exchange与队列的方式:手动声明(... 目录前言准备工作1. 安装 RabbitMQ2. 消息发送者(Producer)配置1. 创建 Spr