ES-ELSER 如何在内网中离线导入ES官方的稀疏向量模型(国内网络环境下操作方法)

本文主要是介绍ES-ELSER 如何在内网中离线导入ES官方的稀疏向量模型(国内网络环境下操作方法),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

        ES官方训练了稀疏向量模型,用来支持语义检索。(目前该模型只支持英文)

        最好是以离线的方式安装。在线的方式,在国内下载也麻烦,下载速度也慢。还不如用离线的方式。对于一般的生产环境,基本上也是网络隔离的。离线下载安装的方式最简单。

参考官方安装文档:ELSER – Elastic Learned Sparse EncodeR | Machine Learning in the Elastic Stack [8.11] | Elastic

下载模型

直接把链接放在浏览器上,就可以去下载。(我用官方提供的地址,根本没有找到模型文件)

这里注意,es官方提供了两个版本。

v1

https://ml-models.elastic.co/elser_model_1.metadata.json

https://ml-models.elastic.co/elser_model_1.pt

https://ml-models.elastic.co/elser_model_1.vocab.json

V2

https://ml-models.elastic.co/elser_model_2.metadata.json

https://ml-models.elastic.co/elser_model_2.pt

https://ml-models.elastic.co/elser_model_2.vocab.json

上传模型到es节点

然后在config目录下,新建一个model目录,把上边下载的模型,都都放进去

models里边

然后修改es的配置文件

以下内容不用做任何修改(直接复制粘贴到elasticsearch.yml 配置文件中即可。不用修改)

xpack.ml.model_repository: file://${path.home}/config/models/

重启es节点

把每一个节点都重启。

应用部署模型

点击左上角,在table页中选择

machine learning > model managemant > trained models

然后在kibana的机器学习界面,找到模型管理,点击下载。

我这里已经点击过下载了,这里需要一点时间下载。等待下载完成,再部署模型。这里其实是把准备好的模型,导入到集群中

选择部署模型

这里,早到elser_model_1 然后选择start deployment

ELSER 使用文档

Tutorial: semantic search with ELSER | Elasticsearch Guide [8.11] | Elastic

这篇关于ES-ELSER 如何在内网中离线导入ES官方的稀疏向量模型(国内网络环境下操作方法)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/445095

相关文章

MySQL 多表连接操作方法(INNER JOIN、LEFT JOIN、RIGHT JOIN、FULL OUTER JOIN)

《MySQL多表连接操作方法(INNERJOIN、LEFTJOIN、RIGHTJOIN、FULLOUTERJOIN)》多表连接是一种将两个或多个表中的数据组合在一起的SQL操作,通过连接,... 目录一、 什么是多表连接?二、 mysql 支持的连接类型三、 多表连接的语法四、实战示例 数据准备五、连接的性

Java controller接口出入参时间序列化转换操作方法(两种)

《Javacontroller接口出入参时间序列化转换操作方法(两种)》:本文主要介绍Javacontroller接口出入参时间序列化转换操作方法,本文给大家列举两种简单方法,感兴趣的朋友一起看... 目录方式一、使用注解方式二、统一配置场景:在controller编写的接口,在前后端交互过程中一般都会涉及

Qt实现网络数据解析的方法总结

《Qt实现网络数据解析的方法总结》在Qt中解析网络数据通常涉及接收原始字节流,并将其转换为有意义的应用层数据,这篇文章为大家介绍了详细步骤和示例,感兴趣的小伙伴可以了解下... 目录1. 网络数据接收2. 缓冲区管理(处理粘包/拆包)3. 常见数据格式解析3.1 jsON解析3.2 XML解析3.3 自定义

IntelliJ IDEA 中配置 Spring MVC 环境的详细步骤及问题解决

《IntelliJIDEA中配置SpringMVC环境的详细步骤及问题解决》:本文主要介绍IntelliJIDEA中配置SpringMVC环境的详细步骤及问题解决,本文分步骤结合实例给大... 目录步骤 1:创建 Maven Web 项目步骤 2:添加 Spring MVC 依赖1、保存后执行2、将新的依赖

如何为Yarn配置国内源的详细教程

《如何为Yarn配置国内源的详细教程》在使用Yarn进行项目开发时,由于网络原因,直接使用官方源可能会导致下载速度慢或连接失败,配置国内源可以显著提高包的下载速度和稳定性,本文将详细介绍如何为Yarn... 目录一、查询当前使用的镜像源二、设置国内源1. 设置为淘宝镜像源2. 设置为其他国内源三、还原为官方

Spring 请求之传递 JSON 数据的操作方法

《Spring请求之传递JSON数据的操作方法》JSON就是一种数据格式,有自己的格式和语法,使用文本表示一个对象或数组的信息,因此JSON本质是字符串,主要负责在不同的语言中数据传递和交换,这... 目录jsON 概念JSON 语法JSON 的语法JSON 的两种结构JSON 字符串和 Java 对象互转

使用Python实现图像LBP特征提取的操作方法

《使用Python实现图像LBP特征提取的操作方法》LBP特征叫做局部二值模式,常用于纹理特征提取,并在纹理分类中具有较强的区分能力,本文给大家介绍了如何使用Python实现图像LBP特征提取的操作方... 目录一、LBP特征介绍二、LBP特征描述三、一些改进版本的LBP1.圆形LBP算子2.旋转不变的LB

Maven的使用和配置国内源的保姆级教程

《Maven的使用和配置国内源的保姆级教程》Maven是⼀个项目管理工具,基于POM(ProjectObjectModel,项目对象模型)的概念,Maven可以通过一小段描述信息来管理项目的构建,报告... 目录1. 什么是Maven?2.创建⼀个Maven项目3.Maven 核心功能4.使用Maven H

springboot整合阿里云百炼DeepSeek实现sse流式打印的操作方法

《springboot整合阿里云百炼DeepSeek实现sse流式打印的操作方法》:本文主要介绍springboot整合阿里云百炼DeepSeek实现sse流式打印,本文给大家介绍的非常详细,对大... 目录1.开通阿里云百炼,获取到key2.新建SpringBoot项目3.工具类4.启动类5.测试类6.测

Python如何自动生成环境依赖包requirements

《Python如何自动生成环境依赖包requirements》:本文主要介绍Python如何自动生成环境依赖包requirements问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑... 目录生成当前 python 环境 安装的所有依赖包1、命令2、常见问题只生成当前 项目 的所有依赖包1、