coreseek搭建教程

2024-04-09 12:08
文章标签 教程 搭建 coreseek

本文主要是介绍coreseek搭建教程,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

说明

  1. coreseek官网(http://www.coreseek.cn/)已经关闭。
  2. 可参考手册:https://my.oschina.net/alexwu/blog/71155
  3. coreseek是中文版的sphinx

搭建教程

1.环境的处理

    用的yum命令:yum install make gcc g++ gcc-c++ libtool autoconf automake imake mysql-devel libxml2-devel expat-devel用的apt-get命令:apt-get install make gcc g++ automake libtool mysql-client libmysqlclient-dev libxml2-dev libexpat1-dev

2.软件安装

常见版本:4.1,3.2.14 (建议4.1)
下载软件包 coreseek-4.1-beta.tar.gz
解压:tar zxvf coreseek-4.1-beta.tar.gz

3.安装mmseg分词

 cd /usr/local/coreseek-4.1-beta./bootstrap./configure --prefix=/usr/local/mmseg3    #配置 mmseg-3.2.14make && make install    #编译、安装 mmseg-3.2.14

4.测试分词效果

vim t1.txt
输入 中国上海,保存退出。测试:/usr/local/mmseg3/bin/mmseg -d /usr/local/mmseg3/etc t1.txt

测试结果:

5.安装 Coreseek-4.1-beta 搜索

cd /usr/local/coreseek-4.1-beta
sh buildconf.sh
./configure --prefix=/usr/local/coreseek  --without-unixodbc --with-mmseg --with-mmseg-includes=/usr/local/mmseg3/include/mmseg/ --with-mmseg-libs=/usr/local/mmseg3/lib/ --without-mysql  #配置 coreseek-4.1-beta
make && make install    #编译、安装

索引配置

######### 索引配置 ######
source baby_knowledge
{type = mysqlsql_host = 192.168.1.1sql_user = testsql_pass = testsql_db = baby //数据库名字sql_port = 3306 //从库端口号sql_query_pre = SET NAMES utf8sql_query_range = SELECT MIN(id), MAX(id) FROM testsql_range_step = 500sql_query = \SELECT id, title, post_id, user_id,UNIX_TIMESTAMP(dated) as dateline \FROM test\WHERE id>$start  and  id<$endsql_attr_uint = post_idsql_attr_uint = user_idsql_attr_timestamp = dateline 属性字段
}
index baby_knowledge_idx //索引名
{source = baby_knowledgepath = /usr/local/coreseek-3.2.14/ var/data/baby_knowledge //存放位置docinfo = externcharset_type = zh_cn.utf-8charset_dictpath = /usr/local/coreseek-3.2.14/dict/ 要有html_strip = 0stopwords = /usr/local/coreseek-3.2.14/dict/stopwords/stopwords.txt //停止词
}
indexer
{mem_limit = 128M
}
searchd
{port = 9351 //不要被占用 netstat -anop|grep 9351log = /usr/local/coreseek-3.2.14/ var/log/search_baby_knowledge.logquery_log = /usr/local/coreseek-3.2.14/ var/log/query_baby_knowledge.logread_timeout = 5max_children = 30pid_file = /usr/local/coreseek-3.2.14/ var/searchd_baby_knowledge.pidmax_matches = 10000seamless_rotate = 1preopen_indexes = 0unlink_old = 1
}

索引更新

1.建立索引:

/usr/local/coreseek/bin/indexer -c {最好配置文件绝对路径} {索引名字}
检查索引数据是否ok

2.启动索引服务

/usr/local/coreseek/bin/searchd -c /usr/local/coreseek/etc/sphinx.conf -i baby_idx

3.查看命令用法

/usr/local/coreseek/bin/search

4.直接搜索:

/usr/local/coreseek/bin/search -c {最好配置文件绝对路径} {索引名字}{搜索词}

demo:搜索一个词测试

5.索引重建

/usr/local/coreseek/bin/indexer --config /usr/local/coreseek/etc/project/sphinx.conf baby_idx --rotate

6.增量索引使用

/usr/local/coreseek/bin/indexer --config /usr/local/coreseek/etc/project/sphinx.conf baby_merge --rotate

7.合并索引跟增量索引

/usr/local/coreseek/bin/indexer --config /usr/local/coreseek/etc/project/sphinx.conf --merge baby_idx baby_merge --rotate

这篇关于coreseek搭建教程的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/888112

相关文章

Java 与 LibreOffice 集成开发指南(环境搭建及代码示例)

《Java与LibreOffice集成开发指南(环境搭建及代码示例)》本文介绍Java与LibreOffice的集成方法,涵盖环境配置、API调用、文档转换、UNO桥接及REST接口等技术,提供... 目录1. 引言2. 环境搭建2.1 安装 LibreOffice2.2 配置 Java 开发环境2.3 配

python使用Akshare与Streamlit实现股票估值分析教程(图文代码)

《python使用Akshare与Streamlit实现股票估值分析教程(图文代码)》入职测试中的一道题,要求:从Akshare下载某一个股票近十年的财务报表包括,资产负债表,利润表,现金流量表,保存... 目录一、前言二、核心知识点梳理1、Akshare数据获取2、Pandas数据处理3、Matplotl

Python pandas库自学超详细教程

《Pythonpandas库自学超详细教程》文章介绍了Pandas库的基本功能、安装方法及核心操作,涵盖数据导入(CSV/Excel等)、数据结构(Series、DataFrame)、数据清洗、转换... 目录一、什么是Pandas库(1)、Pandas 应用(2)、Pandas 功能(3)、数据结构二、安

Python极速搭建局域网文件共享服务器完整指南

《Python极速搭建局域网文件共享服务器完整指南》在办公室或家庭局域网中快速共享文件时,许多人会选择第三方工具或云存储服务,但这些方案往往存在隐私泄露风险或需要复杂配置,下面我们就来看看如何使用Py... 目录一、android基础版:HTTP文件共享的魔法命令1. 一行代码启动HTTP服务器2. 关键参

2025版mysql8.0.41 winx64 手动安装详细教程

《2025版mysql8.0.41winx64手动安装详细教程》本文指导Windows系统下MySQL安装配置,包含解压、设置环境变量、my.ini配置、初始化密码获取、服务安装与手动启动等步骤,... 目录一、下载安装包二、配置环境变量三、安装配置四、启动 mysql 服务,修改密码一、下载安装包安装地

电脑提示d3dx11_43.dll缺失怎么办? DLL文件丢失的多种修复教程

《电脑提示d3dx11_43.dll缺失怎么办?DLL文件丢失的多种修复教程》在使用电脑玩游戏或运行某些图形处理软件时,有时会遇到系统提示“d3dx11_43.dll缺失”的错误,下面我们就来分享超... 在计算机使用过程中,我们可能会遇到一些错误提示,其中之一就是缺失某个dll文件。其中,d3dx11_4

Linux下在线安装启动VNC教程

《Linux下在线安装启动VNC教程》本文指导在CentOS7上在线安装VNC,包含安装、配置密码、启动/停止、清理重启步骤及注意事项,强调需安装VNC桌面以避免黑屏,并解决端口冲突和目录权限问题... 目录描述安装VNC安装 VNC 桌面可能遇到的问题总结描js述linux中的VNC就类似于Window

Go语言编译环境设置教程

《Go语言编译环境设置教程》Go语言支持高并发(goroutine)、自动垃圾回收,编译为跨平台二进制文件,云原生兼容且社区活跃,开发便捷,内置测试与vet工具辅助检测错误,依赖模块化管理,提升开发效... 目录Go语言优势下载 Go  配置编译环境配置 GOPROXYIDE 设置(VS Code)一些基本

Windows环境下解决Matplotlib中文字体显示问题的详细教程

《Windows环境下解决Matplotlib中文字体显示问题的详细教程》本文详细介绍了在Windows下解决Matplotlib中文显示问题的方法,包括安装字体、更新缓存、配置文件设置及编码調整,并... 目录引言问题分析解决方案详解1. 检查系统已安装字体2. 手动添加中文字体(以SimHei为例)步骤

Java JDK1.8 安装和环境配置教程详解

《JavaJDK1.8安装和环境配置教程详解》文章简要介绍了JDK1.8的安装流程,包括官网下载对应系统版本、安装时选择非系统盘路径、配置JAVA_HOME、CLASSPATH和Path环境变量,... 目录1.下载JDK2.安装JDK3.配置环境变量4.检验JDK官网下载地址:Java Downloads