coreseek搭建教程

2024-04-09 12:08
文章标签 教程 搭建 coreseek

本文主要是介绍coreseek搭建教程,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

说明

  1. coreseek官网(http://www.coreseek.cn/)已经关闭。
  2. 可参考手册:https://my.oschina.net/alexwu/blog/71155
  3. coreseek是中文版的sphinx

搭建教程

1.环境的处理

    用的yum命令:yum install make gcc g++ gcc-c++ libtool autoconf automake imake mysql-devel libxml2-devel expat-devel用的apt-get命令:apt-get install make gcc g++ automake libtool mysql-client libmysqlclient-dev libxml2-dev libexpat1-dev

2.软件安装

常见版本:4.1,3.2.14 (建议4.1)
下载软件包 coreseek-4.1-beta.tar.gz
解压:tar zxvf coreseek-4.1-beta.tar.gz

3.安装mmseg分词

 cd /usr/local/coreseek-4.1-beta./bootstrap./configure --prefix=/usr/local/mmseg3    #配置 mmseg-3.2.14make && make install    #编译、安装 mmseg-3.2.14

4.测试分词效果

vim t1.txt
输入 中国上海,保存退出。测试:/usr/local/mmseg3/bin/mmseg -d /usr/local/mmseg3/etc t1.txt

测试结果:

5.安装 Coreseek-4.1-beta 搜索

cd /usr/local/coreseek-4.1-beta
sh buildconf.sh
./configure --prefix=/usr/local/coreseek  --without-unixodbc --with-mmseg --with-mmseg-includes=/usr/local/mmseg3/include/mmseg/ --with-mmseg-libs=/usr/local/mmseg3/lib/ --without-mysql  #配置 coreseek-4.1-beta
make && make install    #编译、安装

索引配置

######### 索引配置 ######
source baby_knowledge
{type = mysqlsql_host = 192.168.1.1sql_user = testsql_pass = testsql_db = baby //数据库名字sql_port = 3306 //从库端口号sql_query_pre = SET NAMES utf8sql_query_range = SELECT MIN(id), MAX(id) FROM testsql_range_step = 500sql_query = \SELECT id, title, post_id, user_id,UNIX_TIMESTAMP(dated) as dateline \FROM test\WHERE id>$start  and  id<$endsql_attr_uint = post_idsql_attr_uint = user_idsql_attr_timestamp = dateline 属性字段
}
index baby_knowledge_idx //索引名
{source = baby_knowledgepath = /usr/local/coreseek-3.2.14/ var/data/baby_knowledge //存放位置docinfo = externcharset_type = zh_cn.utf-8charset_dictpath = /usr/local/coreseek-3.2.14/dict/ 要有html_strip = 0stopwords = /usr/local/coreseek-3.2.14/dict/stopwords/stopwords.txt //停止词
}
indexer
{mem_limit = 128M
}
searchd
{port = 9351 //不要被占用 netstat -anop|grep 9351log = /usr/local/coreseek-3.2.14/ var/log/search_baby_knowledge.logquery_log = /usr/local/coreseek-3.2.14/ var/log/query_baby_knowledge.logread_timeout = 5max_children = 30pid_file = /usr/local/coreseek-3.2.14/ var/searchd_baby_knowledge.pidmax_matches = 10000seamless_rotate = 1preopen_indexes = 0unlink_old = 1
}

索引更新

1.建立索引:

/usr/local/coreseek/bin/indexer -c {最好配置文件绝对路径} {索引名字}
检查索引数据是否ok

2.启动索引服务

/usr/local/coreseek/bin/searchd -c /usr/local/coreseek/etc/sphinx.conf -i baby_idx

3.查看命令用法

/usr/local/coreseek/bin/search

4.直接搜索:

/usr/local/coreseek/bin/search -c {最好配置文件绝对路径} {索引名字}{搜索词}

demo:搜索一个词测试

5.索引重建

/usr/local/coreseek/bin/indexer --config /usr/local/coreseek/etc/project/sphinx.conf baby_idx --rotate

6.增量索引使用

/usr/local/coreseek/bin/indexer --config /usr/local/coreseek/etc/project/sphinx.conf baby_merge --rotate

7.合并索引跟增量索引

/usr/local/coreseek/bin/indexer --config /usr/local/coreseek/etc/project/sphinx.conf --merge baby_idx baby_merge --rotate

这篇关于coreseek搭建教程的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/888112

相关文章

PostgreSQ数据库实现在Windows上异地自动备份指南的详细教程

《PostgreSQ数据库实现在Windows上异地自动备份指南的详细教程》这篇文章主要为大家详细介绍了如何在Windows系统上实现PostgreSQL数据库的异地自动备份,文中的示例代码讲解详细,... 目录前期准备实现步骤步骤一:创建备份脚本步骤二:配置免密登录(可选但推荐)步骤三:设置任务计划程序步

Python中Tkinter GUI编程详细教程

《Python中TkinterGUI编程详细教程》Tkinter作为Python编程语言中构建GUI的一个重要组件,其教程对于任何希望将Python应用到实际编程中的开发者来说都是宝贵的资源,这篇文... 目录前言1. Tkinter 简介2. 第一个 Tkinter 程序3. 窗口和基础组件3.1 创建窗

Python中Request的安装以及简单的使用方法图文教程

《Python中Request的安装以及简单的使用方法图文教程》python里的request库经常被用于进行网络爬虫,想要学习网络爬虫的同学必须得安装request这个第三方库,:本文主要介绍P... 目录1.Requests 安装cmd 窗口安装为pycharm安装在pycharm设置中为项目安装req

JavaWeb项目创建、部署、连接数据库保姆级教程(tomcat)

《JavaWeb项目创建、部署、连接数据库保姆级教程(tomcat)》:本文主要介绍如何在IntelliJIDEA2020.1中创建和部署一个JavaWeb项目,包括创建项目、配置Tomcat服务... 目录简介:一、创建项目二、tomcat部署1、将tomcat解压在一个自己找得到路径2、在idea中添加

Python + Streamlit项目部署方案超详细教程(非Docker版)

《Python+Streamlit项目部署方案超详细教程(非Docker版)》Streamlit是一款强大的Python框架,专为机器学习及数据可视化打造,:本文主要介绍Python+St... 目录一、针对 Alibaba Cloud linux/Centos 系统的完整部署方案1. 服务器基础配置(阿里

Spring IOC核心原理详解与运用实战教程

《SpringIOC核心原理详解与运用实战教程》本文详细解析了SpringIOC容器的核心原理,包括BeanFactory体系、依赖注入机制、循环依赖解决和三级缓存机制,同时,介绍了SpringBo... 目录1. Spring IOC核心原理深度解析1.1 BeanFactory体系与内部结构1.1.1

SpringBoot集成iText快速生成PDF教程

《SpringBoot集成iText快速生成PDF教程》本文介绍了如何在SpringBoot项目中集成iText9.4.0生成PDF文档,包括新特性的介绍、环境准备、Service层实现、Contro... 目录SpringBoot集成iText 9.4.0生成PDF一、iText 9新特性与架构变革二、环

2025最新版Android Studio安装及组件配置教程(SDK、JDK、Gradle)

《2025最新版AndroidStudio安装及组件配置教程(SDK、JDK、Gradle)》:本文主要介绍2025最新版AndroidStudio安装及组件配置(SDK、JDK、Gradle... 目录原生 android 简介Android Studio必备组件一、Android Studio安装二、A

前端Visual Studio Code安装配置教程之下载、汉化、常用组件及基本操作

《前端VisualStudioCode安装配置教程之下载、汉化、常用组件及基本操作》VisualStudioCode是微软推出的一个强大的代码编辑器,功能强大,操作简单便捷,还有着良好的用户界面,... 目录一、Visual Studio Code下载二、汉化三、常用组件1、Auto Rename Tag2

JavaScript装饰器从基础到实战教程

《JavaScript装饰器从基础到实战教程》装饰器是js中一种声明式语法特性,用于在不修改原始代码的情况下,动态扩展类、方法、属性或参数的行为,本文将从基础概念入手,逐步讲解装饰器的类型、用法、进阶... 目录一、装饰器基础概念1.1 什么是装饰器?1.2 装饰器的语法1.3 装饰器的执行时机二、装饰器的