CentOS6.2 安装Coreseek(Sphinx)详细教程

2024-02-12 08:08

本文主要是介绍CentOS6.2 安装Coreseek(Sphinx)详细教程,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Sphinx是一个基于SQL的全文检索引擎,可以结合mysql,postgresql做全文搜索,它可以提供比数据库本身更专业的搜索功能,但对中文检索并不友好。而coreseek就是基于sphinx针对中文搜索研发出来的软件, 适用于行业/垂直搜索、论坛/站内搜索、数据库搜索、文档/文献检索、信息检索、数据挖掘等应用场景。http://blog.rekfan.com/?p=136
Coreseek是一款开源的支持中文的全文检索应用,基于Sphinx开发,而且有自己的中文分词词库,因此适合中文网站构建自己的搜索引擎。

测试环境:
CentOS-6.2-x86_64 

注:本次测试rekfan已经提前将mysql安装好了,大家测试的时候务必要先将mysql安装好!http://blog.rekfan.com/?p=136

1.下载coreseek软件
[root@rekfan.com 下载]# wget http://www.coreseek.cn/uploads/csft/4.0/coreseek-4.0.1-beta.tar.gz

2.解压软件包
[root@rekfan.com 下载]# tar xzvf coreseek-4.0.1-beta.tar.gz

Coreseek版本:
coreseek-4.0.1-beta.tar.gz里面包含下面几个目录
csft-4.0.1 ----- coreseek源代码
mmseg-3.2.14 ---- mmseg源代码
testpack ---- 测试配置和数据包
README.txt ---- 查看解压缩出来的目录结构
 
3.安装依赖软件
[root@rekfan.com 下载]# yum install gcc gcc-c++ libtool autoconf automake imake mysql-devel libxml2-devel expat-devel 

4.安装mmseg
[root@rekfan.com 下载]# cd coreseek-4.0.1-beta
[root@rekfan.com coreseek-4.0.1-beta]# cd mmseg-3.2.14
[root@rekfan.com mmseg-3.2.14]# cd ./bootstrap    #输出的warning信息可以忽略,如果出现error则需要解决
[root@rekfan.com mmseg-3.2.14]# ./configure --prefix=/usr/local/mmseg
[root@rekfan.com mmseg-3.2.14]# make && make install
[root@rekfan.com mmseg-3.2.14]# cd ..

5.安装coreseek
# cd csft-3.2.14 或者 cd csft-4.0.1 或者 cd csft-4.1
[root@rekfan.com coreseek-4.0.1-beta]# cd csft-4.0.1
[root@rekfan.com csft-4.0.1]# sh buildconf.sh #输出的warning信息可以忽略,如果出现error则需要解决
[root@rekfan.com csft-4.0.1]#  ./configure --prefix=/usr/local/coreseek --without-unixodbc --with-mmseg --with-mmseg-includes=/usr/local/mmseg/include/mmseg/ --with-mmseg-libs=/usr/local/mmseg/lib/ --with-mysql ##如果提示mysql问题,可以
查看MySQL数据源安装说明
[root@rekfan.com csft-4.0.1]# make && make install
[root@rekfan.com csft-4.0.1]# cd ..

6.测试mmseg分词,coreseek搜索(需要预先设置好字符集为zh_CN.UTF-8,确保正确显示中文)
[root@rekfan.com coreseek-4.0.1-beta]# cd testpack
[root@rekfan.com testpack]# cat var/test/test.xml    #此时应该正确显示中文
[root@rekfan.com testpack]# /usr/local/mmseg/bin/mmseg -d /usr/local/mmseg/etc var/test/test.xml[root@rekfan.com testpack]#  /usr/local/coreseek/bin/indexer -c etc/csft.conf --all
[root@rekfan.com testpack]#  /usr/local/coreseek/bin/search -c etc/csft.conf 网络搜索
http://blog.rekfan.com/?p=136

7.配置测试,测试是否可以正确运行
[root@rekfan.com testpack]# /usr/local/coreseek/bin/indexer -c /usr/local/coreseek/etc/sphinx-min.conf.dist
##以下为正常测试时的提示信息:
    Coreseek Fulltext 3.2 [ Sphinx 0.9.9-release (r2117)]
    Copyright (c) 2007-2010,
    Beijing Choice Software Technologies Inc (http://www.coreseek.com)

     using config file '/usr/local/coreseek/etc/sphinx-min.conf.dist'...
    total 0 reads, 0.000 sec, 0.0 kb/call avg, 0.0 msec/call avg
    total 0 writes, 0.000 sec, 0.0 kb/call avg, 0.0 msec/call avg
##
##csft-4.0版显示:ERROR: nothing to do.
##
##至此,coreseek基础环境可以正常安装,我们可以开始后续的工作啦。

8.建立索引并开启coreseek中文全文检索服务

[root@rekfan.com coreseek-4.0.1-beta]# cd testpack

8.1建立索引

[root@rekfan.com coreseek-4.0.1-beta]#  /usr/local/coreseek/bin/indexer -c etc/csft_mysql.conf

8.2建立全部索引

[root@rekfan.com coreseek-4.0.1-beta]#  /usr/local/coreseek/bin/indexer -c etc/csft_mysql.conf –all

8.3 启动coreseek服务

[root@rekfan.com coreseek-4.0.1-beta]#  /usr/local/coreseek/bin/searchd -c etc/csft_mysql.conf

如要停止搜索服务,请使用

[root@rekfan.com coreseek-4.0.1-beta]# /usr/local/coreseek/bin/searchd -c etc/csft_mysql.conf –stop

如要已启动服务,要更新索引,请使用

[root@rekfan.com coreseek-4.0.1-beta]# /usr/local/coreseek/bin/indexer -c etc/csft_mysql.conf –all –rotate

9.可能遇到的问题及解决方法:
http://blog.rekfan.com/?p=136
##如果提示libtool: unrecognized option `--tag=CC' ,请查看libtool问题解决方案

##有的系统下可能出现:expected `;' before ‘CSphTokenizer_UTF8SpaceSeg’,
##或者出现:configure: WARNING: unrecognized options: --with-mmseg, --with-mmseg-includes, --with-mmseg-libs
##是因为你没有进行随后的sh buildconf.sh操作
##生成当前系统对应的编译配置文件
##需要使用以下指令:
$ sh buildconf.sh

## Linux环境下,如遇到pthread问题,请先直接执行以下指令在进行configur:
$ LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/lib
$ export LD_LIBRARY_PATH

## 如果出现undefined reference to `libiconv'的类似错误,可以按照如下方法处理:
##方法一:(Linux使用)
## 直接执行:export LIBS="-liconv"
##然后make clean,再次configure后,进行编译安装make && make install
## 方法二:
## 首先configure,然后vim src/makefile
## 在其中搜索lexpat,在其后加上 -liconv
## 修改后该行应该为:-lexpat -liconv -L/usr/local/lib
## 然后再次make && make install
## 方法三:
## 首先configure,然后vim config/config.h
## 在其中搜索USE_LIBICONV,将其后的1修改为0
## 然后再次make && make install
http://blog.rekfan.com/?p=136
官方文档:http://www.coreseek.cn/products-install/install_on_bsd_linux/

这篇关于CentOS6.2 安装Coreseek(Sphinx)详细教程的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/702112

相关文章

Python中win32包的安装及常见用途介绍

《Python中win32包的安装及常见用途介绍》在Windows环境下,PythonWin32模块通常随Python安装包一起安装,:本文主要介绍Python中win32包的安装及常见用途的相关... 目录前言主要组件安装方法常见用途1. 操作Windows注册表2. 操作Windows服务3. 窗口操作

SpringBoot整合liteflow的详细过程

《SpringBoot整合liteflow的详细过程》:本文主要介绍SpringBoot整合liteflow的详细过程,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋...  liteflow 是什么? 能做什么?总之一句话:能帮你规范写代码逻辑 ,编排并解耦业务逻辑,代码

浏览器插件cursor实现自动注册、续杯的详细过程

《浏览器插件cursor实现自动注册、续杯的详细过程》Cursor简易注册助手脚本通过自动化邮箱填写和验证码获取流程,大大简化了Cursor的注册过程,它不仅提高了注册效率,还通过友好的用户界面和详细... 目录前言功能概述使用方法安装脚本使用流程邮箱输入页面验证码页面实战演示技术实现核心功能实现1. 随机

深度解析Spring AOP @Aspect 原理、实战与最佳实践教程

《深度解析SpringAOP@Aspect原理、实战与最佳实践教程》文章系统讲解了SpringAOP核心概念、实现方式及原理,涵盖横切关注点分离、代理机制(JDK/CGLIB)、切入点类型、性能... 目录1. @ASPect 核心概念1.1 AOP 编程范式1.2 @Aspect 关键特性2. 完整代码实

Java Web实现类似Excel表格锁定功能实战教程

《JavaWeb实现类似Excel表格锁定功能实战教程》本文将详细介绍通过创建特定div元素并利用CSS布局和JavaScript事件监听来实现类似Excel的锁定行和列效果的方法,感兴趣的朋友跟随... 目录1. 模拟Excel表格锁定功能2. 创建3个div元素实现表格锁定2.1 div元素布局设计2.

HTML img标签和超链接标签详细介绍

《HTMLimg标签和超链接标签详细介绍》:本文主要介绍了HTML中img标签的使用,包括src属性(指定图片路径)、相对/绝对路径区别、alt替代文本、title提示、宽高控制及边框设置等,详细内容请阅读本文,希望能对你有所帮助... 目录img 标签src 属性alt 属性title 属性width/h

SpringBoot连接Redis集群教程

《SpringBoot连接Redis集群教程》:本文主要介绍SpringBoot连接Redis集群教程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1. 依赖2. 修改配置文件3. 创建RedisClusterConfig4. 测试总结1. 依赖 <de

CSS3打造的现代交互式登录界面详细实现过程

《CSS3打造的现代交互式登录界面详细实现过程》本文介绍CSS3和jQuery在登录界面设计中的应用,涵盖动画、选择器、自定义字体及盒模型技术,提升界面美观与交互性,同时优化性能和可访问性,感兴趣的朋... 目录1. css3用户登录界面设计概述1.1 用户界面设计的重要性1.2 CSS3的新特性与优势1.

CSS中的Static、Relative、Absolute、Fixed、Sticky的应用与详细对比

《CSS中的Static、Relative、Absolute、Fixed、Sticky的应用与详细对比》CSS中的position属性用于控制元素的定位方式,不同的定位方式会影响元素在页面中的布... css 中的 position 属性用于控制元素的定位方式,不同的定位方式会影响元素在页面中的布局和层叠关

gitlab安装及邮箱配置和常用使用方式

《gitlab安装及邮箱配置和常用使用方式》:本文主要介绍gitlab安装及邮箱配置和常用使用方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1.安装GitLab2.配置GitLab邮件服务3.GitLab的账号注册邮箱验证及其分组4.gitlab分支和标签的