使用Java调用中科院分词NLPIR/ICTCLAS

2024-08-30 02:32

本文主要是介绍使用Java调用中科院分词NLPIR/ICTCLAS,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

官方地址:http://ictclas.nlpir.org/

1.       下载NLPIR/ICTCLAS2015分词(最新版本)地址:http://ictclas.nlpir.org/newsdownloads?DocId=389

2.       下载NLPIR-ICTCLAS2013-Win-32-JNIu0416)地址:http://ictclas.nlpir.org/newsdownloads?DocId=354(我电脑是64win7,用的是32JDK32Eclipse,如果是64JDK要下载64位的)

3.       下载后将两个压缩包解压

4.       创建Java工程

5.       20141230101836_ICTCLAS2015\ICTCLAS2015\bin\ICTCLAS2015中的NLPIR.dll文件复制到Java工程的跟目录

6.       20130416090224_Win-32bit-JNI-lib\Win-32bit-JNI-lib\中的NLPIR_JNI.dll文件复制到Java工程的跟目录

7.       再将20141230101836_ICTCLAS2015\ICTCLAS2015Data文件夹复制到Java工程的跟目录

8.       20130416090224_Win-32bit-JNI-lib\Win-32bit-JNI-lib中的kevin文件夹TestNLPIR.java复制到Java工程src目录下

9.       工程搭建完成,如图

运行TestNLPIR.java,如果按上面的步骤配置可能会报错了,查看日志发现Configure.xml文件没有找到(日志文件在工程的跟目录 yyyyMMdd.log,第一次执行需要按F5才能看见) 

修改TestNLPIR.java代码31行,改成String argu = “”;即可,如果工程是UFT-8编码,需要把所有的GB2312改成UFT-8,否者会乱码 

 

修改后的代码

 

修改后执行程序控制台输出:分词结果为:张华平/nr推出/v的/ude1 NLPIR/x分词/v系统/n,/wd又/d名/qICTCLAS2013/x,/wd新增/v新词/n识别/vn、/wn关键词/n提取/v、/wn微/ag博/ag分词/v功能/n。/wj _

 

但最后一个字符还是乱码了,不知道为什么

 

错误及解决

1.Cannot Open Configure file

../../\Data\Configure.xml

找不到Configure.xml文件,修改TestNLPIR.java31

 

2. Not valid license or your license expired! Please feelfree to contact pipy_zhang@msn.com!

    下载最新的NLPIR/ICTCLAS,用新的Data文件夹覆盖旧的

如下载 20150805111452_20150702124141_ICTCLAS2015 (1).zip 这个,并用里面的Data文件夹替换你原来的。

配置好的工程:http://download.csdn.net/detail/itjavaer/8406103

参考:http://blog.csdn.net/itjavaer/article/details/43267623

http://blog.csdn.net/heyu158/article/details/12680183

这篇关于使用Java调用中科院分词NLPIR/ICTCLAS的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1119546

相关文章

Java实现字节字符转bcd编码

《Java实现字节字符转bcd编码》BCD是一种将十进制数字编码为二进制的表示方式,常用于数字显示和存储,本文将介绍如何在Java中实现字节字符转BCD码的过程,需要的小伙伴可以了解下... 目录前言BCD码是什么Java实现字节转bcd编码方法补充总结前言BCD码(Binary-Coded Decima

SpringBoot全局域名替换的实现

《SpringBoot全局域名替换的实现》本文主要介绍了SpringBoot全局域名替换的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一... 目录 项目结构⚙️ 配置文件application.yml️ 配置类AppProperties.Ja

Java使用Javassist动态生成HelloWorld类

《Java使用Javassist动态生成HelloWorld类》Javassist是一个非常强大的字节码操作和定义库,它允许开发者在运行时创建新的类或者修改现有的类,本文将简单介绍如何使用Javass... 目录1. Javassist简介2. 环境准备3. 动态生成HelloWorld类3.1 创建CtC

JavaScript中的高级调试方法全攻略指南

《JavaScript中的高级调试方法全攻略指南》什么是高级JavaScript调试技巧,它比console.log有何优势,如何使用断点调试定位问题,通过本文,我们将深入解答这些问题,带您从理论到实... 目录观点与案例结合观点1观点2观点3观点4观点5高级调试技巧详解实战案例断点调试:定位变量错误性能分

使用Python批量将.ncm格式的音频文件转换为.mp3格式的实战详解

《使用Python批量将.ncm格式的音频文件转换为.mp3格式的实战详解》本文详细介绍了如何使用Python通过ncmdump工具批量将.ncm音频转换为.mp3的步骤,包括安装、配置ffmpeg环... 目录1. 前言2. 安装 ncmdump3. 实现 .ncm 转 .mp34. 执行过程5. 执行结

Java实现将HTML文件与字符串转换为图片

《Java实现将HTML文件与字符串转换为图片》在Java开发中,我们经常会遇到将HTML内容转换为图片的需求,本文小编就来和大家详细讲讲如何使用FreeSpire.DocforJava库来实现这一功... 目录前言核心实现:html 转图片完整代码场景 1:转换本地 HTML 文件为图片场景 2:转换 H

Java使用jar命令配置服务器端口的完整指南

《Java使用jar命令配置服务器端口的完整指南》本文将详细介绍如何使用java-jar命令启动应用,并重点讲解如何配置服务器端口,同时提供一个实用的Web工具来简化这一过程,希望对大家有所帮助... 目录1. Java Jar文件简介1.1 什么是Jar文件1.2 创建可执行Jar文件2. 使用java

C#使用Spire.Doc for .NET实现HTML转Word的高效方案

《C#使用Spire.Docfor.NET实现HTML转Word的高效方案》在Web开发中,HTML内容的生成与处理是高频需求,然而,当用户需要将HTML页面或动态生成的HTML字符串转换为Wor... 目录引言一、html转Word的典型场景与挑战二、用 Spire.Doc 实现 HTML 转 Word1

SpringBoot实现不同接口指定上传文件大小的具体步骤

《SpringBoot实现不同接口指定上传文件大小的具体步骤》:本文主要介绍在SpringBoot中通过自定义注解、AOP拦截和配置文件实现不同接口上传文件大小限制的方法,强调需设置全局阈值远大于... 目录一  springboot实现不同接口指定文件大小1.1 思路说明1.2 工程启动说明二 具体实施2

Java实现在Word文档中添加文本水印和图片水印的操作指南

《Java实现在Word文档中添加文本水印和图片水印的操作指南》在当今数字时代,文档的自动化处理与安全防护变得尤为重要,无论是为了保护版权、推广品牌,还是为了在文档中加入特定的标识,为Word文档添加... 目录引言Spire.Doc for Java:高效Word文档处理的利器代码实战:使用Java为Wo