【NLP】Stanfordcorenlp和Stanfordnlp的安装和基本使用

2024-02-16 07:48

本文主要是介绍【NLP】Stanfordcorenlp和Stanfordnlp的安装和基本使用,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、stanfordcorenlp安装和使用

1.安装Python包

pip install stanfordcorenlp

2.下载数据文件

https://stanfordnlp.github.io/CoreNLP/index.html#download

 

corenlp

 

下载好后解压,

 

记当前路径为path_or_host

 

另外,将下载的各语种模型文件

也放在解压后的目录path_or_host下

 

3.安装JDK 1.8 和JRE 1.8

Java SE  JDK安装包下载

https://www.oracle.com/java/technologies/javase/javase-jdk8-downloads.html

Win 64位 JDK1.8

jdk-8u251-windows-x64.exe

 

tips:需要先用邮箱注册一个账号才能下载

 

配置环境:

Java环境的配置

https://blog.csdn.net/weixin_43529904/article/details/88370720

https://jingyan.baidu.com/article/08b6a591bdb18314a80922a0.html

 

检查:

cmd中输入java、 javac、 java -version有对应的信息出现

 

 

报错解决:

https://blog.csdn.net/sunflower_sara/article/details/106473753

Javac不是外部命令

https://blog.csdn.net/tg928600774/article/details/80992683

Java1.7和1.8冲突

https://blog.csdn.net/weinichendian/article/details/78559496

4. Ner

https://nlp.stanford.edu/software/CRF-NER.html

下载stanford-ner-4.0.0.zip

解压

 

5. 示例:

python直接调用


from stanfordcorenlp import StanfordCoreNLPnlp = StanfordCoreNLP(r'.\\stanford_nlp\\stanford-corenlp-4.0.0', lang='en')# sentence = '斯坦福大学自然语言处理包StanfordNLP'sentence = "This is a growing trend particularly in the United States. Oftentimes there are great opportunities for glamping just outside national park boundaries. Yellowstone, Zion National Park, and Yosemite are excellent both for their supreme natural beauty as well as their many prime opportunities for some glamping."print(nlp.word_tokenize(sentence))  # 分词print(nlp.pos_tag(sentence))  # 词性标注print(nlp.ner(sentence))  # 实体识别print(nlp.parse(sentence))  # 语法树print(nlp.dependency_parse(sentence))  # 依存句法nlp.close() # Do not forget to close! The backend server will consume a lot memery.

 

如果用端口模式:

(详细可参考:https://blog.csdn.net/qq_35203425/article/details/80451243)

 

cmd中启动端口

java -mx4g -cp "*" edu.stanford.nlp.pipeline.StanfordCoreNLPServer -port 9000 -timeout 15000

 

 

Python脚本中用

nlp = StanfordCoreNLP('http://localhost', port=9000)

替换

nlp = StanfordCoreNLP(r'.\\stanford_nlp\\stanford-corenlp-4.0.0', lang='en')

from stanfordcorenlp import StanfordCoreNLPnlp = StanfordCoreNLP('http://localhost', port=9000)# sentence = '斯坦福大学自然语言处理包StanfordNLP'
sentence = "This is a growing trend particularly in the United States. Oftentimes there are great opportunities for glamping just outside national park boundaries. Yellowstone, Zion National Park, and Yosemite are excellent both for their supreme natural beauty as well as their many prime opportunities for some glamping."print(nlp.word_tokenize(sentence))  # 分词
print(nlp.pos_tag(sentence))  # 词性标注
print(nlp.ner(sentence))  # 实体识别
print(nlp.parse(sentence))  # 语法树
print(nlp.dependency_parse(sentence))  # 依存句法nlp.close() # Do not forget to close! The backend server will consume a lot memery.

 

二、Stanfordnlp安装和使用

 

1. 安装python包

pip install stanfordnlp

 

2. 下载数据文件

python中:

import stanfordnlp

stanfordnlp.download('en')

根据提示输入y即可下载数据

我的下载到了 D:\Users\user\stanfordnlp_resources

大小大概270M

 

3. 安装pytorch

需要依赖pytorch 1.0.0以上版本

打开如下链接选择相应的环境和版本的pytorch

https://pytorch.org/get-started/locally/

https://download.pytorch.org/whl/torch_stable.html

 

 

4. 示例代码:

import stanfordnlp

 

# stanfordnlp.download('en')   # This downloads the English models for the neural pipeline

 

nlp = stanfordnlp.Pipeline() # This sets up a default neural pipeline in English

doc = nlp("Barack Obama was born in Hawaii.  He was elected president in 2008.")

doc.sentences[0].print_dependencies()

 

 

 

参考资料:

https://blog.csdn.net/qq_35203425/article/details/80451243

https://blog.csdn.net/qq_40426415/article/details/80994622

 

其他:

python nltk中使用StanfordNER

https://www.jianshu.com/p/f5c893c89c28

这篇关于【NLP】Stanfordcorenlp和Stanfordnlp的安装和基本使用的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/713945

相关文章

gitlab安装及邮箱配置和常用使用方式

《gitlab安装及邮箱配置和常用使用方式》:本文主要介绍gitlab安装及邮箱配置和常用使用方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1.安装GitLab2.配置GitLab邮件服务3.GitLab的账号注册邮箱验证及其分组4.gitlab分支和标签的

SpringBoot3应用中集成和使用Spring Retry的实践记录

《SpringBoot3应用中集成和使用SpringRetry的实践记录》SpringRetry为SpringBoot3提供重试机制,支持注解和编程式两种方式,可配置重试策略与监听器,适用于临时性故... 目录1. 简介2. 环境准备3. 使用方式3.1 注解方式 基础使用自定义重试策略失败恢复机制注意事项

MySQL MCP 服务器安装配置最佳实践

《MySQLMCP服务器安装配置最佳实践》本文介绍MySQLMCP服务器的安装配置方法,本文结合实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下... 目录mysql MCP 服务器安装配置指南简介功能特点安装方法数据库配置使用MCP Inspector进行调试开发指

nginx启动命令和默认配置文件的使用

《nginx启动命令和默认配置文件的使用》:本文主要介绍nginx启动命令和默认配置文件的使用,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录常见命令nginx.conf配置文件location匹配规则图片服务器总结常见命令# 默认配置文件启动./nginx

在Windows上使用qemu安装ubuntu24.04服务器的详细指南

《在Windows上使用qemu安装ubuntu24.04服务器的详细指南》本文介绍了在Windows上使用QEMU安装Ubuntu24.04的全流程:安装QEMU、准备ISO镜像、创建虚拟磁盘、配置... 目录1. 安装QEMU环境2. 准备Ubuntu 24.04镜像3. 启动QEMU安装Ubuntu4

mysql中insert into的基本用法和一些示例

《mysql中insertinto的基本用法和一些示例》INSERTINTO用于向MySQL表插入新行,支持单行/多行及部分列插入,下面给大家介绍mysql中insertinto的基本用法和一些示例... 目录基本语法插入单行数据插入多行数据插入部分列的数据插入默认值注意事项在mysql中,INSERT I

使用Python和OpenCV库实现实时颜色识别系统

《使用Python和OpenCV库实现实时颜色识别系统》:本文主要介绍使用Python和OpenCV库实现的实时颜色识别系统,这个系统能够通过摄像头捕捉视频流,并在视频中指定区域内识别主要颜色(红... 目录一、引言二、系统概述三、代码解析1. 导入库2. 颜色识别函数3. 主程序循环四、HSV色彩空间详解

Windows下C++使用SQLitede的操作过程

《Windows下C++使用SQLitede的操作过程》本文介绍了Windows下C++使用SQLite的安装配置、CppSQLite库封装优势、核心功能(如数据库连接、事务管理)、跨平台支持及性能优... 目录Windows下C++使用SQLite1、安装2、代码示例CppSQLite:C++轻松操作SQ

Python常用命令提示符使用方法详解

《Python常用命令提示符使用方法详解》在学习python的过程中,我们需要用到命令提示符(CMD)进行环境的配置,:本文主要介绍Python常用命令提示符使用方法的相关资料,文中通过代码介绍的... 目录一、python环境基础命令【Windows】1、检查Python是否安装2、 查看Python的安

Python UV安装、升级、卸载详细步骤记录

《PythonUV安装、升级、卸载详细步骤记录》:本文主要介绍PythonUV安装、升级、卸载的详细步骤,uv是Astral推出的下一代Python包与项目管理器,主打单一可执行文件、极致性能... 目录安装检查升级设置自动补全卸载UV 命令总结 官方文档详见:https://docs.astral.sh/