使用Rasa_core和Rasa_nls框架搭建问答机器人

2024-01-19 14:18

本文主要是介绍使用Rasa_core和Rasa_nls框架搭建问答机器人,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1 前期准备

1.1 采集数据

采集有关南京博物院的有关数据,并进行中文分词(其中还需要用户自定义词典),其主要技术为:python爬虫、 jieba分词
内容如下:

在这里插入图片描述

1.2 构建语料库

根据已经采集好的数据构建语料库,其相关技术:MITIE工具

2 RASA_NLU

NLU模块的任务是:

  • 意图识别 (Intent):在句子级别进行分类,明确意图;
  • 实体识别(Entity):在词级别找出用户问题中的关键实体,进行实体槽填充(Slot Filling)。

2.1 进行rasa_nlu配置

配置文件如下:

language: "zh"pipeline:
- name: "nlp_mitie"model: "data/total_word_feature_extractor.dat"
- name: "tokenizer_jieba"user_dicts: "./user.dict"
- name: "ner_mitie"
- name: "ner_synonyms"
- name: "intent_entity_featurizer_regex"
- name: "intent_featurizer_mitie"
- name: "intent_classifier_sklearn"

2.2 准备训练数据

数据格式如下:
在这里插入图片描述

2.3 训练

代码如下:

  from rasa_nlu.training_data import load_datafrom rasa_nlu.config import RasaNLUModelConfigfrom rasa_nlu.model import Trainerfrom rasa_nlu import configfrom rasa_core.agent import Agentfrom rasa_core.policies.memoization import MemoizationPolicyfrom rasa_core.interpreter import RasaNLUInterpreterfrom rasa_core.policies.keras_policy import KerasPolicyfrom rasa_core.channels.console import ConsoleInputChannel# 训练模型def train():# 示例数据training_data = load_data('data/museum.json')# pipeline配置trainer = Trainer(config.load("sample_configs/museum_config.json"))trainer.train(training_data)model_directory = trainer.persist('./models/demo/')print(model_directory)predict(model_directory) # 识别意图def predict(model_directory):from rasa_nlu.model import Metadata, Interpreterinterpreter = Interpreter.load(model_directory)# 使用加载的interpreter处理文本print (interpreter.parse(u"这里有什么好看的展览"))if __name__=='__main__':train()

2.4测试rasa_nlu

在这里插入图片描述

3 RASA_CORE

3.1 定义domain.yml

格式如下:在这里插入图片描述

3.2 进行在线学习

代码如下:

   from rasa_nlu.training_data import load_datafrom rasa_nlu.config import RasaNLUModelConfigfrom rasa_nlu.model import Trainerfrom rasa_nlu import configfrom rasa_core.agent import Agentfrom rasa_core.policies.memoization import MemoizationPolicyfrom rasa_core.interpreter import RasaNLUInterpreterfrom rasa_core.policies.keras_policy import KerasPolicyfrom rasa_core.channels.console import ConsoleInputChanneldef train_online(input_channel=ConsoleInputChannel(),interpreter=RasaNLUInterpreter("models/demo/default/model_20180701-171646"),domain_file="data/domain.yml",training_data_file="data/museum_story.md"):agent = Agent(domain_file,policies=[MemoizationPolicy(), KerasPolicy()],interpreter=interpreter)agent.train_online(training_data_file,input_channel=input_channel,max_history=2,batch_size=50,epochs=200,max_training_samples=300)if __name__=='__main__':train_online()

训练过程如下:
在这里插入图片描述
最终得到stories.md
格式如下:
在这里插入图片描述

3.3 训练对话

采用LSTM网络训练对话
代码如下:

  from rasa_nlu.training_data import load_datafrom rasa_nlu.config import RasaNLUModelConfigfrom rasa_nlu.model import Trainerfrom rasa_nlu import configfrom rasa_core.agent import Agentfrom rasa_core.policies.memoization import MemoizationPolicyfrom rasa_core.interpreter import RasaNLUInterpreterfrom rasa_core.policies.keras_policy import KerasPolicyfrom rasa_core.channels.console import ConsoleInputChanneldef train_dialogue(domain_file="data/domain.yml",model_path="models/dialogue",training_data_file="stories.md"):agent = Agent(domain_file,policies=[MemoizationPolicy()])agent.train(training_data_file,max_history=3,epochs=100,batch_size=50,augmentation_factor=50,validation_split=0.2)agent.persist(model_path)if __name__=='__main__':train_dialogue()

4 微信展示

4.1 前言

由于域名需要备案(正在审查),所以微信小程序的接口不能申请成功,于是调用了微信的接口实现了对话过程。并且这里的代码将回答直接写进代码只作为测试使用,并没有去数据库查询数据。
代码如下:

  from wxpy import *import requestsbot = Bot(cache_path=True)friend =bot.friends().search('蒋双庆')[0]@bot.register()def reply_msg(msg):url = 'http://127.0.0.1:5005/conversations/default/parse'p = {'query':msg.text}r = requests.get(url, params=p)intent = r.json()['tracker']['latest_message']['intent']['name']if(intent=='greet'):msg.reply("您好!我是您的专属智慧导游“小博”!")elif(intent=='goodbye'):msg.reply('再见!')elif(intent=='person_search'):msg.reply('弗朗特斯克·毕勒克,19世纪末20世纪初捷克新艺术运动的杰出代表。他和其他艺术家一样“还生活于艺术”,又和其他艺术家不一样,用自己的艺术感觉在宗教和神秘中找寻曾经的安全感。')msg.reply_image('images/1.jpg')elif(intent=='exhibition_search'):msg.reply('近期有一场新的展览“毕勒克——捷克新艺术运动大师”,展出毕勒克绘画、雕塑等35件作品,展现了他“还生活于艺术”的创作理念,也表达了对人类命运的反思。')elif(intent=='painting_search'):msg.reply('弗朗特斯克·毕勒克的主要代表作有《主祷文》、《我的太阳》、《手》等等')elif(intent=='painting_description'):msg.reply('《主祷文》是耶稣基督传给门徒的祷告词,是礼拜仪式中通用的祈祷文。毕勒克认为艺术是生活的表现,生活因真理而存在,他的艺术态度即为宗教忏悔。创作这几幅《主祷文》主题的画作时毕勒克28岁,年轻的他在作品中表现出神奇的洞察力,并用奇特的表现手法,展露了与众不同的艺术风格。')msg.reply_image('images/2.jpg')embed()

4.2 对话过程展示

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

这篇关于使用Rasa_core和Rasa_nls框架搭建问答机器人的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!


原文地址:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.chinasem.cn/article/622689

相关文章

Android kotlin中 Channel 和 Flow 的区别和选择使用场景分析

《Androidkotlin中Channel和Flow的区别和选择使用场景分析》Kotlin协程中,Flow是冷数据流,按需触发,适合响应式数据处理;Channel是热数据流,持续发送,支持... 目录一、基本概念界定FlowChannel二、核心特性对比数据生产触发条件生产与消费的关系背压处理机制生命周期

java使用protobuf-maven-plugin的插件编译proto文件详解

《java使用protobuf-maven-plugin的插件编译proto文件详解》:本文主要介绍java使用protobuf-maven-plugin的插件编译proto文件,具有很好的参考价... 目录protobuf文件作为数据传输和存储的协议主要介绍在Java使用maven编译proto文件的插件

SpringBoot线程池配置使用示例详解

《SpringBoot线程池配置使用示例详解》SpringBoot集成@Async注解,支持线程池参数配置(核心数、队列容量、拒绝策略等)及生命周期管理,结合监控与任务装饰器,提升异步处理效率与系统... 目录一、核心特性二、添加依赖三、参数详解四、配置线程池五、应用实践代码说明拒绝策略(Rejected

C++ Log4cpp跨平台日志库的使用小结

《C++Log4cpp跨平台日志库的使用小结》Log4cpp是c++类库,本文详细介绍了C++日志库log4cpp的使用方法,及设置日志输出格式和优先级,具有一定的参考价值,感兴趣的可以了解一下... 目录一、介绍1. log4cpp的日志方式2.设置日志输出的格式3. 设置日志的输出优先级二、Window

Ubuntu如何分配​​未使用的空间

《Ubuntu如何分配​​未使用的空间》Ubuntu磁盘空间不足,实际未分配空间8.2G因LVM卷组名称格式差异(双破折号误写)导致无法扩展,确认正确卷组名后,使用lvextend和resize2fs... 目录1:原因2:操作3:报错5:解决问题:确认卷组名称​6:再次操作7:验证扩展是否成功8:问题已解

Qt使用QSqlDatabase连接MySQL实现增删改查功能

《Qt使用QSqlDatabase连接MySQL实现增删改查功能》这篇文章主要为大家详细介绍了Qt如何使用QSqlDatabase连接MySQL实现增删改查功能,文中的示例代码讲解详细,感兴趣的小伙伴... 目录一、创建数据表二、连接mysql数据库三、封装成一个完整的轻量级 ORM 风格类3.1 表结构

使用Docker构建Python Flask程序的详细教程

《使用Docker构建PythonFlask程序的详细教程》在当今的软件开发领域,容器化技术正变得越来越流行,而Docker无疑是其中的佼佼者,本文我们就来聊聊如何使用Docker构建一个简单的Py... 目录引言一、准备工作二、创建 Flask 应用程序三、创建 dockerfile四、构建 Docker

Python使用vllm处理多模态数据的预处理技巧

《Python使用vllm处理多模态数据的预处理技巧》本文深入探讨了在Python环境下使用vLLM处理多模态数据的预处理技巧,我们将从基础概念出发,详细讲解文本、图像、音频等多模态数据的预处理方法,... 目录1. 背景介绍1.1 目的和范围1.2 预期读者1.3 文档结构概述1.4 术语表1.4.1 核

Python使用pip工具实现包自动更新的多种方法

《Python使用pip工具实现包自动更新的多种方法》本文深入探讨了使用Python的pip工具实现包自动更新的各种方法和技术,我们将从基础概念开始,逐步介绍手动更新方法、自动化脚本编写、结合CI/C... 目录1. 背景介绍1.1 目的和范围1.2 预期读者1.3 文档结构概述1.4 术语表1.4.1 核

Conda与Python venv虚拟环境的区别与使用方法详解

《Conda与Pythonvenv虚拟环境的区别与使用方法详解》随着Python社区的成长,虚拟环境的概念和技术也在不断发展,:本文主要介绍Conda与Pythonvenv虚拟环境的区别与使用... 目录前言一、Conda 与 python venv 的核心区别1. Conda 的特点2. Python v