在springboot项目中调用通义千问api多轮对话并实现流式输出

本文主要是介绍在springboot项目中调用通义千问api多轮对话并实现流式输出,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

官网文档

阿里灵积提供了详细的官方文档

如何实现多轮对话

官方文档中提到只需要把每轮对话中返回结果添加到消息管理器中,就可以实现多轮对话。本质上就是将历史对话再次发送给接口。

如何实现流式输出

官方文档中提出使用streamCall()方法就可以实现流式输出,在ResultCallback<GenerationResult>参数中可以指点每个事件的处理动作。

流式调用方法没有返回GenerationResult结果类,如何实现多轮对话

方法一

我们每次调用完成后把得到的结果手动构建消息对象并加入消息管理类。

不知道是不是我使用的sdk版本问题(因为老的版本有出现调用okhttp报错的情况,我的在阿里云提交工单后,工作人员给我的最新版本是2.10.1,我当前就在使用这个版本)。经过实际测试,msgManager.get()方法可能会出现第一条对话的发送对象是assistant的情况。

如果第一条对话的发送对象不是user或者system,并且user和assistant没有在历史对话中轮流出现接口会报错的!!!!(我没有报错的截图,哈哈哈哈)

Message assistantMsg = Message.builder().role(Role.ASSISTANT.getValue()).content("如何做西红柿炖牛腩?").build();
msgManager.add(assistantMsg);

方法二

我们自己来控制历史对话

@Component
public class QwenModelService{private Generation gen;@Resourceprivate AiWebsocketService aiWebsocketService;public void createGen(){gen = new Generation();};private static final Logger logger = LoggerFactory.getLogger(QwenModelService.class);/*** prompt 用户对话* request 用户请求对象* identity 用户身份标识*/public String answer(String prompt, HttpServletRequest request, String identity) {// 通过身份标识在缓存中获取对话对象、历史消息对象、参数对象List<AiDialogue> dialogues = CachePool.AI_DIALOGUE_LIST_MAP.get(identity).computeIfAbsent(ConstValuePool.QWEN_DIALOGUES, k -> new LinkedList<>());dialogues.add(AiDialogue.createUserDialogue(prompt));List<Message> msgManager = CachePool.QWEN_MESSAGE_DIALOGUES_MAP.get(identity);QwenParam param = CachePool.QWEN_PARAM_MAP.get(identity);// 如果第一次发送消息需要初始化历史消息对象if (msgManager == null) {msgManager = new ArrayList<>();CachePool.QWEN_MESSAGE_DIALOGUES_MAP.put(identity, msgManager);Message systemMsg = Message.builder().role(Role.SYSTEM.getValue()).content("You are a helpful assistant.").build();msgManager.add(systemMsg);Message userMsg = Message.builder().role(Role.USER.getValue()).content(prompt).build();msgManager.add(userMsg);}else {msgManager.add(Message.builder().role("user").content(prompt).build());param.setMessages(msgManager);}// 如果第一次发送消息需要初始化参数对象if (param == null) {param = QwenParam.builder().model(Generation.Models.QWEN_MAX).messages(msgManager).resultFormat(QwenParam.ResultFormat.MESSAGE).topP(0.8).enableSearch(true).incrementalOutput(true).build();CachePool.QWEN_PARAM_MAP.put(identity, param);}try {logger.debug("发送的请求为{}",param);// 同步信号量Semaphore semaphore = new Semaphore(0);// 结果拼接对象StringBuilder resultBuilder = new StringBuilder();// 流式调用gen.streamCall(param, new ResultCallback<GenerationResult>(){@Overridepublic void onEvent(GenerationResult generationResult) {String newMessage = generationResult.getOutput().getChoices().get(0).getMessage().getContent();StringBuilder finalResBuilder = resultBuilder.append(newMessage);// 这里是对markdown代码块进行判断,如果当前代码块未结束,需要手动结束// 否则前端的代码块显示会出问题// 代码块判断的功能就是对"```"字符串计数,偶数个就是结束了,奇数个就是没结束if (1 == (1 & StringUtil.countSubStr(finalResBuilder,ConstValuePool.MARKDOWN_CODE_BLOCK_START))) {finalResBuilder = new StringBuilder(finalResBuilder).append(ConstValuePool.MARKDOWN_CODE_BLOCK_END);}// 通过websocket返回给前端aiWebsocketService.sendMessage(finalResBuilder.toString(), identity);}// 结束或者报错需要释放同步信号量@Overridepublic void onComplete() {semaphore.release();}@Overridepublic void onError(Exception e) {semaphore.release();logger.error("通义千问运行出错, 报错栈如下");Throwable t = e;while (t != null) {logger.error( t.toString());t = e.getCause();}}});semaphore.acquire();String resString = resultBuilder.toString();// 把返回消息加入历史消息中
msgManager.add(Message.builder().role("assistant").content(resString).build());// 如果历史消息量过大或者第一条消息发送对象不是user,删除历史消息// 下标0是system消息while (msgManager.size() > ConstValuePool.QWEN_MAX_MESSAGE|| !"user".equals(msgManager.get(1).getRole())) {msgManager.remove(1);}// 添加到对话记录中,方便前端查询对话记录dialogues.add(AiDialogue.createAssistantDialogue(resString));return "";} catch (NoApiKeyException e) {logger.error("调用通义千问缺少ApiKey");throw new AiException("没有ApiKey", e);} catch (Exception e) {logger.error("调用通义千问出现问题:{}",e.getMessage());throw new AiException("出现了一些问题", e);}}}

这篇关于在springboot项目中调用通义千问api多轮对话并实现流式输出的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/773895

相关文章

Java实现字节字符转bcd编码

《Java实现字节字符转bcd编码》BCD是一种将十进制数字编码为二进制的表示方式,常用于数字显示和存储,本文将介绍如何在Java中实现字节字符转BCD码的过程,需要的小伙伴可以了解下... 目录前言BCD码是什么Java实现字节转bcd编码方法补充总结前言BCD码(Binary-Coded Decima

SpringBoot全局域名替换的实现

《SpringBoot全局域名替换的实现》本文主要介绍了SpringBoot全局域名替换的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一... 目录 项目结构⚙️ 配置文件application.yml️ 配置类AppProperties.Ja

Java使用Javassist动态生成HelloWorld类

《Java使用Javassist动态生成HelloWorld类》Javassist是一个非常强大的字节码操作和定义库,它允许开发者在运行时创建新的类或者修改现有的类,本文将简单介绍如何使用Javass... 目录1. Javassist简介2. 环境准备3. 动态生成HelloWorld类3.1 创建CtC

JavaScript中的高级调试方法全攻略指南

《JavaScript中的高级调试方法全攻略指南》什么是高级JavaScript调试技巧,它比console.log有何优势,如何使用断点调试定位问题,通过本文,我们将深入解答这些问题,带您从理论到实... 目录观点与案例结合观点1观点2观点3观点4观点5高级调试技巧详解实战案例断点调试:定位变量错误性能分

Python实现批量CSV转Excel的高性能处理方案

《Python实现批量CSV转Excel的高性能处理方案》在日常办公中,我们经常需要将CSV格式的数据转换为Excel文件,本文将介绍一个基于Python的高性能解决方案,感兴趣的小伙伴可以跟随小编一... 目录一、场景需求二、技术方案三、核心代码四、批量处理方案五、性能优化六、使用示例完整代码七、小结一、

Java实现将HTML文件与字符串转换为图片

《Java实现将HTML文件与字符串转换为图片》在Java开发中,我们经常会遇到将HTML内容转换为图片的需求,本文小编就来和大家详细讲讲如何使用FreeSpire.DocforJava库来实现这一功... 目录前言核心实现:html 转图片完整代码场景 1:转换本地 HTML 文件为图片场景 2:转换 H

Java使用jar命令配置服务器端口的完整指南

《Java使用jar命令配置服务器端口的完整指南》本文将详细介绍如何使用java-jar命令启动应用,并重点讲解如何配置服务器端口,同时提供一个实用的Web工具来简化这一过程,希望对大家有所帮助... 目录1. Java Jar文件简介1.1 什么是Jar文件1.2 创建可执行Jar文件2. 使用java

C#使用Spire.Doc for .NET实现HTML转Word的高效方案

《C#使用Spire.Docfor.NET实现HTML转Word的高效方案》在Web开发中,HTML内容的生成与处理是高频需求,然而,当用户需要将HTML页面或动态生成的HTML字符串转换为Wor... 目录引言一、html转Word的典型场景与挑战二、用 Spire.Doc 实现 HTML 转 Word1

C#实现一键批量合并PDF文档

《C#实现一键批量合并PDF文档》这篇文章主要为大家详细介绍了如何使用C#实现一键批量合并PDF文档功能,文中的示例代码简洁易懂,感兴趣的小伙伴可以跟随小编一起学习一下... 目录前言效果展示功能实现1、添加文件2、文件分组(书签)3、定义页码范围4、自定义显示5、定义页面尺寸6、PDF批量合并7、其他方法

PHP应用中处理限流和API节流的最佳实践

《PHP应用中处理限流和API节流的最佳实践》限流和API节流对于确保Web应用程序的可靠性、安全性和可扩展性至关重要,本文将详细介绍PHP应用中处理限流和API节流的最佳实践,下面就来和小编一起学习... 目录限流的重要性在 php 中实施限流的最佳实践使用集中式存储进行状态管理(如 Redis)采用滑动