【Text2SQL 论文】QDecomp:探索 CoT-style 的 prompt 来解决 Text2SQL

2024-06-05 00:36

本文主要是介绍【Text2SQL 论文】QDecomp:探索 CoT-style 的 prompt 来解决 Text2SQL,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

论文:Exploring Chain of Thought Style Prompting for Text-to-SQL

⭐⭐⭐⭐

EMNLP 2023, arXiv:2305.14215

一、论文速读

本文通过对 LLM 使用 CoT-style 的 prompting 方法来解决 Text2SQL 问题,试图回答下面两个问题:

  1. 哪种 prompting style 更好:在一个 pass 中生成所有推理步骤好,还是迭代 prompting 并解决问题好?
  2. 详细的推理步骤对于 Text2SQL 任务来说是否会产生更好的结果?

论文在四种多步推理的 prompting 方法上做了试验,并对比了效果,下面分别介绍。

二、用于 Text2SQL 的多步推理的 prompting 方法

下图是四种 prompting 的示例,输入的是相同的 DB schema 和 question,不同的 prompting 方法有期待的不同的输出:

在这里插入图片描述

2.1 Chain-of-Thought Prompting

CoT 旨在在预测答案之前先生成一系列中间步骤从而提高 LLM 的推理能力,那如何提出这些中间步骤就是一个问题。

本文是使用 SQL query 中的每个 clause 的推理思路组成 CoT prompt 中的推理步骤。下图是一个在 Spider 上 1-shot 的 CoT 示例:

在这里插入图片描述

  • 红色方框的部分是 1-shot 的 demonstration,教会 LLM 来生成思维链的推理步骤
  • 蓝色方框的部分是我们想让 LLM 解决的 question

2.2 Least-to-Most Prompting

CoT 是让 LLM 一次生成所有的推理步骤,而 Least-to-Most Prompting 则是在两个阶段来解决复杂问题:

  • problem reduction 阶段:提示 LLM 从原始复杂 question 中生成一系列 sub-question
  • problem solving 阶段:每次用一个 sub-question 来 prompt LLM,并迭代地建立最终解决方案

最后一个 sub-question 就是原来的 user question。

下图是 problem reduction 阶段的示例:

在这里插入图片描述

下图是 problem solving 阶段的示例:

在这里插入图片描述

2.3 Question Decomposition Prompting(QDecomp)

这里就是本文新提出的 QDecomp prompting 方法,这个方法结合 CoT 和 Least-to-Most 两种方法的特点:像 CoT 那样一次性生成中间推理步骤和最终的 SQL query,但是中间推理步骤不是之前使用 CoT 那样的 SQL 逻辑推理过程,而是遵循 Least-to-Most prompting 的 problem reduction 阶段的思路,指导 LLM 将原始复杂问题分解为推理步骤:

在这里插入图片描述

在 QDecomp 基础上,本文又提出了一个变体 QDecomp + InterCOL,用于缓解 Text2SQL 任务中常见的 Schema Linking 的问题:他扩充了更多的 in-context exemplars,以教会 LLM 在生成每个 sub-questions 时识别出任何相应的 table/column names。

下图是一个示例:

在这里插入图片描述

这里的具体解释可以参考原论文

三、实验

论文使用了 Spider 和 Spider Realistic 两个数据集,ICL 的 exemplars 是采用 random selection 得到的。LLM 使用 Codex。Prompt Format 使用了 API Docs 的格式。

具体实验上,测试了不同的 prompting 方法,顺带还有 standard prompting 方法作为 baseline。

standard prompting 方法指的是使用几个 question-SQL pairs 作为 ICL 的 exemplars 来直接 prompt LLM 得到答案,整个过程不涉及中间推理过程。

实验数据如下:

在这里插入图片描述

得出如下结论:

  • QDecomp 和 QDecomp + InterCOL 方法的表现均超过了 CoT 和 Least-to-Most
  • 对于 Text2SQL 来说,迭代式地解决一系列 sub-questions 可能不是必需的,况且这种方法的成本还很高。
  • CoT prompting 甚至比 standard prompting 效果更差

3.1 误差分析:CoT 效果甚至不如 standard prompting

通过对 error cases 的分析,发现,由于 CoT 会生成详细的推理步骤,而这中间任何一步出错都会导致错误传播,从而导致最后的答案出现错误

而 QDecomp 方法不指示 LLM 生成详细的推理步骤或者中间 SQL query,这样就减少了推理步骤中错误累积的可能性。

3.2 Prompt 的设计

  • ICL Examples 的选择:发现 QDecomp + InterCOL 方法具备不错的鲁棒性
  • ICL Examples 的数量:本文发现当样本数量超过 8 时,带来的增益较小,因此本文使用了 8 个上下文示例
  • ICL Examples 的格式:测试了两种 prompt 格式:API DocsCreate Table + Select 3

四、总结

本文基于 Codex 的 LLM 来探索了 CoT-style 的 prompting 效果,增强了 LLM 对 Text2SQL 解析的推理能力。

论文发现了 CoT 在 Text2SQL 任务中会出现错误传播问题,本文提出的 QDecomp 方法是缓解 LLM 多步骤推理中错误传播问题的尝试之一,之后值得对这个问题进行更深一步的探讨。

这篇关于【Text2SQL 论文】QDecomp:探索 CoT-style 的 prompt 来解决 Text2SQL的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1031575

相关文章

IDEA和GIT关于文件中LF和CRLF问题及解决

《IDEA和GIT关于文件中LF和CRLF问题及解决》文章总结:因IDEA默认使用CRLF换行符导致Shell脚本在Linux运行报错,需在编辑器和Git中统一为LF,通过调整Git的core.aut... 目录问题描述问题思考解决过程总结问题描述项目软件安装shell脚本上git仓库管理,但拉取后,上l

解决docker目录内存不足扩容处理方案

《解决docker目录内存不足扩容处理方案》文章介绍了Docker存储目录迁移方法:因系统盘空间不足,需将Docker数据迁移到更大磁盘(如/home/docker),通过修改daemon.json配... 目录1、查看服务器所有磁盘的使用情况2、查看docker镜像和容器存储目录的空间大小3、停止dock

idea npm install很慢问题及解决(nodejs)

《ideanpminstall很慢问题及解决(nodejs)》npm安装速度慢可通过配置国内镜像源(如淘宝)、清理缓存及切换工具解决,建议设置全局镜像(npmconfigsetregistryht... 目录idea npm install很慢(nodejs)配置国内镜像源清理缓存总结idea npm in

idea突然报错Malformed \uxxxx encoding问题及解决

《idea突然报错Malformeduxxxxencoding问题及解决》Maven项目在切换Git分支时报错,提示project元素为描述符根元素,解决方法:删除Maven仓库中的resolv... 目www.chinasem.cn录问题解决方式总结问题idea 上的 maven China编程项目突然报错,是

在Ubuntu上打不开GitHub的完整解决方法

《在Ubuntu上打不开GitHub的完整解决方法》当你满心欢喜打开Ubuntu准备推送代码时,突然发现终端里的gitpush卡成狗,浏览器里的GitHub页面直接变成Whoathere!警告页面... 目录一、那些年我们遇到的"红色惊叹号"二、三大症状快速诊断症状1:浏览器直接无法访问症状2:终端操作异常

mybatis直接执行完整sql及踩坑解决

《mybatis直接执行完整sql及踩坑解决》MyBatis可通过select标签执行动态SQL,DQL用ListLinkedHashMap接收结果,DML用int处理,注意防御SQL注入,优先使用#... 目录myBATiFBNZQs直接执行完整sql及踩坑select语句采用count、insert、u

MyBatis Plus大数据量查询慢原因分析及解决

《MyBatisPlus大数据量查询慢原因分析及解决》大数据量查询慢常因全表扫描、分页不当、索引缺失、内存占用高及ORM开销,优化措施包括分页查询、流式读取、SQL优化、批处理、多数据源、结果集二次... 目录大数据量查询慢的常见原因优化方案高级方案配置调优监控与诊断总结大数据量查询慢的常见原因MyBAT

MyBatis/MyBatis-Plus同事务循环调用存储过程获取主键重复问题分析及解决

《MyBatis/MyBatis-Plus同事务循环调用存储过程获取主键重复问题分析及解决》MyBatis默认开启一级缓存,同一事务中循环调用查询方法时会重复使用缓存数据,导致获取的序列主键值均为1,... 目录问题原因解决办法如果是存储过程总结问题myBATis有如下代码获取序列作为主键IdMappe

Java中字符编码问题的解决方法详解

《Java中字符编码问题的解决方法详解》在日常Java开发中,字符编码问题是一个非常常见却又特别容易踩坑的地方,这篇文章就带你一步一步看清楚字符编码的来龙去脉,并结合可运行的代码,看看如何在Java项... 目录前言背景:为什么会出现编码问题常见场景分析控制台输出乱码文件读写乱码数据库存取乱码解决方案统一使

C++右移运算符的一个小坑及解决

《C++右移运算符的一个小坑及解决》文章指出右移运算符处理负数时左侧补1导致死循环,与除法行为不同,强调需注意补码机制以正确统计二进制1的个数... 目录我遇到了这么一个www.chinasem.cn函数由此可以看到也很好理解总结我遇到了这么一个函数template<typename T>unsigned