Google机器人团队获ICRA 2023 机器人学习方向最佳论文奖:机器人实体控制的大语言模型程序

本文主要是介绍Google机器人团队获ICRA 2023 机器人学习方向最佳论文奖:机器人实体控制的大语言模型程序,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

这篇论文主要讨论了大型语言模型(LLM)在机器人控制方面的应用。作者们指出,尽管LLM在理解和生成自然语言方面表现出色,但其在实际应用中,如机器人控制等领域的应用仍然有限。因此,他们提出了一种新的方法,即使用LLM编写代码来控制机器人的行为。
在这里插入图片描述

他们发现,编写代码的LLM在规划、策略逻辑和控制方面表现出色。这些模型可以被重新用于编写机器人策略代码,给出自然语言命令(格式化为注释)。策略代码可以表达处理感知输出(例如,开放词汇对象检测器)和参数化控制原语API的函数或反馈循环。当提供了几个示例语言命令和相应的策略代码(通过少量提示),LLM可以接收新的命令并自主重新组合API调用以生成新的策略代码。此外,编写代码的模型可以表达各种算术运算以及基于语言的反馈循环。他们不仅可以推广到新的指令,而且由于在数十亿行代码和注释上进行了训练,也可以根据上下文为模糊的描述(例如,“更快”和“向左”)规定精确的值,以引出行为常识。

方法部分,作者们详细介绍了如何使用大型语言模型(LLM)生成代码作为策略。他们的方法主要包括以下几个步骤:

1.定义语言模型程序(LMP):作者们首先定义了语言模型程序(LMP)的概念。LMP是由语言模型生成并在系统上执行的任何程序。他们的工作主要研究了一类名为“代码作为策略”的LMP,这类LMP将语言指令映射到代码片段,这些代码片段可以(i)响应感知输入(即来自传感器或传感器上层的模块),(ii)参数化控制原语API,并(iii)直接在机器人上编译和执行。

2.生成LMP:作者们展示了如何使用LLM生成LMP。他们提供了一些示例,如何将自然语言指令(格式化为注释)转化为代码。例如,他们展示了如何使用LLM编写代码来控制机器人的行为,如移动物体,识别物体,以及执行更复杂的任务。

3.执行LMP:为了执行LMP,他们首先检查它是否安全运行,确保没有导入语句,没有以__开头的特殊变量,也没有对exec和eval的调用。然后,他们使用Python的exec函数,将代码作为输入字符串,并使用两个字典形成该代码执行的范围:(i)全局变量,包含生成的代码可能调用的所有API,和(ii)局部变量,一个将在exec期间定义的变量和新函数填充的空字典。如果LMP预计会返回一个值,他们会在exec完成后从局部变量中获取它。

4.提示生成LMP:生成LMP的提示包含两个元素:(i)提示,例如导入语句,告诉LLM哪些API可用以及如何使用这些API;(ii)示例,这些是指令到代码对,展示了如何将自然语言指令转化为代码。这些可能包括执行算术运算,调用其他API,以及编程语言的其他特性。

5.高级LMP:作者们还展示了如何使用LLM生成更复杂的代码,如使用控制流(如if-else和循环语句)和嵌套函数调用。他们还展示了如何使用LLM生成函数以供未来使用,以及如何使用LLM遵循良好的抽象实践,避免将所有代码逻辑“扁平化”。

在这篇论文的实验部分,作者们展示了如何使用大型语言模型(LLM)编写代码来控制机器人的行为。他们提供了一些示例,包括如何使用LLM编写Python脚本,如何使用第三方库进行复杂操作,以及如何使用第一方库进行操作。他们还展示了如何使用LLM编写更复杂的代码,如使用控制流(如if-else和循环语句)和嵌套函数调用。

在这里插入图片描述

在实验中,他们使用了一些具体的任务来展示他们的方法的效果。例如,他们展示了如何使用LLM编写代码来移动物体,如何识别物体,以及如何执行更复杂的任务。他们还展示了如何使用LLM生成函数以供未来使用,以及如何使用LLM遵循良好的抽象实践,避免将所有代码逻辑“扁平化”。

以下是一些具体的实验示例:

1.他们展示了如何使用LLM编写代码来移动物体。例如,他们展示了如何使用LLM编写代码来移动一个名为“红色块”的物体。他们首先获取该物体的位置,然后将其向右移动一定的距离。

2.他们展示了如何使用LLM编写代码来识别物体。例如,他们展示了如何使用LLM编写代码来识别一个名为“蓝色块”的物体。他们使用了一个开放词汇的物体检测器来完成这个任务。

3.他们展示了如何使用LLM编写代码来执行更复杂的任务。例如,他们展示了如何使用LLM编写代码来将一个名为“蓝色块”的物体放在一个名为“蓝色碗”的物体上。

4.他们展示了如何使用LLM生成函数以供未来使用。例如,他们展示了如何使用LLM编写代码来定义一个名为“get_total”的函数,该函数接受一个名为“xs”的参数,并返回其总和。

5.他们展示了如何使用LLM遵循良好的抽象实践,避免将所有代码逻辑“扁平化”。例如,他们展示了如何使用LLM编写代码来定义一个名为“get_objs_bigger_than_area_th”的函数,该函数接受两个参数——一个名为“obj_names”的物体名列表和一个名为“bbox_area_th”的阈值,然后返回所有大于该阈值的物体的名字。

这些实验结果表明,LLM可以有效地用于编写控制机器人行为的代码,具有很高的实用性和广泛的应用前景。
在这里插入图片描述

最后作者们总结了他们的研究成果,并对未来的研究方向进行了展望。他们认为,大型语言模型(LLM)在编写代码方面的能力为机器人控制提供了新的可能性。通过使用LLM,我们可以将自然语言指令转化为机器人策略代码,从而实现更复杂的机器人行为。此外,他们还指出,LLM不仅可以理解和生成自然语言,还可以通过使用"say(text)"作为一个可用的动作原语API,参与人机对话和问答。他们的研究结果表明,LLM可以有效地编写Python程序,并能够处理各种复杂的任务,如移动物体,识别物体,以及执行更复杂的任务。他们的方法不仅可以广泛应用于机器人控制,还可以用于其他需要编写代码的领域。

这篇关于Google机器人团队获ICRA 2023 机器人学习方向最佳论文奖:机器人实体控制的大语言模型程序的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/555823

相关文章

Spring Boot集成/输出/日志级别控制/持久化开发实践

《SpringBoot集成/输出/日志级别控制/持久化开发实践》SpringBoot默认集成Logback,支持灵活日志级别配置(INFO/DEBUG等),输出包含时间戳、级别、类名等信息,并可通过... 目录一、日志概述1.1、Spring Boot日志简介1.2、日志框架与默认配置1.3、日志的核心作用

C语言中%zu的用法解读

《C语言中%zu的用法解读》size_t是无符号整数类型,用于表示对象大小或内存操作结果,%zu是C99标准中专为size_t设计的printf占位符,避免因类型不匹配导致错误,使用%u或%d可能引发... 目录size_t 类型与 %zu 占位符%zu 的用途替代占位符的风险兼容性说明其他相关占位符验证示

C语言进阶(预处理命令详解)

《C语言进阶(预处理命令详解)》文章讲解了宏定义规范、头文件包含方式及条件编译应用,强调带参宏需加括号避免计算错误,头文件应声明函数原型以便主函数调用,条件编译通过宏定义控制代码编译,适用于测试与模块... 目录1.宏定义1.1不带参宏1.2带参宏2.头文件的包含2.1头文件中的内容2.2工程结构3.条件编

MyBatis-Plus 自动赋值实体字段最佳实践指南

《MyBatis-Plus自动赋值实体字段最佳实践指南》MyBatis-Plus通过@TableField注解与填充策略,实现时间戳、用户信息、逻辑删除等字段的自动填充,减少手动赋值,提升开发效率与... 目录1. MyBATis-Plus 自动赋值概述1.1 适用场景1.2 自动填充的原理1.3 填充策略

Go语言并发之通知退出机制的实现

《Go语言并发之通知退出机制的实现》本文主要介绍了Go语言并发之通知退出机制的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧... 目录1、通知退出机制1.1 进程/main函数退出1.2 通过channel退出1.3 通过cont

Go语言编译环境设置教程

《Go语言编译环境设置教程》Go语言支持高并发(goroutine)、自动垃圾回收,编译为跨平台二进制文件,云原生兼容且社区活跃,开发便捷,内置测试与vet工具辅助检测错误,依赖模块化管理,提升开发效... 目录Go语言优势下载 Go  配置编译环境配置 GOPROXYIDE 设置(VS Code)一些基本

Olingo分析和实践之EDM 辅助序列化器详解(最佳实践)

《Olingo分析和实践之EDM辅助序列化器详解(最佳实践)》EDM辅助序列化器是ApacheOlingoOData框架中无需完整EDM模型的智能序列化工具,通过运行时类型推断实现灵活数据转换,适用... 目录概念与定义什么是 EDM 辅助序列化器?核心概念设计目标核心特点1. EDM 信息可选2. 智能类

Zabbix在MySQL性能监控方面的运用及最佳实践记录

《Zabbix在MySQL性能监控方面的运用及最佳实践记录》Zabbix通过自定义脚本和内置模板监控MySQL核心指标(连接、查询、资源、复制),支持自动发现多实例及告警通知,结合可视化仪表盘,可有效... 目录一、核心监控指标及配置1. 关键监控指标示例2. 配置方法二、自动发现与多实例管理1. 实践步骤

MySQL 迁移至 Doris 最佳实践方案(最新整理)

《MySQL迁移至Doris最佳实践方案(最新整理)》本文将深入剖析三种经过实践验证的MySQL迁移至Doris的最佳方案,涵盖全量迁移、增量同步、混合迁移以及基于CDC(ChangeData... 目录一、China编程JDBC Catalog 联邦查询方案(适合跨库实时查询)1. 方案概述2. 环境要求3.

全面掌握 SQL 中的 DATEDIFF函数及用法最佳实践

《全面掌握SQL中的DATEDIFF函数及用法最佳实践》本文解析DATEDIFF在不同数据库中的差异,强调其边界计算原理,探讨应用场景及陷阱,推荐根据需求选择TIMESTAMPDIFF或inte... 目录1. 核心概念:DATEDIFF 究竟在计算什么?2. 主流数据库中的 DATEDIFF 实现2.1