深度强化学习大牛、UC伯克利教授Pieter Abbeel获2021 ACM计算奖

本文主要是介绍深度强化学习大牛、UC伯克利教授Pieter Abbeel获2021 ACM计算奖,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

来源:机器之心

AI 大牛吴恩达的学生、机器人学习专家、UC 伯克利教授 Pieter Abbeel 摘得了最新一届 ACM 计算奖的荣誉。

ACM 官方宣布将 2021 ACM 计算奖(ACM Prize in Computing)授予加州大学伯克利分校教授 Pieter Abbeel,以表彰他在机器人学习方面的贡献,包括从演示中学习和用于机器人控制的深度强化学习。

a34ab5ae8fb202237c07ccb99e08f993.png

在获奖公告中,ACM 提到:「Abbeel 率先教会机器人从人类演示中学习(学徒学习)和通过自己的反复试错学习(强化学习),这为下一代机器人技术奠定了基础。」

ACM 计算奖设立于 2007 年,由 IT 巨头 Infosys 赞助,奖金为 25 万美元,旨在表彰在职业生涯早期到中期在计算领域做出基本创新贡献的研究者,这些贡献通过其深度和广泛的影响体现了该学科的最高成就。

过往获奖者包括谷歌 AI 负责人 Jeff Dean、AlphaGo 之父 David Silver、量子计算先驱 Scott Aaronson 等著名计算机科学家。

Abbeel 将于今年 6 月 11 日在旧金山举行的 ACM 年度颁奖晚宴上正式获颁 ACM 计算奖。

伯克利大牛 Pieter Abbeel 的研究贡献

3bbda3659c299f96680bc9b9e33ee073.png

Pieter Abbeel 现为加州大学伯克利分校计算机科学与电气工程教授,也是人工智能机器人公司 Covariant 的联合创始人、总裁兼首席科学家。Abbeel 在比利时鲁汶大学获得电气工程学士学位,并在斯坦福大学获得计算机科学硕士和博士学位(师从吴恩达)。

f9588f2b7afda39e15bd895bc6720b10.png

Abbeel 曾获得多项荣誉,包括美国科学家及工程师总统早期职业奖、美国国家科学基金会早期职业发展计划奖和 Diane McEntyre 卓越教学奖。此外,Abbeel 还被 MIT Technology Review 评为 35 岁以下杰出青年创新者,并获得了机器人与自动化领域的 Dick Volz 最佳美国博士论文奖。同时,Abbeel 也是 IEEE Fellow。

在职业生涯的早期,Abbeel 开发了新的学习技术,以显著改善机器人操作。随着该领域的成熟,研究人员能够对机器人进行编程,以使其感知、操纵木块或勺子等刚性物体。然而,通过编程让机器人操纵可变形物体(例如布)相对来说较为困难,因为软性材料在被触摸时的移动方式是不可预测的。Abbeel 引入了增强机器人视觉感知、基于物理的跟踪、控制和从演示中学习的新方法。通过结合这些新方法,Abbeel 开发了一种能够折叠毛巾和衬衫等衣服的机器人,这在当时被认为是一个重要的里程碑。

cb992947dc1d0ff3e3508f56ec9e9b32.gif

Abbeel 的贡献还包括开发能进行手术缝合、物体检测以及在不确定环境下规划轨迹的机器人。最近,他开创了「少样本‍模仿学习」,即先让机器人接受大量相关任务演示的预训练,然后使其仅通过一次演示就学会执行一项任务。

Abbeel 做出重要贡献的另一个方向是机器人深度强化学习。强化学习是机器学习的一个领域,在该领域中,智能体在奖励的驱动下不断前进(比如赢得一场比赛)。虽然早期的强化学习程序非常有效,但它们只能执行简单的任务。将强化学习与深度神经网络相结合的创新之举催生了深度强化学习这一新领域。与仅使用强化学习开发的程序相比,它可以解决复杂得多的问题。

Abbeel 在该领域的突破性贡献是开发了一种名为「信赖域策略优化(Trust Region Policy Optimization)」的深度强化学习方法。这种方法稳定了强化学习过程,使机器人能够学习一系列模拟的控制技能。通过分享研究结果、发布视频教程以及发布开源代码,Abbeel 帮助建立了一个研究社区,进一步推动了用于机器人的深度学习研究,可以让机器人执行更复杂的任务。

Abbeel 还做出了其他几项开创性的贡献,包括:

  • generalized advantage estimation,这使得第一个 3D 机器人运动学习成为可能;

  • soft-actor critic,这是迄今为止最流行的深度强化学习算法之一;

  • domain randomization,它展示了在适当随机化的模拟器中进行的学习如何能够很好地泛化到现实世界;

  • hindsight experience replay,这对奖励稀疏 / 目标导向的环境中的深度强化学习很有帮助。

a604ef0ae979b27f787208dd8758fa0a.png

ACM 主席 Gabriele Kotsis 表示:「教机器人学习可以推动许多行业的重大进步,包括手术、制造、航运、自动驾驶等。Pieter Abbeel 是新一代研究人员中公认的引领者,他们正在利用最新的机器学习技术彻底改变这一领域。Abbeel 做出了跨越式的研究贡献,同时还慷慨地分享了他的知识,建立了一个同行社区,致力于将机器人提升到令人兴奋的新能力水平。他的工作体现了 ACM 计算奖旨在表彰具有『深度、影响力和广泛影响』的杰出工作的初衷。」

Infosys 首席执行官 Salil Parekh 表示:「很荣幸能表彰 Pieter Abbeel 获得 2021 年 ACM 计算奖,随着机器人与人工智能相结合的创新方式不断涌现,机器人领域有望取得更大的进步,我们相信像 Abbeel 这样的研究人员将有助于该领域取得下一个重大进展。」

获奖后,Pieter Abbeel 在社交媒体上表示:「我感到无比荣幸。非常感谢所有让这一切成为可能的合作者,感谢我的学生、同事、硕士及博士阶段的导师。」

b313aff34a89d27eaa764357be7a912d.png

欢迎大家加入DLer-CVPR2022论文分享交流群!

大家好,这是CVPR2022论文分享群里,群里会第一时间发布CVPR2022的论文解读和交流分享会,主要设计方向有:图像分类、Transformer、目标检测、目标跟踪、点云与语义分割、GAN、超分辨率、人脸检测与识别、动作行为与时空运动、模型压缩和量化剪枝、迁移学习、人体姿态估计等内容。

进群请备注:研究方向+学校/公司+昵称(如图像分类+上交+小明)

c4fb6ff96240684ff71a73a0af2d703d.png

👆 长按识别,邀请您进群!

这篇关于深度强化学习大牛、UC伯克利教授Pieter Abbeel获2021 ACM计算奖的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/156349

相关文章

深度解析Java DTO(最新推荐)

《深度解析JavaDTO(最新推荐)》DTO(DataTransferObject)是一种用于在不同层(如Controller层、Service层)之间传输数据的对象设计模式,其核心目的是封装数据,... 目录一、什么是DTO?DTO的核心特点:二、为什么需要DTO?(对比Entity)三、实际应用场景解析

深度解析Java项目中包和包之间的联系

《深度解析Java项目中包和包之间的联系》文章浏览阅读850次,点赞13次,收藏8次。本文详细介绍了Java分层架构中的几个关键包:DTO、Controller、Service和Mapper。_jav... 目录前言一、各大包1.DTO1.1、DTO的核心用途1.2. DTO与实体类(Entity)的区别1

深度解析Python装饰器常见用法与进阶技巧

《深度解析Python装饰器常见用法与进阶技巧》Python装饰器(Decorator)是提升代码可读性与复用性的强大工具,本文将深入解析Python装饰器的原理,常见用法,进阶技巧与最佳实践,希望可... 目录装饰器的基本原理函数装饰器的常见用法带参数的装饰器类装饰器与方法装饰器装饰器的嵌套与组合进阶技巧

深度解析Spring Boot拦截器Interceptor与过滤器Filter的区别与实战指南

《深度解析SpringBoot拦截器Interceptor与过滤器Filter的区别与实战指南》本文深度解析SpringBoot中拦截器与过滤器的区别,涵盖执行顺序、依赖关系、异常处理等核心差异,并... 目录Spring Boot拦截器(Interceptor)与过滤器(Filter)深度解析:区别、实现

深度解析Spring AOP @Aspect 原理、实战与最佳实践教程

《深度解析SpringAOP@Aspect原理、实战与最佳实践教程》文章系统讲解了SpringAOP核心概念、实现方式及原理,涵盖横切关注点分离、代理机制(JDK/CGLIB)、切入点类型、性能... 目录1. @ASPect 核心概念1.1 AOP 编程范式1.2 @Aspect 关键特性2. 完整代码实

SpringBoot开发中十大常见陷阱深度解析与避坑指南

《SpringBoot开发中十大常见陷阱深度解析与避坑指南》在SpringBoot的开发过程中,即使是经验丰富的开发者也难免会遇到各种棘手的问题,本文将针对SpringBoot开发中十大常见的“坑... 目录引言一、配置总出错?是不是同时用了.properties和.yml?二、换个位置配置就失效?搞清楚加

Python并行处理实战之如何使用ProcessPoolExecutor加速计算

《Python并行处理实战之如何使用ProcessPoolExecutor加速计算》Python提供了多种并行处理的方式,其中concurrent.futures模块的ProcessPoolExecu... 目录简介完整代码示例代码解释1. 导入必要的模块2. 定义处理函数3. 主函数4. 生成数字列表5.

Go学习记录之runtime包深入解析

《Go学习记录之runtime包深入解析》Go语言runtime包管理运行时环境,涵盖goroutine调度、内存分配、垃圾回收、类型信息等核心功能,:本文主要介绍Go学习记录之runtime包的... 目录前言:一、runtime包内容学习1、作用:① Goroutine和并发控制:② 垃圾回收:③ 栈和

Python中文件读取操作漏洞深度解析与防护指南

《Python中文件读取操作漏洞深度解析与防护指南》在Web应用开发中,文件操作是最基础也最危险的功能之一,这篇文章将全面剖析Python环境中常见的文件读取漏洞类型,成因及防护方案,感兴趣的小伙伴可... 目录引言一、静态资源处理中的路径穿越漏洞1.1 典型漏洞场景1.2 os.path.join()的陷

Android学习总结之Java和kotlin区别超详细分析

《Android学习总结之Java和kotlin区别超详细分析》Java和Kotlin都是用于Android开发的编程语言,它们各自具有独特的特点和优势,:本文主要介绍Android学习总结之Ja... 目录一、空安全机制真题 1:Kotlin 如何解决 Java 的 NullPointerExceptio