深度强化学习大牛、UC伯克利教授Pieter Abbeel获2021 ACM计算奖

本文主要是介绍深度强化学习大牛、UC伯克利教授Pieter Abbeel获2021 ACM计算奖,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

来源:机器之心

AI 大牛吴恩达的学生、机器人学习专家、UC 伯克利教授 Pieter Abbeel 摘得了最新一届 ACM 计算奖的荣誉。

ACM 官方宣布将 2021 ACM 计算奖(ACM Prize in Computing)授予加州大学伯克利分校教授 Pieter Abbeel,以表彰他在机器人学习方面的贡献,包括从演示中学习和用于机器人控制的深度强化学习。

a34ab5ae8fb202237c07ccb99e08f993.png

在获奖公告中,ACM 提到:「Abbeel 率先教会机器人从人类演示中学习(学徒学习)和通过自己的反复试错学习(强化学习),这为下一代机器人技术奠定了基础。」

ACM 计算奖设立于 2007 年,由 IT 巨头 Infosys 赞助,奖金为 25 万美元,旨在表彰在职业生涯早期到中期在计算领域做出基本创新贡献的研究者,这些贡献通过其深度和广泛的影响体现了该学科的最高成就。

过往获奖者包括谷歌 AI 负责人 Jeff Dean、AlphaGo 之父 David Silver、量子计算先驱 Scott Aaronson 等著名计算机科学家。

Abbeel 将于今年 6 月 11 日在旧金山举行的 ACM 年度颁奖晚宴上正式获颁 ACM 计算奖。

伯克利大牛 Pieter Abbeel 的研究贡献

3bbda3659c299f96680bc9b9e33ee073.png

Pieter Abbeel 现为加州大学伯克利分校计算机科学与电气工程教授,也是人工智能机器人公司 Covariant 的联合创始人、总裁兼首席科学家。Abbeel 在比利时鲁汶大学获得电气工程学士学位,并在斯坦福大学获得计算机科学硕士和博士学位(师从吴恩达)。

f9588f2b7afda39e15bd895bc6720b10.png

Abbeel 曾获得多项荣誉,包括美国科学家及工程师总统早期职业奖、美国国家科学基金会早期职业发展计划奖和 Diane McEntyre 卓越教学奖。此外,Abbeel 还被 MIT Technology Review 评为 35 岁以下杰出青年创新者,并获得了机器人与自动化领域的 Dick Volz 最佳美国博士论文奖。同时,Abbeel 也是 IEEE Fellow。

在职业生涯的早期,Abbeel 开发了新的学习技术,以显著改善机器人操作。随着该领域的成熟,研究人员能够对机器人进行编程,以使其感知、操纵木块或勺子等刚性物体。然而,通过编程让机器人操纵可变形物体(例如布)相对来说较为困难,因为软性材料在被触摸时的移动方式是不可预测的。Abbeel 引入了增强机器人视觉感知、基于物理的跟踪、控制和从演示中学习的新方法。通过结合这些新方法,Abbeel 开发了一种能够折叠毛巾和衬衫等衣服的机器人,这在当时被认为是一个重要的里程碑。

cb992947dc1d0ff3e3508f56ec9e9b32.gif

Abbeel 的贡献还包括开发能进行手术缝合、物体检测以及在不确定环境下规划轨迹的机器人。最近,他开创了「少样本‍模仿学习」,即先让机器人接受大量相关任务演示的预训练,然后使其仅通过一次演示就学会执行一项任务。

Abbeel 做出重要贡献的另一个方向是机器人深度强化学习。强化学习是机器学习的一个领域,在该领域中,智能体在奖励的驱动下不断前进(比如赢得一场比赛)。虽然早期的强化学习程序非常有效,但它们只能执行简单的任务。将强化学习与深度神经网络相结合的创新之举催生了深度强化学习这一新领域。与仅使用强化学习开发的程序相比,它可以解决复杂得多的问题。

Abbeel 在该领域的突破性贡献是开发了一种名为「信赖域策略优化(Trust Region Policy Optimization)」的深度强化学习方法。这种方法稳定了强化学习过程,使机器人能够学习一系列模拟的控制技能。通过分享研究结果、发布视频教程以及发布开源代码,Abbeel 帮助建立了一个研究社区,进一步推动了用于机器人的深度学习研究,可以让机器人执行更复杂的任务。

Abbeel 还做出了其他几项开创性的贡献,包括:

  • generalized advantage estimation,这使得第一个 3D 机器人运动学习成为可能;

  • soft-actor critic,这是迄今为止最流行的深度强化学习算法之一;

  • domain randomization,它展示了在适当随机化的模拟器中进行的学习如何能够很好地泛化到现实世界;

  • hindsight experience replay,这对奖励稀疏 / 目标导向的环境中的深度强化学习很有帮助。

a604ef0ae979b27f787208dd8758fa0a.png

ACM 主席 Gabriele Kotsis 表示:「教机器人学习可以推动许多行业的重大进步,包括手术、制造、航运、自动驾驶等。Pieter Abbeel 是新一代研究人员中公认的引领者,他们正在利用最新的机器学习技术彻底改变这一领域。Abbeel 做出了跨越式的研究贡献,同时还慷慨地分享了他的知识,建立了一个同行社区,致力于将机器人提升到令人兴奋的新能力水平。他的工作体现了 ACM 计算奖旨在表彰具有『深度、影响力和广泛影响』的杰出工作的初衷。」

Infosys 首席执行官 Salil Parekh 表示:「很荣幸能表彰 Pieter Abbeel 获得 2021 年 ACM 计算奖,随着机器人与人工智能相结合的创新方式不断涌现,机器人领域有望取得更大的进步,我们相信像 Abbeel 这样的研究人员将有助于该领域取得下一个重大进展。」

获奖后,Pieter Abbeel 在社交媒体上表示:「我感到无比荣幸。非常感谢所有让这一切成为可能的合作者,感谢我的学生、同事、硕士及博士阶段的导师。」

b313aff34a89d27eaa764357be7a912d.png

欢迎大家加入DLer-CVPR2022论文分享交流群!

大家好,这是CVPR2022论文分享群里,群里会第一时间发布CVPR2022的论文解读和交流分享会,主要设计方向有:图像分类、Transformer、目标检测、目标跟踪、点云与语义分割、GAN、超分辨率、人脸检测与识别、动作行为与时空运动、模型压缩和量化剪枝、迁移学习、人体姿态估计等内容。

进群请备注:研究方向+学校/公司+昵称(如图像分类+上交+小明)

c4fb6ff96240684ff71a73a0af2d703d.png

👆 长按识别,邀请您进群!

这篇关于深度强化学习大牛、UC伯克利教授Pieter Abbeel获2021 ACM计算奖的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/156349

相关文章

Python实现精确小数计算的完全指南

《Python实现精确小数计算的完全指南》在金融计算、科学实验和工程领域,浮点数精度问题一直是开发者面临的重大挑战,本文将深入解析Python精确小数计算技术体系,感兴趣的小伙伴可以了解一下... 目录引言:小数精度问题的核心挑战一、浮点数精度问题分析1.1 浮点数精度陷阱1.2 浮点数误差来源二、基础解决

深度解析Python中递归下降解析器的原理与实现

《深度解析Python中递归下降解析器的原理与实现》在编译器设计、配置文件处理和数据转换领域,递归下降解析器是最常用且最直观的解析技术,本文将详细介绍递归下降解析器的原理与实现,感兴趣的小伙伴可以跟随... 目录引言:解析器的核心价值一、递归下降解析器基础1.1 核心概念解析1.2 基本架构二、简单算术表达

深度解析Java @Serial 注解及常见错误案例

《深度解析Java@Serial注解及常见错误案例》Java14引入@Serial注解,用于编译时校验序列化成员,替代传统方式解决运行时错误,适用于Serializable类的方法/字段,需注意签... 目录Java @Serial 注解深度解析1. 注解本质2. 核心作用(1) 主要用途(2) 适用位置3

Java MCP 的鉴权深度解析

《JavaMCP的鉴权深度解析》文章介绍JavaMCP鉴权的实现方式,指出客户端可通过queryString、header或env传递鉴权信息,服务器端支持工具单独鉴权、过滤器集中鉴权及启动时鉴权... 目录一、MCP Client 侧(负责传递,比较简单)(1)常见的 mcpServers json 配置

Maven中生命周期深度解析与实战指南

《Maven中生命周期深度解析与实战指南》这篇文章主要为大家详细介绍了Maven生命周期实战指南,包含核心概念、阶段详解、SpringBoot特化场景及企业级实践建议,希望对大家有一定的帮助... 目录一、Maven 生命周期哲学二、default生命周期核心阶段详解(高频使用)三、clean生命周期核心阶

深度剖析SpringBoot日志性能提升的原因与解决

《深度剖析SpringBoot日志性能提升的原因与解决》日志记录本该是辅助工具,却为何成了性能瓶颈,SpringBoot如何用代码彻底破解日志导致的高延迟问题,感兴趣的小伙伴可以跟随小编一起学习一下... 目录前言第一章:日志性能陷阱的底层原理1.1 日志级别的“双刃剑”效应1.2 同步日志的“吞吐量杀手”

Python文本相似度计算的方法大全

《Python文本相似度计算的方法大全》文本相似度是指两个文本在内容、结构或语义上的相近程度,通常用0到1之间的数值表示,0表示完全不同,1表示完全相同,本文将深入解析多种文本相似度计算方法,帮助您选... 目录前言什么是文本相似度?1. Levenshtein 距离(编辑距离)核心公式实现示例2. Jac

Unity新手入门学习殿堂级知识详细讲解(图文)

《Unity新手入门学习殿堂级知识详细讲解(图文)》Unity是一款跨平台游戏引擎,支持2D/3D及VR/AR开发,核心功能模块包括图形、音频、物理等,通过可视化编辑器与脚本扩展实现开发,项目结构含A... 目录入门概述什么是 UnityUnity引擎基础认知编辑器核心操作Unity 编辑器项目模式分类工程

深度解析Python yfinance的核心功能和高级用法

《深度解析Pythonyfinance的核心功能和高级用法》yfinance是一个功能强大且易于使用的Python库,用于从YahooFinance获取金融数据,本教程将深入探讨yfinance的核... 目录yfinance 深度解析教程 (python)1. 简介与安装1.1 什么是 yfinance?

Python学习笔记之getattr和hasattr用法示例详解

《Python学习笔记之getattr和hasattr用法示例详解》在Python中,hasattr()、getattr()和setattr()是一组内置函数,用于对对象的属性进行操作和查询,这篇文章... 目录1.getattr用法详解1.1 基本作用1.2 示例1.3 原理2.hasattr用法详解2.