二十多年来第一次!CVPR最佳学生论文授予中国高校学生!

本文主要是介绍二十多年来第一次!CVPR最佳学生论文授予中国高校学生!,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

全球人工智能领域最具影响力的大会 CVPR 近日宣布,将 2022 年“最佳学生论文”奖颁给同济大学研二学生陈涵晟等人,这是二十多年来首次有中国高校学生获此殊荣。该论文是陈涵晟在阿里巴巴达摩院实习期间的成果,融合了传统几何推理和深度学习,提出了计算 3D 物体位姿(位置和朝向)的新方法,能从单张图片计算出 3D 物体在真实世界里的位置和朝向,有望成为自动驾驶、机器人等技术发展的理论动力。

CVPR(国际计算机视觉与模式识别会议)是人工智能领域的顶级学术会议,今年共收到 8161 篇论文投稿,最终录取 2064 篇,只评出最佳论文和最佳学生论文各 1 篇。CVPR 的最佳论文和最佳学生论文常被视作 AI 技术风向标,诞生了 ResNet 等一系列标志成果。

CVPR 早在 2001 年就设立最佳学生论文奖,今年首次发给中国高校学生。获奖论文《EPro-PnP: Generalized End-to-End Probabilistic Perspective-n-Points for Monocular Object Pose Estimation 》来自同济大学汽车学院和阿里巴巴达摩院,作者分别是陈涵晟、王丕超、王帆、田炜、熊璐、李昊。

在这里插入图片描述

获奖证书

论文研究的是 3D 视觉领域经典问题,通过单张图像求解 3D 物体在真实世界里的位姿(位置和朝向)。这一技术方向应用前景广阔,是自动驾驶、机器人等行业的基础技术。比如在自动驾驶中,只有先计算出周边车辆的位姿,判断对方究竟是要加速、刹车还是变道,己方车辆才能做出对应操作,计算不准或者过慢都有可能引发事故。

在这里插入图片描述

3D 物体的位姿计算示意

通过单张图像定位 3D 物体极具挑战性。一般有两类解决方法:

  • 一类是基于几何推理,例如 PnP 算法,可解释性好、泛化能力强,但需要提前知道物体的尺寸和形状,具有较大的局限性;
  • 另一类是深度学习方法,可预测 3D 物体的位置坐标和朝向角度,但在小规模数据集上容易过度拟合。

获奖论文提出的新方法 EPro-PnP,创造性地引入了概率分布,将几何推理和深度学习两种方法无缝衔接,形成了一个端到端的易用模型,可以快速估算 3D 物体的位姿。实验证明,新模型通用性强、定位准确,不需要提前知道物体的几何形状;更重要的是非常简洁,效率较高,具有较好的可解释性,有望用于自动驾驶、机器人、无人机、AR等诸多需要通过视觉来估算物体位姿的场景。

在这里插入图片描述

EPro-PnP 方法示意

据了解,论文第一作者陈涵晟本科硕士均就读于同济大学汽车学院,目前研究生二年级在读,导师为熊璐教授,副导师为田炜助理教授,达摩院导师为王丕超博士。他的研究方向是计算机视觉中的 3D 物体位姿估计,研一就已在 CVPR 发表论文。2021 年到阿里达摩院做研究型实习生后,在达摩院日常研究讨论中碰撞出灵感,尝试去构造统一的理论框架。“我原来以为这篇论文可能比较冷门,因为太偏数学,没想到能够获奖。”陈涵晟说。

在这里插入图片描述

达摩院研究型实习生

同济大学研究生陈涵晟论文第一通讯作者、达摩院算法专家王丕超博士表示,这篇论文的特别之处在于用数学的方式解决 AI 底层问题,带来了基础理论上的突破,对 3D 视觉领域的研究和应用都将产生积极影响。“核心创新是转换数学视角,引入概率密度,把不可导的函数变成可导,所以能通过反向传播来训练深度网络,最终实现稳定收敛,提升 3D 物体的定位精度。”

研究型实习生是阿里巴巴在 2017 年创立的科研项目,截至目前,已为全球 200 多所顶尖高校的 1000 多名学生提供了科研岗位。

【论文链接】https://arxiv.org/abs/2203.13254

二十多年来第一次!CVPR最佳学生论文授予中国高校学生!

这篇关于二十多年来第一次!CVPR最佳学生论文授予中国高校学生!的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!


原文地址:https://blog.csdn.net/bjchenxu/article/details/125535045
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.chinasem.cn/article/477980

相关文章

全面掌握 SQL 中的 DATEDIFF函数及用法最佳实践

《全面掌握SQL中的DATEDIFF函数及用法最佳实践》本文解析DATEDIFF在不同数据库中的差异,强调其边界计算原理,探讨应用场景及陷阱,推荐根据需求选择TIMESTAMPDIFF或inte... 目录1. 核心概念:DATEDIFF 究竟在计算什么?2. 主流数据库中的 DATEDIFF 实现2.1

Spring WebFlux 与 WebClient 使用指南及最佳实践

《SpringWebFlux与WebClient使用指南及最佳实践》WebClient是SpringWebFlux模块提供的非阻塞、响应式HTTP客户端,基于ProjectReactor实现,... 目录Spring WebFlux 与 WebClient 使用指南1. WebClient 概述2. 核心依

MyBatis-Plus 中 nested() 与 and() 方法详解(最佳实践场景)

《MyBatis-Plus中nested()与and()方法详解(最佳实践场景)》在MyBatis-Plus的条件构造器中,nested()和and()都是用于构建复杂查询条件的关键方法,但... 目录MyBATis-Plus 中nested()与and()方法详解一、核心区别对比二、方法详解1.and()

Spring Boot @RestControllerAdvice全局异常处理最佳实践

《SpringBoot@RestControllerAdvice全局异常处理最佳实践》本文详解SpringBoot中通过@RestControllerAdvice实现全局异常处理,强调代码复用、统... 目录前言一、为什么要使用全局异常处理?二、核心注解解析1. @RestControllerAdvice2

Spring事务传播机制最佳实践

《Spring事务传播机制最佳实践》Spring的事务传播机制为我们提供了优雅的解决方案,本文将带您深入理解这一机制,掌握不同场景下的最佳实践,感兴趣的朋友一起看看吧... 目录1. 什么是事务传播行为2. Spring支持的七种事务传播行为2.1 REQUIRED(默认)2.2 SUPPORTS2

MySQL 中 ROW_NUMBER() 函数最佳实践

《MySQL中ROW_NUMBER()函数最佳实践》MySQL中ROW_NUMBER()函数,作为窗口函数为每行分配唯一连续序号,区别于RANK()和DENSE_RANK(),特别适合分页、去重... 目录mysql 中 ROW_NUMBER() 函数详解一、基础语法二、核心特点三、典型应用场景1. 数据分

深度解析Spring AOP @Aspect 原理、实战与最佳实践教程

《深度解析SpringAOP@Aspect原理、实战与最佳实践教程》文章系统讲解了SpringAOP核心概念、实现方式及原理,涵盖横切关注点分离、代理机制(JDK/CGLIB)、切入点类型、性能... 目录1. @ASPect 核心概念1.1 AOP 编程范式1.2 @Aspect 关键特性2. 完整代码实

MySQL 用户创建与授权最佳实践

《MySQL用户创建与授权最佳实践》在MySQL中,用户管理和权限控制是数据库安全的重要组成部分,下面详细介绍如何在MySQL中创建用户并授予适当的权限,感兴趣的朋友跟随小编一起看看吧... 目录mysql 用户创建与授权详解一、MySQL用户管理基础1. 用户账户组成2. 查看现有用户二、创建用户1. 基

MySQL MCP 服务器安装配置最佳实践

《MySQLMCP服务器安装配置最佳实践》本文介绍MySQLMCP服务器的安装配置方法,本文结合实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下... 目录mysql MCP 服务器安装配置指南简介功能特点安装方法数据库配置使用MCP Inspector进行调试开发指

SQLite3命令行工具最佳实践指南

《SQLite3命令行工具最佳实践指南》SQLite3是轻量级嵌入式数据库,无需服务器支持,具备ACID事务与跨平台特性,适用于小型项目和学习,sqlite3.exe作为命令行工具,支持SQL执行、数... 目录1. SQLite3简介和特点2. sqlite3.exe使用概述2.1 sqlite3.exe