牛津大学和上海交大将SAM和Flow应用于移动目标,简单而有效,轻松分割运动目标!

本文主要是介绍牛津大学和上海交大将SAM和Flow应用于移动目标,简单而有效,轻松分割运动目标!,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

光流可以在运动物体分割中发现运动物体并为分割提供清晰的边界。然而,如果物体暂时静止,就会面临分割挑战。

而我们知道SAM可以很好的分割静态图像对象。因此,是否可以利用SAM与光流结合来在视频中进行移动物体分割?

今天给大家介绍的这篇文章介绍并探索了两个模型,以利用SAM在视频中进行移动物体分割,使主要移动物体能够与背景运动区分开来。主要贡献有三个方面:

  • FlowI-SAM模型,利用光流作为三通道输入图像进行精确的逐帧分割和移动物体识别。

  • FlowP-SAM模型,这是RGB和流的双流数据的新颖组合,利用光流生成提示,指导SAM在RGB图像中识别和定位移动物体。

  • 在移动物体分割基准上,包括DAVIS、YTVOS和MoCA,在帧级和序列级上都取得了新的领先性能。

相关链接

项目:www.robots.ox.ac.uk/~vgg/research/flowsam

论文:arxiv.org/abs/2404.12389

代码:github.com/Jyxarthur/flowsam

论文阅读

摘要

本文的目标是运动分割——发现和分割视频中的运动物体。这是一个被广泛研究的领域,有许多谨慎的,有时甚至是复杂的方法和训练方案,包括:自监督学习,从合成数据集学习,以对象为中心的表示,模态表示等等。我们在本文中感兴趣的是确定分段任意模型(SAM)是否可以为这项任务做出贡献。

我们研究了两种将SAM与光流相结合的模型,利用了SAM的分割能力和光流发现和分组运动物体的能力。首先,我们对SAM进行调整,使其将流(而不是RGB)作为输入。在第二个模型中,SAM以RGB作为输入,flow作为分割提示符。

这些令人惊讶的简单方法,无需任何进一步的修改,在单对象和多对象基准测试中都比以前的所有方法都要好得多。我们还将这些帧级分割扩展到保持对象身份的序列级分割。同样,这个简单的模型在多个视频对象分割基准上优于以前的方法。

方法

将SAM应用于视频目标分割。

  • (a)流作为输入:flow-sam只接收光流并预测帧级分割掩码。

  • (b) flow-as-prompt: FlowP-SAM接受RGB并应用flow作为帧级分割提示符的信息。

  • (c)序列级掩码关联:作为后处理步骤,多掩码选择模块自回归从FlowI-SAM和/或FlowP-SAM转换帧级掩码输出并产生序列级掩码,其中对象标识在整个序列中是一致的。

flow-sam概述

  • (a) flow-sam的推理管道。

  • (b)体系结构带有可训练参数标记的flow - sam。生成点提示令牌由一个冻结的提示编码器。

FlowP-SAM概述

  • (a) FlowP-SAM的推理管道。

  • (b)体系结构FlowP-SAM。流提示生成器生成要注入的流提示类似sam的基于rgb的分段模块。两个模块取同一点提示令牌,从冻结的提示编码器获得。

  • (c)流量变压器的详细结构。译输入令牌作为轻量级查询的功能变压器解码器,迭代处理密集流特性。输出移动对象分数(MOS)令牌然后由基于mlp的头部处理以预测分数指示输入点提示符是否对应于移动对象。

实验

DAVIS上flow-sam方法的定性比较 (左),YTVOS(中)和MoCA(右)序列。我们的flow-sam(seq)成功地从嘈杂的光流背景中识别出运动物体(例如,鸭子第四栏)。

基于rgb的分割方法的定性比较DAVIS(左),YTVOS(中)和SegTrackv2(右)。而前面的方法 (第三行)努力解开多个移动的物体(例如,混合的金鱼,在第二列中),我们的FlowI-SAM (seq)准确地分离和分割所有移动对象。

结论

在本文中,我们通过两种方式将每帧SAM与运动信息(光流)结合起来,专注于现实世界视频中的运动目标分割:

  • (i)对于纯流分割,我们引入了直接接收的flow-sam光流作为输入;

  • (ii)对于基于rgb的分割,我们利用运动信息来生成流提示作为指导。

这两种方法在跨单对象和多对象的帧级分割中都提供了最先进的性能基准。此外,我们开发了一种基于帧的关联方法合并FlowI-SAM和FlowP-SAM的预测,实现序列级分割预测,优于所有先前在DAVIS上的方法。

这项工作的主要限制是它的运行时间长,归因于 到普通SAM中计算量大的图像编码器。然而,我们的 该方法一般适用于其他基于提示符的分割模型。 随着更有效的SAM版本的出现,我们预计会有显著的 减少推理时间。

这篇关于牛津大学和上海交大将SAM和Flow应用于移动目标,简单而有效,轻松分割运动目标!的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/984092

相关文章

PHP轻松处理千万行数据的方法详解

《PHP轻松处理千万行数据的方法详解》说到处理大数据集,PHP通常不是第一个想到的语言,但如果你曾经需要处理数百万行数据而不让服务器崩溃或内存耗尽,你就会知道PHP用对了工具有多强大,下面小编就... 目录问题的本质php 中的数据流处理:为什么必不可少生成器:内存高效的迭代方式流量控制:避免系统过载一次性

PHP应用中处理限流和API节流的最佳实践

《PHP应用中处理限流和API节流的最佳实践》限流和API节流对于确保Web应用程序的可靠性、安全性和可扩展性至关重要,本文将详细介绍PHP应用中处理限流和API节流的最佳实践,下面就来和小编一起学习... 目录限流的重要性在 php 中实施限流的最佳实践使用集中式存储进行状态管理(如 Redis)采用滑动

深入浅出Spring中的@Autowired自动注入的工作原理及实践应用

《深入浅出Spring中的@Autowired自动注入的工作原理及实践应用》在Spring框架的学习旅程中,@Autowired无疑是一个高频出现却又让初学者头疼的注解,它看似简单,却蕴含着Sprin... 目录深入浅出Spring中的@Autowired:自动注入的奥秘什么是依赖注入?@Autowired

Python 基于http.server模块实现简单http服务的代码举例

《Python基于http.server模块实现简单http服务的代码举例》Pythonhttp.server模块通过继承BaseHTTPRequestHandler处理HTTP请求,使用Threa... 目录测试环境代码实现相关介绍模块简介类及相关函数简介参考链接测试环境win11专业版python

PostgreSQL简介及实战应用

《PostgreSQL简介及实战应用》PostgreSQL是一种功能强大的开源关系型数据库管理系统,以其稳定性、高性能、扩展性和复杂查询能力在众多项目中得到广泛应用,本文将从基础概念讲起,逐步深入到高... 目录前言1. PostgreSQL基础1.1 PostgreSQL简介1.2 基础语法1.3 数据库

Python中的filter() 函数的工作原理及应用技巧

《Python中的filter()函数的工作原理及应用技巧》Python的filter()函数用于筛选序列元素,返回迭代器,适合函数式编程,相比列表推导式,内存更优,尤其适用于大数据集,结合lamb... 目录前言一、基本概念基本语法二、使用方式1. 使用 lambda 函数2. 使用普通函数3. 使用 N

Python中yield的用法和实际应用示例

《Python中yield的用法和实际应用示例》在Python中,yield关键字主要用于生成器函数(generatorfunctions)中,其目的是使函数能够像迭代器一样工作,即可以被遍历,但不会... 目录python中yield的用法详解一、引言二、yield的基本用法1、yield与生成器2、yi

Python脚本轻松实现检测麦克风功能

《Python脚本轻松实现检测麦克风功能》在进行音频处理或开发需要使用麦克风的应用程序时,确保麦克风功能正常是非常重要的,本文将介绍一个简单的Python脚本,能够帮助我们检测本地麦克风的功能,需要的... 目录轻松检测麦克风功能脚本介绍一、python环境准备二、代码解析三、使用方法四、知识扩展轻松检测麦

Python多线程应用中的卡死问题优化方案指南

《Python多线程应用中的卡死问题优化方案指南》在利用Python语言开发某查询软件时,遇到了点击搜索按钮后软件卡死的问题,本文将简单分析一下出现的原因以及对应的优化方案,希望对大家有所帮助... 目录问题描述优化方案1. 网络请求优化2. 多线程架构优化3. 全局异常处理4. 配置管理优化优化效果1.

python连接sqlite3简单用法完整例子

《python连接sqlite3简单用法完整例子》SQLite3是一个内置的Python模块,可以通过Python的标准库轻松地使用,无需进行额外安装和配置,:本文主要介绍python连接sqli... 目录1. 连接到数据库2. 创建游标对象3. 创建表4. 插入数据5. 查询数据6. 更新数据7. 删除