三维重建(7)--运动恢复结构SfM系统解析

2024-01-26 06:04

本文主要是介绍三维重建(7)--运动恢复结构SfM系统解析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

一、SfM系统(两视图)

1、特征提取

2、特征匹配

3、RANSAC求解基础矩阵F 

4、完整的欧式结构恢复算法流程

二、基于增量法的SfM系统(以OpenMVG为例)

1、预处理 

2、图像特征点提取与匹配

3、两视图重构点云

4、增加新视图,多视图重构


一、SfM系统(两视图)

        对于欧式结构恢复的两视图问题,需要获得三维场景的m张图像的像坐标作为已知条件,求解三维场景结构(即三维点坐标),m个摄像机的外参数R和T。所以现在的问题在于如何标注m张图像的像坐标的对应关系,将摄像机拍摄的照片转换成已知条件。

        图像的像坐标对应关系可以转换为特征提取特征匹配两个部分。

1、特征提取

         特征提取:通过输入m张不同摄像机拍摄同一场景的图片,输出具有尺度不变性的特征点,即尺度不变特征转换(SIFT转换),

        SIFT算法特点:具有尺度不变性、能够适应旋转图像,改变图像亮度,移动拍摄位置的变化,能在一定程度上不受视角变化、仿射变换、噪声的干扰。

        

        SIFT算法实现特征提取的流程:提取尺度不变的区域(高斯微分函数),进行尺寸归一化和旋转归一化,对特征点区域计算特征方向,进行两两比较找出相互匹配的若干对特征点,建立两个像平面之间特征点的对应关系。

2、特征匹配

        对于二视图的特征匹配而言,首先使用特征提取器对两幅图像进行特征提取,提取出的特征点可能不同,对于下图,假设我们找右图特征点在左图的对应点。

        首先,选择一个右图中的特征点i,并计算左图所有特征点的一个相似度度量(比如余弦相似度度量),并选择这其中top2距离小的两个左图特征点j_1,j_2,并记录j_1,j_2与特征点i之间的距离d_1,d_2

        计算距离比d_1/d_2(指定小的数除以大的数),如果其小于某个给定阈值(如0.6),则认为右图特征点i与左图特征点j_1是一对对应点,这步算法的设计,如果说d_1/d_2较大,趋于1,则说明左图两个特征点之间较近,越说明左图两个特征点与右图特征点i建立的两组对应关系很难辨认,极为接近,所以我们不作为匹配对象,这更容易引入噪声。

        我们应该注意的是,特征匹配是为了后续求解基础矩阵F进行准备的。

3、RANSAC求解基础矩阵F 

         RANSAC求解基础矩阵的方法是对归一化八点法估计基础矩阵F的扩充,为了进一步去减少离群点和噪声,我们在求解基础矩阵时,可以使用RANSAC方法来充分排除离群点对求解基础矩F的干扰,提高估计的准确性和鲁棒性。

4、完整的欧式结构恢复算法流程

        对于欧式结构恢复问题,一般假设摄像机1与世界坐标系不存在旋转平移关系,即外参数为[I \hspace{0.2cm} 0],摄像机2与世界坐标系存在R,T关系,即外参数为[R \hspace{0.2cm}T],换言之摄像机2与摄像机1之间存在[R \hspace{0.2cm}T]关系。

        算法流程: 

(1)对应点计算(特征提取+特征匹配)

(2)求解基础矩阵F(RANSAC+归一化八点法)

(3)求解本质矩阵E

(4)分解本质矩阵E\rightarrow R,T\rightarrow M_2

(5)三角化

二、基于增量法的SfM系统(以OpenMVG为例)

        基于增量法的SfM系统流程:图像特征点提取与匹配->两视图重构初始点云->增加视图到系统实现多视图重构

        算法流程如下: 

1、预处理 

        预处理工作:图像特征点提取与近邻匹配,基于RANSAC的基础矩阵或单应矩阵的估计。

为什么要估计基础矩阵的同时估计单应矩阵?

        由于我们不能确定所取的特征点在世界坐标系下有没有很多是同一平面的点,如果同一平面的点较多,那么使用单应矩阵的估计后去计算本质矩阵E的误差要小很多,受到噪声的影响也很小。所以利用RANSAC来估计基础矩阵和单应矩阵,如果単应矩阵求解更容易拟合则使用単应矩阵。

2、图像特征点提取与匹配

(1)计算对应点的轨迹t

        对应点的轨迹:多个像平面下对应特征点的连线,在OpenMVG中只保留关联至少三张图片的特征点的连线。

 (2)计算连通图G

        连通图:这里的连通图指的是以图片作为结点,两个图片之间匹配特征数量达到某一阈值则作为一条边,未达到阈值则不构成边。

3、两视图重构点云

(1)在G中选取一条边e

        在连通图G中的多条边里,选取一条特殊的边,这条边的两个节点对应的两个图像满足:这两个图像的对应点三角化时的射线夹角中位数不大于60度且不小于3度,此时能保证这两个摄像机即不会离的太近容易同时丢失太多信息,也不会离的过远而导致对应点对偏少。

(2)后续过程

        接下来的三步:鲁棒估计本质矩阵E,分解本质矩阵E,三角化,都是两视图重构的流程,在这里不再重复介绍。       

        删除G中的边e:这一步也很好理解,由于我们使用了这个边进行两视图重构,那么后续将不再用这条边。

4、增加新视图,多视图重构

        当G中存在其他边时,进行多视图重构。

        选择一条G中的边e,满足该边的track(e)∩ {已重建3D点}最大化,即这条边所关联的两个图像的对应点对,为所有剩余边中最大的,优先选择该边。

        用PnP方法,对边e所对应两个图像中,未进行重建摄像机位姿的图像一方进行重建摄像机位姿。

        然后,三角化新的tracks,删除G中的边e,并执行捆绑调整操作。

        每一次引入新的视图,将执行一次捆绑调整操作,可以对世界坐标的三维点进行不断拟合。

Reference:https://www.bilibili.com/video/BV1DQ4y1e7x6/?spm_id_from=333.999.0.0&vd_source=2152dec20715e478285cc87cc31201ed

这篇关于三维重建(7)--运动恢复结构SfM系统解析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/645853

相关文章

JWT + 拦截器实现无状态登录系统

《JWT+拦截器实现无状态登录系统》JWT(JSONWebToken)提供了一种无状态的解决方案:用户登录后,服务器返回一个Token,后续请求携带该Token即可完成身份验证,无需服务器存储会话... 目录✅ 引言 一、JWT 是什么? 二、技术选型 三、项目结构 四、核心代码实现4.1 添加依赖(pom

Java MCP 的鉴权深度解析

《JavaMCP的鉴权深度解析》文章介绍JavaMCP鉴权的实现方式,指出客户端可通过queryString、header或env传递鉴权信息,服务器端支持工具单独鉴权、过滤器集中鉴权及启动时鉴权... 目录一、MCP Client 侧(负责传递,比较简单)(1)常见的 mcpServers json 配置

从原理到实战解析Java Stream 的并行流性能优化

《从原理到实战解析JavaStream的并行流性能优化》本文给大家介绍JavaStream的并行流性能优化:从原理到实战的全攻略,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的... 目录一、并行流的核心原理与适用场景二、性能优化的核心策略1. 合理设置并行度:打破默认阈值2. 避免装箱

Maven中生命周期深度解析与实战指南

《Maven中生命周期深度解析与实战指南》这篇文章主要为大家详细介绍了Maven生命周期实战指南,包含核心概念、阶段详解、SpringBoot特化场景及企业级实践建议,希望对大家有一定的帮助... 目录一、Maven 生命周期哲学二、default生命周期核心阶段详解(高频使用)三、clean生命周期核心阶

基于Python实现自动化邮件发送系统的完整指南

《基于Python实现自动化邮件发送系统的完整指南》在现代软件开发和自动化流程中,邮件通知是一个常见且实用的功能,无论是用于发送报告、告警信息还是用户提醒,通过Python实现自动化的邮件发送功能都能... 目录一、前言:二、项目概述三、配置文件 `.env` 解析四、代码结构解析1. 导入模块2. 加载环

linux系统上安装JDK8全过程

《linux系统上安装JDK8全过程》文章介绍安装JDK的必要性及Linux下JDK8的安装步骤,包括卸载旧版本、下载解压、配置环境变量等,强调开发需JDK,运行可选JRE,现JDK已集成JRE... 目录为什么要安装jdk?1.查看linux系统是否有自带的jdk:2.下载jdk压缩包2.解压3.配置环境

深入解析C++ 中std::map内存管理

《深入解析C++中std::map内存管理》文章详解C++std::map内存管理,指出clear()仅删除元素可能不释放底层内存,建议用swap()与空map交换以彻底释放,针对指针类型需手动de... 目录1️、基本清空std::map2️、使用 swap 彻底释放内存3️、map 中存储指针类型的对象

Java Scanner类解析与实战教程

《JavaScanner类解析与实战教程》JavaScanner类(java.util包)是文本输入解析工具,支持基本类型和字符串读取,基于Readable接口与正则分隔符实现,适用于控制台、文件输... 目录一、核心设计与工作原理1.底层依赖2.解析机制A.核心逻辑基于分隔符(delimiter)和模式匹

Java+AI驱动实现PDF文件数据提取与解析

《Java+AI驱动实现PDF文件数据提取与解析》本文将和大家分享一套基于AI的体检报告智能评估方案,详细介绍从PDF上传、内容提取到AI分析、数据存储的全流程自动化实现方法,感兴趣的可以了解下... 目录一、核心流程:从上传到评估的完整链路二、第一步:解析 PDF,提取体检报告内容1. 引入依赖2. 封装

深度解析Python yfinance的核心功能和高级用法

《深度解析Pythonyfinance的核心功能和高级用法》yfinance是一个功能强大且易于使用的Python库,用于从YahooFinance获取金融数据,本教程将深入探讨yfinance的核... 目录yfinance 深度解析教程 (python)1. 简介与安装1.1 什么是 yfinance?