VINS-Mono-后端优化 (三:视觉雅可比推导)

2023-11-10 18:28

本文主要是介绍VINS-Mono-后端优化 (三:视觉雅可比推导),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

用逆深度是因为这样可以在优化中从优化3个变量降低到1个,降低优化的维度加快求解速度
用逆深度是因为当距离很远的时候, 1 x \frac{1}{x} x1 x x x 就会无穷大,而3D点很近的情况也一般不会有,这也是为了数值稳定性

用逆深度的话就要和其中一帧进行绑定,这个就是和观测到该点的第一帧进行绑定,这样才能表示一个3D点信息

划窗中维护的全部都是IMU下的位姿,所以相机要通过外参变换到IMU坐标系下

在这里插入图片描述
这里就构成了视觉误差,需要求关于优化变量的雅可比矩阵,这里约束了第 i i i 帧和第 j j j 帧的 IMU 的姿态,同时还会优化相机和IMU的外参,这个也是紧耦合的特点之一(上一节同时优化 IMU预积分自身的零偏Ba也是紧耦合特点之一),3D点(逆深度)也是要优化,总共就是4个参数

转换公式如下:
i i i 帧归一化坐标系 -> 第 j j j 帧相机系, 1 λ \frac{1}{\lambda} λ1,就是深度, λ \lambda λ 是逆深度
在这里插入图片描述
将旋转和平移分开后如下:
在这里插入图片描述

将刚刚第 i i i 帧相机系下的3D点进行归一化,然后和光流追踪到的匹配点进行残差计算,这就获得了视觉重投影误差
在这里插入图片描述

计算残差对优化量的雅可比

有带时间延时估计的雅可比计算和不带时间估计的雅可比计算
这里先讲不带时间延时的雅可比计算

这里的误差项是2维的,坐标点是3维的
要求误差对旋转的雅可比只能通过链式求导的方式
∂ r ∂ p j ⋅ ∂ p j ∂ x \frac{\partial r}{\partial p_{j}}·\frac{\partial p_{j}}{\partial x} pjrxpj

∂ r ∂ p j \frac{\partial r}{\partial p_{j}} pjr 是2×3维的,对平移 x , y , z x,y,z x,y,z 进行求导
= [ 1 z 0 − x z 2 0 1 z − y z 2 ] =\begin{bmatrix}\frac{1}{z}&0&-\frac{x}{z^{2}} \\ 0&\frac{1}{z}&-\frac{y}{z^{2}} \end{bmatrix} =[z100z1z2xz2y]

这里的误差也有协方差矩阵,提点的置信度是设定为1.5个像素不变
残差也得乘上置信度

计算 p j p_{j} pj T T T 的雅可比

平移 x , y , z x,y,z x,y,z 的公式为
在这里插入图片描述

T T T 包含旋转 R R R 和平移 t t t

i i i 时刻求导

i i i 时刻的变量也是要优化的量,所以当然也要求导

p w b i p_{wb_{i}} pwbi 求导

∂ p j ∂ p w b i = R b c T ⋅ R w b j T \frac{\partial p_{j}}{\partial p_{wb_{i}}}=R^{T}_{bc}·R^{T}_{wb_{j}} pwbipj=RbcTRwbjT

R w b i R_{wb_{i}} Rwbi 求导

∂ p j ∂ R w b i \frac{\partial p_{j}}{\partial R_{wb_{i}}} Rwbipj
先把公式中有 R w b i R_{wb_{i}} Rwbi 的项提取出来

= R b c T R w b j T R w b i ( R b c P c i + p b c ) =R^{T}_{bc}R^{T}_{wb_{j}}R_{wb_{i}}(R_{bc}P^{c_{i}}+p_{bc}) =RbcTRwbjTRwbi(RbcPci+pbc)
= A R w b i b =AR_{wb_{i}}b =ARwbib

后面那一串 b b b 乘完后是向量,所以可以对李代数进行扰动求导(纯旋转矩阵是不能对李代数求导的,因为矩阵无法对向量求导,这里是乘完后是个向量,所以可以用向量来表示旋转的扰动量,然后用导数的定义来进行求导)

∂ A R w b i b ∂ ϕ = A R w b i e x p ( ϕ ∧ ) b − A R w b i b ϕ \frac{\partial AR_{wb_{i}}b}{\partial \phi}=\frac{AR_{wb_{i}}exp(\phi^{\wedge})b-AR_{wb_{i}}b}{\phi} ϕARwbib=ϕARwbiexp(ϕ)bARwbib
= A R w b i ( I + ϕ ∧ ) b − A R w b i b ϕ =\frac{AR_{wb_{i}}(I+\phi^{\wedge})b-AR_{wb_{i}}b}{\phi} =ϕARwbi(I+ϕ)bARwbib
= A R w b i ϕ ∧ b ϕ =\frac{AR_{wb_{i}}\phi^{\wedge}b}{\phi} =ϕARwbiϕb
根据反对成矩阵的性质
= − A R w b i b ∧ ϕ ϕ =\frac{-AR_{wb_{i}}b^{\wedge}\phi}{\phi} =ϕARwbibϕ
= − A R w b i b ∧ =-AR_{wb_{i}}b^{\wedge} =ARwbib

那个信息矩阵乘完第一步也得乘进来这里这个第2步的雅可比矩阵

j j j 时刻进行求导

p w b j p_{wb_{j}} pwbj 求导

∂ p j ∂ p w b j = − R b c T ⋅ R w b j T \frac{\partial p_{j}}{\partial p_{wb_{j}}}=-R^{T}_{bc}·R^{T}_{wb_{j}} pwbjpj=RbcTRwbjT

R w b j R_{wb_{j}} Rwbj 求导

把和 R w b j R_{wb_{j}} Rwbj 有关的项提取出来
= R b c T R w b j T ( R w b i R b c P c i + R w b i p b c + p w b i − p w b j ) =R^{T}_{bc}R^{T}_{wb_{j}}(R_{wb_{i}}R_{bc}P^{c_{i}}+R_{wb_{i}}p_{bc}+p_{wb_{i}}-p_{wb_{j}}) =RbcTRwbjT(RwbiRbcPci+Rwbipbc+pwbipwbj)
= A R w b j T b =AR^{T}_{wb_{j}}b =ARwbjTb

R w b j T R^{T}_{wb_{j}} RwbjT 是只能左乘的,但是我们现在要算他右乘的扰动方向,因为方向会不同,用左乘的求导结果加个负号就是右乘的结果,这里推导直接用右乘,所以要加个逆把这个转置消掉来进行推导
= A ( R w b j e x p ( ϕ ∧ ) ) − 1 b − A ( R w b j ) − 1 b =A(R_{wb_{j}}exp(\phi^{\wedge}))^{-1}b-A(R_{wb_{j}})^{-1}b =A(Rwbjexp(ϕ))1bA(Rwbj)1b
= A ( I − ϕ ∧ ) R w b j T b − A ( R w b j ) − 1 b =A(I-\phi^{\wedge})R^{T}_{wb_{j}}b-A(R_{wb_{j}})^{-1}b =A(Iϕ)RwbjTbA(Rwbj)1b
= − A ϕ ∧ R w b j T b =-A\phi^{\wedge}R^{T}_{wb_{j}}b =AϕRwbjTb
= A ( R w b j T b ) ∧ ϕ =A(R^{T}_{wb_{j}}b)^{\wedge}\phi =A(RwbjTb)ϕ
消去 ϕ \phi ϕ
= A ( R w b j T b ) ∧ =A(R^{T}_{wb_{j}}b)^{\wedge} =A(RwbjTb)

后面的 R w b j T b R^{T}_{wb_{j}}b RwbjTb 实际就是 3D 点在 第 j j j 帧 IMU系下的位姿,按照展开前的刚体变换来理解一下就好了

对 IMU-相机 的外参求导$

p b c p_{bc} pbc 求导

= R b c T R w b j T R w b i − R b c T =R^{T}_{bc}R^{T}_{wb_{j}}R_{wb_{i}}-R^{T}_{bc} =RbcTRwbjTRwbiRbcT

R b c R_{bc} Rbc 求导

代码中的 r i c = R b c , t i c = t b c ric=R_{bc},tic=t_{bc} ric=Rbc,tic=tbc Q = R w b Q=R_{wb} Q=Rwb

导数是符合加法的 ( f ( x ) + g ( x ) ) ′ = f ′ ( x ) + g ′ ( x ) (f(x)+g(x))^{'}=f^{'}(x)+g^{'}(x) (f(x)+g(x))=f(x)+g(x)

加法后面的求导结果 = ( R b c T b ) =(R^{T}_{bc}b) =(RbcTb) ,这个推导和上面类似,就不详细写了

加法前面的求导稍微复杂一点
= ( R b c e x p ( ϕ ∧ ) ) − 1 R w b j T R w b i R b c T e x p ( ϕ ∧ ) P c i − R b c T R w b j T R w b i R b c T P c i =(R_{bc}exp(\phi^{\wedge}))^{-1}R^{T}_{wb_{j}}R_{wb_{i}}R^{T}_{bc}exp(\phi^{\wedge})P^{c_{i}}-R^{T}_{bc}R^{T}_{wb_{j}}R_{wb_{i}}R^{T}_{bc}P^{c_{i}} =(Rbcexp(ϕ))1RwbjTRwbiRbcTexp(ϕ)PciRbcTRwbjTRwbiRbcTPci

下面暂时省略写后面它自身

= ( I − ϕ ∧ ) R b c T R w b j T R w b i R b c T ( I + ϕ ∧ ) P c i =(I-\phi^{\wedge})R^{T}_{bc}R^{T}_{wb_{j}}R_{wb_{i}}R^{T}_{bc}(I+\phi^{\wedge})P^{c_{i}} =(Iϕ)RbcTRwbjTRwbiRbcT(I+ϕ)Pci
= ( I − ϕ ∧ ) A ( I + ϕ ∧ ) P c i =(I-\phi^{\wedge})A(I+\phi^{\wedge})P^{c_{i}} =(Iϕ)A(I+ϕ)Pci
= ( A − ϕ ∧ A ) ( I + ϕ ∧ ) P c i =(A-\phi^{\wedge}A)(I+\phi^{\wedge})P^{c_{i}} =(AϕA)(I+ϕ)Pci
= ( A + A ϕ ∧ − ϕ ∧ A − ϕ ∧ A ϕ ∧ ) P c i − A P c i =(A+A\phi^{\wedge}-\phi^{\wedge}A-\phi^{\wedge}A \phi^{\wedge})P^{c_{i}}-AP^{c_{i}} =(A+AϕϕAϕAϕ)PciAPci

其中 ϕ ∧ A ϕ ∧ \phi^{\wedge}A \phi^{\wedge} ϕAϕ 是二阶,是相对于一阶的无穷小,这里只讨论一阶的展开且 ϕ \phi ϕ 本身就是小量,所以直接约掉

= ( A ϕ ∧ − ϕ ∧ A ) ⋅ P c i =(A\phi^{\wedge}-\phi^{\wedge}A)·P^{c_{i}} =(AϕϕA)Pci
= − A P ∧ ϕ + ( A P ) ∧ ϕ =-AP^{\wedge}\phi+(AP)^{\wedge}\phi =APϕ+(AP)ϕ
约掉 ϕ \phi ϕ
= − A P ∧ + ( A P ) ∧ =-AP^{\wedge}+(AP)^{\wedge} =AP+(AP)

对逆深度 λ \lambda λ 求导

∂ p j ∂ P c i ∂ P c i ∂ λ \frac{\partial p_{j}}{\partial P^{c_{i}}}\frac{\partial P^{c_{i}}}{\partial \lambda} PcipjλPci

前面的 ∂ p j ∂ P c i = R b c T R w b j T R w b i R b c \frac{\partial p_{j}}{\partial P^{c_{i}}}=R^{T}_{bc}R^{T}_{wb_{j}}R_{wb_{i}}R_{bc} Pcipj=RbcTRwbjTRwbiRbc

P c i = 1 λ ⋅ p P^{c_{i}}=\frac{1}{\lambda} ·p Pci=λ1p p p p 是归一化相机系下的3D点

∂ P c i ∂ λ = − 1 λ 2 ⋅ p \frac{\partial P^{c_{i}}}{\partial \lambda}=-\frac{1}{\lambda^{2}}·p λPci=λ21p

这个 − 1 λ 2 -\frac{1}{\lambda^{2}} λ21 是个系数,移到哪里都可以

零空间漂移处理

优化的时候会固定滑窗中的第一帧的xyz和yaw角,因为IMU约束的是相对位姿,且IMU的4个不可观自由度就是 y a w 、 x 、 y 、 z yaw、x、y、z yawxyz,绝对位姿是没有约束的,所以可能会产生在 4自由度的 0 空间漂移的情况,fusion中的GPS就是约束绝对位姿的。

VINS中的固定是先计算第一帧的yaw和xyz的偏移量,然后把后面的帧都减去这个偏移量,偏移回之前的位置,这样的做法就类似ORB中的固定第一帧的位姿,不过这里是减去第一帧的偏移量,其实就是滑窗中的整条轨迹调整回偏移前的位置,这样就保证不受 0 空间的影响。

和 yaw相关的量都会受影响,就是和旋转向量的量都会受影响, P , V P,V P,V 受影响,零偏 B a , B g Ba,Bg Ba,Bg ,外参 T b c Tbc Tbc 不受影响

前面会把旋转矩阵变成rpy,然后把yaw的角度差取出来构成新的偏移旋转矩阵,因为只是yaw发生漂移

这篇关于VINS-Mono-后端优化 (三:视觉雅可比推导)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/384472

相关文章

SpringBoot后端实现小程序微信登录功能实现

《SpringBoot后端实现小程序微信登录功能实现》微信小程序登录是开发者通过微信提供的身份验证机制,获取用户唯一标识(openid)和会话密钥(session_key)的过程,这篇文章给大家介绍S... 目录SpringBoot实现微信小程序登录简介SpringBoot后端实现微信登录SpringBoo

SpringBoot中HTTP连接池的配置与优化

《SpringBoot中HTTP连接池的配置与优化》这篇文章主要为大家详细介绍了SpringBoot中HTTP连接池的配置与优化的相关知识,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一... 目录一、HTTP连接池的核心价值二、Spring Boot集成方案方案1:Apache HttpCl

PyTorch高级特性与性能优化方式

《PyTorch高级特性与性能优化方式》:本文主要介绍PyTorch高级特性与性能优化方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、自动化机制1.自动微分机制2.动态计算图二、性能优化1.内存管理2.GPU加速3.多GPU训练三、分布式训练1.分布式数据

MySQL中like模糊查询的优化方案

《MySQL中like模糊查询的优化方案》在MySQL中,like模糊查询是一种常用的查询方式,但在某些情况下可能会导致性能问题,本文将介绍八种优化MySQL中like模糊查询的方法,需要的朋友可以参... 目录1. 避免以通配符开头的查询2. 使用全文索引(Full-text Index)3. 使用前缀索

C#实现高性能Excel百万数据导出优化实战指南

《C#实现高性能Excel百万数据导出优化实战指南》在日常工作中,Excel数据导出是一个常见的需求,然而,当数据量较大时,性能和内存问题往往会成为限制导出效率的瓶颈,下面我们看看C#如何结合EPPl... 目录一、技术方案核心对比二、各方案选型建议三、性能对比数据四、核心代码实现1. MiniExcel

MySQL索引的优化之LIKE模糊查询功能实现

《MySQL索引的优化之LIKE模糊查询功能实现》:本文主要介绍MySQL索引的优化之LIKE模糊查询功能实现,本文通过示例代码给大家介绍的非常详细,感兴趣的朋友一起看看吧... 目录一、前缀匹配优化二、后缀匹配优化三、中间匹配优化四、覆盖索引优化五、减少查询范围六、避免通配符开头七、使用外部搜索引擎八、分

Python通过模块化开发优化代码的技巧分享

《Python通过模块化开发优化代码的技巧分享》模块化开发就是把代码拆成一个个“零件”,该封装封装,该拆分拆分,下面小编就来和大家简单聊聊python如何用模块化开发进行代码优化吧... 目录什么是模块化开发如何拆分代码改进版:拆分成模块让模块更强大:使用 __init__.py你一定会遇到的问题模www.

SpringBoot首笔交易慢问题排查与优化方案

《SpringBoot首笔交易慢问题排查与优化方案》在我们的微服务项目中,遇到这样的问题:应用启动后,第一笔交易响应耗时高达4、5秒,而后续请求均能在毫秒级完成,这不仅触发监控告警,也极大影响了用户体... 目录问题背景排查步骤1. 日志分析2. 性能工具定位优化方案:提前预热各种资源1. Flowable

SpringBoot3实现Gzip压缩优化的技术指南

《SpringBoot3实现Gzip压缩优化的技术指南》随着Web应用的用户量和数据量增加,网络带宽和页面加载速度逐渐成为瓶颈,为了减少数据传输量,提高用户体验,我们可以使用Gzip压缩HTTP响应,... 目录1、简述2、配置2.1 添加依赖2.2 配置 Gzip 压缩3、服务端应用4、前端应用4.1 N

Spring Boot + MyBatis Plus 高效开发实战从入门到进阶优化(推荐)

《SpringBoot+MyBatisPlus高效开发实战从入门到进阶优化(推荐)》本文将详细介绍SpringBoot+MyBatisPlus的完整开发流程,并深入剖析分页查询、批量操作、动... 目录Spring Boot + MyBATis Plus 高效开发实战:从入门到进阶优化1. MyBatis