cv姿态评估:Levenberg-Marquardt优化-阻尼最小二乘(DLS)

2023-11-02 09:59

本文主要是介绍cv姿态评估:Levenberg-Marquardt优化-阻尼最小二乘(DLS),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

'''
自己整理备忘,也供后人参考。
KZ@njucs.onMicrosoft.com本节记录了cv姿态评估的常见思路,建立模型的方法与Levenberg-Marquardt优化原理。
在下一节中,我们将讨论如何在工程上将旋转向量、欧拉角与四元数之间进行转换。
'''

基础知识:

仿射变换是计算机视觉领域应用十分广泛的特殊变换。是指在几何中,一个向量进行一次线性变换并接上一个平移,变换为另一个向量。对于一个三维直角坐标系,基于每个坐标轴的旋转具有的规则旋转空间的集合,可以表示任何三维向量。在有限维的情况,每个仿射变换可以由一个矩阵A和一个向量b给出,对应于一个矩阵和一个向量的乘法,而仿射变换的复合对应于普通的矩阵乘法,只要加入一个额外的行到矩阵的底下,这一行全部是0除了最右边是一个1,而列向量的底下要加上一个1。

一个对向量平移向量b,与旋转放大缩小 A的仿射映射为

在齐次坐标上,等价于

在分形的研究里,收缩平移仿射映射可以制造制具有自相似性的分形。一个在两个仿射空间之间的仿射变换,是在向量上呈现线性之坐标点的变换(即为空间中点与点之间的向量)。以符号表示的话,  使得 ,决定任一对点的线性变换:

或者

 

在二维坐标系上绕原点进行的二维旋转:

如图所示,当点v绕原点转动θ至v',假设v点的坐标是(x,y),那么可以推导得到v'(x',y'),过程如下:

参数如图,我们发现:

x=rcosϕ

y=rsinϕ

x′=rcos(θ+ϕ)

y′=rsin(θ+ϕ)

通过三角函数展开得:

x′=rcosθcosϕ−rsinθsinϕ

y′=rsinθcosϕ+rcosθsinϕ

代入x,y表达式可得:

x′=xcosθ−ysinθ

y′=xsinθ+ycosθ

使用矩阵表示:

绕任意轴的三维旋转

绕任意轴的三维旋转可以将旋转分解为一系列基本的二维旋转,如图所示:

步骤一,二,三 

 

 

什么是姿势估计?

在计算机视觉中,物体的姿势指的是其相对于相机的相对取向和位置。通过相对于相机移动对象或相对于对象移动相机来更改姿势。

姿势由上下翻转(pitch),左右翻转(yaw),平面内旋转(roll)构成。

比如,人脸姿态估计的思想:旋转三维标准模型一定角度,直到模型上“三维特征点”的“2维投影”,与待测试图像上的特征点(图像上的特征点显然是2维)尽量重合。这时候我们脑海中就应该浮现出一种诡异的场景:在幽暗的灯光中,一个发着淡蓝色光芒的人皮面具一点点的“自我调整”,突然一下子“完美无缺”的“扣在了你的脸上”。这就是人脸姿态估计的思想。

计算图像中对象的3D姿势,需要以下几个参量:

1.几个点的2D坐标。

在工程中,通常使用dlib的detector。

2.相同点的3D位置

代表2D要素点的3D位置。理想情况下需要照片中人物的3D模型才能获得3D位置。但在实践中,通用3D模型就足够了。只需要在某个任意参考系中的几个点的3D位置。通常来说,使用以下3D点。

  1. 鼻尖:(0.0,0.0,0.0)
  2. 下巴:(0.0,-330.0,-65.0)
  3. 左眼左角:( - 225.0f,170.0f,-135.0)
  4. 右眼右角:(225.0,170.0,-135.0)
  5. 口的左角:( - 150.0,-150.0,-125.0)
  6. 嘴角:(150.0,-150.0,-125.0)

3.相机的光学参数

相机的光学参数包括图像的光学中心和径向失真参数,所以我们必须校准相机。具体方法在这里不再多说,我们假设相机已经被校准。

 

姿态估计算法原理

 

这里有三个坐标系。上面显示的各种面部特征的3D坐标是世界坐标。如果我们知道旋转和平移参量,我们可以将世界坐标中的3D点转换为相机坐标中的 3D点。可以使用相机的固有参数(焦距,光学中心等)将相机坐标中的3D点投影到图像平面(即图像坐标系)上。

假设我们知道世界坐标中(U,V,W)3D点的位置P。如果我们知道相对于相机坐标的世界坐标的旋转\ mathbf {R}(3×3矩阵)和平移\ mathbf {吨}(3×1矢量),我们可以使用以下等式计算相机坐标系(X,Y,Z)中点的位置P

将它展开:

如果我们知道足够数量的点对应(即(X,Y,Z)(U,V,W)),上面就是一个线性方程组,其中R_ {} IJ(t_x,t_y,t_z)是未知数,可以很容易被求出。

3D模型上的许多点(即(U,V,W))是给出的,但我们不知道(X,Y,Z)。我们只知道2D点的位置(即(x,y))。在不考虑径向畸变的情况下,图像坐标中(x,y)的点p的坐标由下式给出

 \ begin {align *} \ begin {bmatrix} x \\ y \\ 1 \ end {bmatrix}&= s \ begin {bmatrix} f_x&0&c_x \\ 0&f_y&c_y \\ 0&0&1 \ end {bmatrix} \ begin {bmatrix} X \\ Y \\ Z \ end {bmatrix} \ end {align *}

其中,F_Xf_y是在x和y方向上的焦距,并且(c_x,c_y)是光学中心。

小号是一个未知的比例因子,因为在任何图像中我们都不知道深度。我们将矩阵[X,Y,Z]代入以上矩阵。

\ begin {align *} s \ begin {bmatrix} X \\ Y \\ Z \ end {bmatrix} = \ begin {bmatrix} r_ {00}ï¼r_ {01}ï¼r_ {02}ï¼t_ {x} \ \ r_ {10}ï¼r_ {11}ï¼r_ {12}ï¼t_ {y} \\ r_ {20}ï¼r_ {21}ï¼r_ {22}ï¼t_ {z} \\ \ end {bmatrix} \ begin {bmatrix} U \\ V \\ W \\ 1 \ end {bmatrix} \ end {align *}

是不是看起来有点复杂?这里使用一种称为直接线性变换(DLT)的方法,可以解决上述形式的等式。

但DLT方法不是非常准确。首先,旋转\ mathbf {R}具有三个自由度,但DLT解决方案中使用的矩阵表示具有9个数字。DLT解决方案中没有任何内容迫使估计的3×3矩阵成为旋转矩阵。更重要的是,DLT解决方案不会最小化正确的目标函数。

 

Levenberg-Marquardt优化

莱文贝格-马夸特方法(Levenberg–Marquardt algorithm)能提供数非线性最小化(局部最小)的数值解。此算法能借由执行时修改参数达到结合高斯-牛顿算法以及梯度下降法的优点,并对两者之不足作改善(比如高斯-牛顿算法之反矩阵不存在或是初始值离局部极小值太远)。

假设f 是一个从\Re ^{m}\rightarrow \Re ^{n} 的非线性映射,也就是说{\mathbf  {P}}\in \Re ^{m} 且{\mathbf  {X}}\in \Re ^{n}, 那么,f({\mathbf  {P}})={\mathbf  {X}}

我们希望任意给定一个 \mathbf {x} 以及合理的初始值 {\mathbf  {p}}_{0},我们能找到一个 {\mathbf  {p}}^{​{+}},使得 {\mathbf  {\epsilon }}^{T}{\mathbf  {\epsilon }} 尽量小(局部极小),其中{\mathbf  {\epsilon }}=f({\mathbf  {p}}^{+})-{\mathbf  {x}}

我们通过迭代实现最小化,首先根据泰勒展开式我们能把 f({\mathbf  {p}}+{\mathbf  {\delta _{p}}}) 写为下面的近似,这有两个好处:

第一是线性的、第二是只需要一阶微分。

f({\mathbf  {p}}+{\mathbf  {\delta _{p}}})\approx f({\mathbf  {p}})+{\mathbf  {J\delta _{p}}}

其中\mathbf {J}f的雅克比矩阵。对于每次的迭代我们实际上做了这样一件事:

假设这次 iteration 的点是{\mathbf  {p}}_{k},我们要找到一个 {\mathbf  {\delta }}_{​{​{\mathbf  {p}},k}} 让 |{\mathbf  {x}}-f({\mathbf  {p}}+{\mathbf  {\delta }}_{​{​{\mathbf  {p}},k}})|\approx |{\mathbf  {x}}-f({\mathbf  {p}})-{\mathbf  {J{\mathbf  {\delta }}_{​{​{\mathbf  {p}},k}}}}|=|{\mathbf  {\epsilon }}_{​{k}}-{\mathbf  {J{\mathbf  {\delta }}_{​{​{\mathbf  {p}},k}}}}| 最小。 根据投影公式我们知道当下面式子被满足的时候能有最小误差:

({\mathbf  {J}}^{T}{\mathbf  {J}}){\mathbf  {\delta _{p}}}={\mathbf  {J}}^{T}{\mathbf  {\epsilon }}_{​{k}}

我们将这个公式略加修改得到:

[\mu {\mathbf  {I}}+({\mathbf  {J}}^{T}{\mathbf  {J}})]{\mathbf  {\delta _{p}}}={\mathbf  {J}}^{T}{\mathbf  {\epsilon }}_{​{k}}

如此一来 \mu 大的时候这种算法会接近最速下降法,小的时候会接近高斯-牛顿方法。为了确保每次{\mathbf  {\epsilon }} 长度的减少,我们这么作:先采用一个小的 \mu,如果{\mathbf  {\epsilon }} 长度变大就增加\mu

此算法当以下某些条件达到时结束迭代:

  1. 如果发现 {\mathbf  {\epsilon }} 长度变化小于特定的给定值就结束。
  2. 发现{\mathbf  {\delta _{p}}} 变化小于特定的给定值就结束。
  3. 到达了迭代的上限设定就结束。

 

在下一节中,我们将讨论如何将旋转向量、欧拉角与四元数之间进行转换。

引用:

1.https://www.cnblogs.com/warmlayu/p/9937067.html

3.https://en.wikipedia.org/wiki/Levenberg%E2%80%93Marquardt_algorithm

4.https://www.learnopencv.com/head-pose-estimation-using-opencv-and-dlib/

这篇关于cv姿态评估:Levenberg-Marquardt优化-阻尼最小二乘(DLS)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/329830

相关文章

javacv依赖太大导致jar包也大的解决办法

《javacv依赖太大导致jar包也大的解决办法》随着项目的复杂度和依赖关系的增加,打包后的JAR包可能会变得很大,:本文主要介绍javacv依赖太大导致jar包也大的解决办法,文中通过代码介绍的... 目录前言1.检查依赖2.更改依赖3.检查副依赖总结 前言最近在写项目时,用到了Javacv里的获取视频

MySQL8 密码强度评估与配置详解

《MySQL8密码强度评估与配置详解》MySQL8默认启用密码强度插件,实施MEDIUM策略(长度8、含数字/字母/特殊字符),支持动态调整与配置文件设置,推荐使用STRONG策略并定期更新密码以提... 目录一、mysql 8 密码强度评估机制1.核心插件:validate_password2.密码策略级

从原理到实战解析Java Stream 的并行流性能优化

《从原理到实战解析JavaStream的并行流性能优化》本文给大家介绍JavaStream的并行流性能优化:从原理到实战的全攻略,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的... 目录一、并行流的核心原理与适用场景二、性能优化的核心策略1. 合理设置并行度:打破默认阈值2. 避免装箱

Python实战之SEO优化自动化工具开发指南

《Python实战之SEO优化自动化工具开发指南》在数字化营销时代,搜索引擎优化(SEO)已成为网站获取流量的重要手段,本文将带您使用Python开发一套完整的SEO自动化工具,需要的可以了解下... 目录前言项目概述技术栈选择核心模块实现1. 关键词研究模块2. 网站技术seo检测模块3. 内容优化分析模

Java实现复杂查询优化的7个技巧小结

《Java实现复杂查询优化的7个技巧小结》在Java项目中,复杂查询是开发者面临的“硬骨头”,本文将通过7个实战技巧,结合代码示例和性能对比,手把手教你如何让复杂查询变得优雅,大家可以根据需求进行选择... 目录一、复杂查询的痛点:为何你的代码“又臭又长”1.1冗余变量与中间状态1.2重复查询与性能陷阱1.

Python内存优化的实战技巧分享

《Python内存优化的实战技巧分享》Python作为一门解释型语言,虽然在开发效率上有着显著优势,但在执行效率方面往往被诟病,然而,通过合理的内存优化策略,我们可以让Python程序的运行速度提升3... 目录前言python内存管理机制引用计数机制垃圾回收机制内存泄漏的常见原因1. 循环引用2. 全局变

Python多线程应用中的卡死问题优化方案指南

《Python多线程应用中的卡死问题优化方案指南》在利用Python语言开发某查询软件时,遇到了点击搜索按钮后软件卡死的问题,本文将简单分析一下出现的原因以及对应的优化方案,希望对大家有所帮助... 目录问题描述优化方案1. 网络请求优化2. 多线程架构优化3. 全局异常处理4. 配置管理优化优化效果1.

MySQL中优化CPU使用的详细指南

《MySQL中优化CPU使用的详细指南》优化MySQL的CPU使用可以显著提高数据库的性能和响应时间,本文为大家整理了一些优化CPU使用的方法,大家可以根据需要进行选择... 目录一、优化查询和索引1.1 优化查询语句1.2 创建和优化索引1.3 避免全表扫描二、调整mysql配置参数2.1 调整线程数2.

深入解析Java NIO在高并发场景下的性能优化实践指南

《深入解析JavaNIO在高并发场景下的性能优化实践指南》随着互联网业务不断演进,对高并发、低延时网络服务的需求日益增长,本文将深入解析JavaNIO在高并发场景下的性能优化方法,希望对大家有所帮助... 目录简介一、技术背景与应用场景二、核心原理深入分析2.1 Selector多路复用2.2 Buffer

SpringBoot利用树形结构优化查询速度

《SpringBoot利用树形结构优化查询速度》这篇文章主要为大家详细介绍了SpringBoot利用树形结构优化查询速度,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录一个真实的性能灾难传统方案为什么这么慢N+1查询灾难性能测试数据对比核心解决方案:一次查询 + O(n)算法解决