线性/非线性最小二乘与牛顿/高斯牛顿/LM 原理及算法

本文主要是介绍线性/非线性最小二乘与牛顿/高斯牛顿/LM 原理及算法，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

最小二乘分为线性最小二乘和非线性最小二乘

最小二乘目标函数都是min ||f(x)||²

若f(x) = ax + b，就是线性最小二乘；
若f(x) = ax² + b / ax² + bx 之类的，就是非线性最小二乘；

1. 求解线性最小二乘

【参考】

2. 求解非线性最小二乘

需要用到牛顿法，高斯牛顿法，或者LM法
目标函数都是min F(x) = min ||f(x)||²
求解的时候需要求解的是f(x)的最小值，其实求解的就是f(x)'=0的地方

(1) 牛顿法/高斯梯度下降

牛顿法是将f(x)进行二阶泰勒展开： f(x)=f(x^k)+f’(x^k)(x-x^k)+1/2 f’‘(x^k)(x-x^k)²
因为求解的其实是上式的最小值，也就是求解上式导数为0的值
核心迭代等式：x^k+1 = x^k - f’(x^k)/f’'(x^k)
其中，一阶导f’(x^k)可以看成雅可比矩阵J，二阶导f’'(x^k)可以看成海森矩阵H

算法

给定初值x0
对于第k次迭代，求出一阶导f’(x^k)和二阶导f’'(x^k)
如果f’(x^k)足够小则停止；否则x^k+1=x^k - f’(x^k)/f’'(x^k)，返回2

(2) 高斯牛顿法

这里的f(x)代表的是目标函数F(x)
是将f(x)进行一阶泰勒展开：f(x+dx) = f(x) + J*dx
取得最小值的条件也就是 f(x) + J * dx这个式子对dx的导数为0，
可以求解得到： J^TJ * dx = - J * f(x) ，可以简化为 H dx = g，
刚好利用J^TJ代替H，减少H计算量

算法

求解等式为 J^TJ * dx = - J * f(x)，即增量方程，这里的dx也就是每次需要寻找的变化量

给定初值x0
对于第k次迭代，求出雅可比J(x^k) 和f(x^k)
将以上两值代入，利用方程H dx = g，求解dx
如果dx足够小则停止，否则x^k+1=x^k+dx，返回2

(3) LM法

高斯牛顿本质求解的是x^k+1 = x^k - H^-1 * J(x^k) * f(x^k) 但是H如果非正定，那 H^-1不存在，因此将其加上单位矩阵结局正定问题：（H + kI）dx = g

计算信赖区间 ρ 请添加图片描述
算法

求解等式为 (J^TJ+ μI) dx = -J f(x)，其中J = J(x^k)，f(x) = f(x^k)

给定初值x0
对于第k次迭代，求出雅可比J(x^k) 和f(x^k)
计算ρ，若 ρ > 3/4，则 μ = 2μ；
若 ρ < 1/4，则 μ = 0.5μ；
将J(x^k) ,f(x^k)和 μ代入，利用方程 (H + μI) dx = g，求解dx
如果dx足够小则停止，否则x^k+1=x^k+dx，返回2

参考
https://zhuanlan.zhihu.com/p/556170185?utm_id=0
https://blog.csdn.net/weixin_43763292/article/details/128060801
https://blog.csdn.net/weixin_41869763/article/details/103603089

这篇关于线性/非线性最小二乘与牛顿/高斯牛顿/LM 原理及算法的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

线性/非线性最小二乘与牛顿/高斯牛顿/LM 原理及算法

1. 求解线性最小二乘

2. 求解非线性最小二乘

(1) 牛顿法/高斯梯度下降

(2) 高斯牛顿法

(3) LM法

相关文章

Spring Security 单点登录与自动登录机制的实现原理

在MySQL中实现冷热数据分离的方法及使用场景底层原理解析

从原理到实战深入理解Java 断言assert

Java中的雪花算法Snowflake解析与实践技巧

MySQL中的表连接原理分析

深度解析Spring AOP @Aspect 原理、实战与最佳实践教程

Java Stream的distinct去重原理分析

Spring @Scheduled注解及工作原理

Spring Boot 实现 IP 限流的原理、实践与利弊解析

Python中使用uv创建环境及原理举例详解

线性/非线性最小二乘 与 牛顿/高斯牛顿/LM 原理及算法

1. 求解线性最小二乘

2. 求解非线性最小二乘

(1) 牛顿法/高斯梯度下降

(2) 高斯牛顿法

(3) LM法

相关文章

线性/非线性最小二乘与牛顿/高斯牛顿/LM 原理及算法