实习点滴(8)--收敛优化方法:牛顿法、BFGS算法与L-BFGS算法

2023-12-15 10:38

本文主要是介绍实习点滴(8)--收敛优化方法:牛顿法、BFGS算法与L-BFGS算法,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

        在了解CRF推导与参数估计的时候,会用到收敛优化方法去迭代求解凸优化问题,至此,总结一下我对牛顿法、BFGS算法和L-BFGS算法这三种方法的理解。

     牛顿法:

        方法思想:在现有极小点估计值附近对f(x)做二阶泰勒展开式,进而找到下一个极小点估计值。

        设:xk为当前极小点估计值, 我们要去求这个函数的最值,则二阶泰勒展开式为:

                                 

        若要求极值,则使其倒数等于0,然后得:

                                                             

        从而求得:

                                                                         

        若给定一个初始的x,可以得到一个迭代的格式:

                                                     

        我们扩展到N>1的情况,则得到:

           

        我们称一阶的矩阵为“梯度向量”或者“g矩阵”,二阶的矩阵为“海森矩阵”或者“H矩阵”。

        算法流程:

                           

        优缺点:

        【优点】:

          1、迭代一次就可以求解出最优解

          2、如果初始值选的合适的话,收敛速度快

        【缺点】:

          1、要求函数二阶可微

          2、收敛性和初始值选择依赖性大

          3、计算H矩阵计算量大

     BFGS算法:

        目前求解无约束非线性优化问题最常用的方法之一。

        方法思想:

        设:

                                                                        

        其中,B0一般取单位矩阵,通过迭代,将B接近于极值点。

        用待定系数法,设:

                                                                                             

        再加上以下条件:

                                                                                                            

        则有:

                                                                         

        

          可算出:

                                                                                       

        综上所述,得到:

                                                                                        

        算法流程:

                             

     L-BFGS算法:

        L-BFGS算法是对BFGS算法的一种改进。

        基本思想:不再存储完整的矩阵D,而是春初计算过程中的向量序列s,y;需要矩阵D的时候,利用向量序列s,y的计算来代替,而且,向量序列s,y也不是所有的都存,而是固定存最新的m个,每次计算D时,只利用最新的m个s和m个y


这篇关于实习点滴(8)--收敛优化方法:牛顿法、BFGS算法与L-BFGS算法的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/496154

相关文章

PHP轻松处理千万行数据的方法详解

《PHP轻松处理千万行数据的方法详解》说到处理大数据集,PHP通常不是第一个想到的语言,但如果你曾经需要处理数百万行数据而不让服务器崩溃或内存耗尽,你就会知道PHP用对了工具有多强大,下面小编就... 目录问题的本质php 中的数据流处理:为什么必不可少生成器:内存高效的迭代方式流量控制:避免系统过载一次性

python获取指定名字的程序的文件路径的两种方法

《python获取指定名字的程序的文件路径的两种方法》本文主要介绍了python获取指定名字的程序的文件路径的两种方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要... 最近在做项目,需要用到给定一个程序名字就可以自动获取到这个程序在Windows系统下的绝对路径,以下

JavaScript中的高级调试方法全攻略指南

《JavaScript中的高级调试方法全攻略指南》什么是高级JavaScript调试技巧,它比console.log有何优势,如何使用断点调试定位问题,通过本文,我们将深入解答这些问题,带您从理论到实... 目录观点与案例结合观点1观点2观点3观点4观点5高级调试技巧详解实战案例断点调试:定位变量错误性能分

Python中 try / except / else / finally 异常处理方法详解

《Python中try/except/else/finally异常处理方法详解》:本文主要介绍Python中try/except/else/finally异常处理方法的相关资料,涵... 目录1. 基本结构2. 各部分的作用tryexceptelsefinally3. 执行流程总结4. 常见用法(1)多个e

JavaScript中比较两个数组是否有相同元素(交集)的三种常用方法

《JavaScript中比较两个数组是否有相同元素(交集)的三种常用方法》:本文主要介绍JavaScript中比较两个数组是否有相同元素(交集)的三种常用方法,每种方法结合实例代码给大家介绍的非常... 目录引言:为什么"相等"判断如此重要?方法1:使用some()+includes()(适合小数组)方法2

504 Gateway Timeout网关超时的根源及完美解决方法

《504GatewayTimeout网关超时的根源及完美解决方法》在日常开发和运维过程中,504GatewayTimeout错误是常见的网络问题之一,尤其是在使用反向代理(如Nginx)或... 目录引言为什么会出现 504 错误?1. 探索 504 Gateway Timeout 错误的根源 1.1 后端

从原理到实战解析Java Stream 的并行流性能优化

《从原理到实战解析JavaStream的并行流性能优化》本文给大家介绍JavaStream的并行流性能优化:从原理到实战的全攻略,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的... 目录一、并行流的核心原理与适用场景二、性能优化的核心策略1. 合理设置并行度:打破默认阈值2. 避免装箱

Python实战之SEO优化自动化工具开发指南

《Python实战之SEO优化自动化工具开发指南》在数字化营销时代,搜索引擎优化(SEO)已成为网站获取流量的重要手段,本文将带您使用Python开发一套完整的SEO自动化工具,需要的可以了解下... 目录前言项目概述技术栈选择核心模块实现1. 关键词研究模块2. 网站技术seo检测模块3. 内容优化分析模

Java实现复杂查询优化的7个技巧小结

《Java实现复杂查询优化的7个技巧小结》在Java项目中,复杂查询是开发者面临的“硬骨头”,本文将通过7个实战技巧,结合代码示例和性能对比,手把手教你如何让复杂查询变得优雅,大家可以根据需求进行选择... 目录一、复杂查询的痛点:为何你的代码“又臭又长”1.1冗余变量与中间状态1.2重复查询与性能陷阱1.

Python内存优化的实战技巧分享

《Python内存优化的实战技巧分享》Python作为一门解释型语言,虽然在开发效率上有着显著优势,但在执行效率方面往往被诟病,然而,通过合理的内存优化策略,我们可以让Python程序的运行速度提升3... 目录前言python内存管理机制引用计数机制垃圾回收机制内存泄漏的常见原因1. 循环引用2. 全局变