实习点滴(8)--收敛优化方法:牛顿法、BFGS算法与L-BFGS算法

2023-12-15 10:38

本文主要是介绍实习点滴(8)--收敛优化方法:牛顿法、BFGS算法与L-BFGS算法,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

        在了解CRF推导与参数估计的时候,会用到收敛优化方法去迭代求解凸优化问题,至此,总结一下我对牛顿法、BFGS算法和L-BFGS算法这三种方法的理解。

     牛顿法:

        方法思想:在现有极小点估计值附近对f(x)做二阶泰勒展开式,进而找到下一个极小点估计值。

        设:xk为当前极小点估计值, 我们要去求这个函数的最值,则二阶泰勒展开式为:

                                 

        若要求极值,则使其倒数等于0,然后得:

                                                             

        从而求得:

                                                                         

        若给定一个初始的x,可以得到一个迭代的格式:

                                                     

        我们扩展到N>1的情况,则得到:

           

        我们称一阶的矩阵为“梯度向量”或者“g矩阵”,二阶的矩阵为“海森矩阵”或者“H矩阵”。

        算法流程:

                           

        优缺点:

        【优点】:

          1、迭代一次就可以求解出最优解

          2、如果初始值选的合适的话,收敛速度快

        【缺点】:

          1、要求函数二阶可微

          2、收敛性和初始值选择依赖性大

          3、计算H矩阵计算量大

     BFGS算法:

        目前求解无约束非线性优化问题最常用的方法之一。

        方法思想:

        设:

                                                                        

        其中,B0一般取单位矩阵,通过迭代,将B接近于极值点。

        用待定系数法,设:

                                                                                             

        再加上以下条件:

                                                                                                            

        则有:

                                                                         

        

          可算出:

                                                                                       

        综上所述,得到:

                                                                                        

        算法流程:

                             

     L-BFGS算法:

        L-BFGS算法是对BFGS算法的一种改进。

        基本思想:不再存储完整的矩阵D,而是春初计算过程中的向量序列s,y;需要矩阵D的时候,利用向量序列s,y的计算来代替,而且,向量序列s,y也不是所有的都存,而是固定存最新的m个,每次计算D时,只利用最新的m个s和m个y


这篇关于实习点滴(8)--收敛优化方法:牛顿法、BFGS算法与L-BFGS算法的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/496154

相关文章

MyBatis-Plus通用中等、大量数据分批查询和处理方法

《MyBatis-Plus通用中等、大量数据分批查询和处理方法》文章介绍MyBatis-Plus分页查询处理,通过函数式接口与Lambda表达式实现通用逻辑,方法抽象但功能强大,建议扩展分批处理及流式... 目录函数式接口获取分页数据接口数据处理接口通用逻辑工具类使用方法简单查询自定义查询方法总结函数式接口

MySQL深分页进行性能优化的常见方法

《MySQL深分页进行性能优化的常见方法》在Web应用中,分页查询是数据库操作中的常见需求,然而,在面对大型数据集时,深分页(deeppagination)却成为了性能优化的一个挑战,在本文中,我们将... 目录引言:深分页,真的只是“翻页慢”那么简单吗?一、背景介绍二、深分页的性能问题三、业务场景分析四、

JAVA中安装多个JDK的方法

《JAVA中安装多个JDK的方法》文章介绍了在Windows系统上安装多个JDK版本的方法,包括下载、安装路径修改、环境变量配置(JAVA_HOME和Path),并说明如何通过调整JAVA_HOME在... 首先去oracle官网下载好两个版本不同的jdk(需要登录Oracle账号,没有可以免费注册)下载完

Linux进程CPU绑定优化与实践过程

《Linux进程CPU绑定优化与实践过程》Linux支持进程绑定至特定CPU核心,通过sched_setaffinity系统调用和taskset工具实现,优化缓存效率与上下文切换,提升多核计算性能,适... 目录1. 多核处理器及并行计算概念1.1 多核处理器架构概述1.2 并行计算的含义及重要性1.3 并

Java中读取YAML文件配置信息常见问题及解决方法

《Java中读取YAML文件配置信息常见问题及解决方法》:本文主要介绍Java中读取YAML文件配置信息常见问题及解决方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要... 目录1 使用Spring Boot的@ConfigurationProperties2. 使用@Valu

Java 方法重载Overload常见误区及注意事项

《Java方法重载Overload常见误区及注意事项》Java方法重载允许同一类中同名方法通过参数类型、数量、顺序差异实现功能扩展,提升代码灵活性,核心条件为参数列表不同,不涉及返回类型、访问修饰符... 目录Java 方法重载(Overload)详解一、方法重载的核心条件二、构成方法重载的具体情况三、不构

SQL中如何添加数据(常见方法及示例)

《SQL中如何添加数据(常见方法及示例)》SQL全称为StructuredQueryLanguage,是一种用于管理关系数据库的标准编程语言,下面给大家介绍SQL中如何添加数据,感兴趣的朋友一起看看吧... 目录在mysql中,有多种方法可以添加数据。以下是一些常见的方法及其示例。1. 使用INSERT I

Python中反转字符串的常见方法小结

《Python中反转字符串的常见方法小结》在Python中,字符串对象没有内置的反转方法,然而,在实际开发中,我们经常会遇到需要反转字符串的场景,比如处理回文字符串、文本加密等,因此,掌握如何在Pyt... 目录python中反转字符串的方法技术背景实现步骤1. 使用切片2. 使用 reversed() 函

Python中将嵌套列表扁平化的多种实现方法

《Python中将嵌套列表扁平化的多种实现方法》在Python编程中,我们常常会遇到需要将嵌套列表(即列表中包含列表)转换为一个一维的扁平列表的需求,本文将给大家介绍了多种实现这一目标的方法,需要的朋... 目录python中将嵌套列表扁平化的方法技术背景实现步骤1. 使用嵌套列表推导式2. 使用itert

Python使用pip工具实现包自动更新的多种方法

《Python使用pip工具实现包自动更新的多种方法》本文深入探讨了使用Python的pip工具实现包自动更新的各种方法和技术,我们将从基础概念开始,逐步介绍手动更新方法、自动化脚本编写、结合CI/C... 目录1. 背景介绍1.1 目的和范围1.2 预期读者1.3 文档结构概述1.4 术语表1.4.1 核