《数学基础》-4.凸优化-4.1.无约束优化

2023-10-20 19:32

本文主要是介绍《数学基础》-4.凸优化-4.1.无约束优化,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

4.1.无约束优化

4.1.1.无约束优化问题

无约束优化问题是机器学习中最普遍、最简单的优化问题。

求最大值也可以 在前面加上负号,变成上面求最小的形式。

求一个函数f(x)的最小值可以对函数f(x)求导并使其等于0(或者说使得梯度▽f(x)等于0),但是很多复杂的函数求导后没法求出解,所以这种方法实际上很少用。

常用梯度下降法、牛顿法或者拟牛顿法求解。

4.1.2.梯度下降法

基于迭代的方法,从某个点开始找很多点,使得这些点满足:,且有,这里表示单位梯度,经常写作,λ表示步长,所以通项是:

实际上λ也不会取很大,一般是

其过程为:

  

梯度下降法的种类:

①批量梯度下降法(BGD)

更新系数时,所有样本都参与计算

优点:需要个很少的迭代次数就可以收敛

缺点:当样本量很大时,更新一次的时间很长

②随机梯度下降法(SGD)

更新系数时,从n个样本中随机选择一个样本参与计算,

优点:更新一次的时间很短,所以大样本时有优势

缺点:会受到每一个样本的影响会很大,不稳定,需要更多的迭代次数才能收敛

③小批量梯度下降法(MBGD)

结合了批量梯度下降法和随机梯度下降法,选择一小部分样本参与计算

例如:

所有的样本都算完,就是一个epoch

4.1.3.牛顿法

求一个函数的最小值可以对函数求导并使其等于0(或者说使得梯度等于0):,把函数的导数看做一个函数,令

牛顿法求的过程也是迭代过程

假设的函数曲线是这个样子,要找到那个的点,先做某个的切线,然后找到切线与x轴相交的点然后再做的切线,以此类推,不断逼近的点。

先来求第一条切线的方程:

令y=0(就是上图中的点)得:

再把带入得:

这是二维的情况,如果是多维的情况:

其中H是海森矩阵,除以海森矩阵就是乘以它的逆矩阵。

为什么这里是海森矩阵?因为的n维向量,是n维向量,二次求导就是海森矩阵。

在机器学习中,要算海森矩阵的逆矩阵很麻烦,于是就引申出了很多种拟牛顿法BFGS(用另外一个矩阵来逼近海森矩阵的逆矩阵)。

 

牛顿法收敛速度

按这个迭代原理,就应该是函数的局部最优点,也就是有最小值,且有要弄明白这个收敛速度,就是要比较下的距离和的距离的区别,由上述结论得:

由于,所以分子加上得:

根据中值定理f(b)−f(a)=(b−a)f′(ξ),a<ξ<b,得:

再利用拉格朗日中值定理得:

ξ是在之间的,所以

由于M的分子分母都是导数,导数都是有界的,所以M是有界的,用表示其上界。

即:

的距离小于1:,则,这里是按照平方的速度进行收敛的,收敛速度更快,注意这里有条件:x的距离小于1,如果距离大于1,上界会越来越大,没法收敛。

 

综上,牛顿法要拟合,不能离最小值太远的地方拟合,越接近极小值再拟合收敛的效果越好。因此可以先用梯度下降,到了局部极小值附近后再用牛顿法。

这篇关于《数学基础》-4.凸优化-4.1.无约束优化的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/249267

相关文章

从基础到高级详解Python数值格式化输出的完全指南

《从基础到高级详解Python数值格式化输出的完全指南》在数据分析、金融计算和科学报告领域,数值格式化是提升可读性和专业性的关键技术,本文将深入解析Python中数值格式化输出的相关方法,感兴趣的小伙... 目录引言:数值格式化的核心价值一、基础格式化方法1.1 三种核心格式化方式对比1.2 基础格式化示例

redis-sentinel基础概念及部署流程

《redis-sentinel基础概念及部署流程》RedisSentinel是Redis的高可用解决方案,通过监控主从节点、自动故障转移、通知机制及配置提供,实现集群故障恢复与服务持续可用,核心组件包... 目录一. 引言二. 核心功能三. 核心组件四. 故障转移流程五. 服务部署六. sentinel部署

从原理到实战解析Java Stream 的并行流性能优化

《从原理到实战解析JavaStream的并行流性能优化》本文给大家介绍JavaStream的并行流性能优化:从原理到实战的全攻略,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的... 目录一、并行流的核心原理与适用场景二、性能优化的核心策略1. 合理设置并行度:打破默认阈值2. 避免装箱

Python实战之SEO优化自动化工具开发指南

《Python实战之SEO优化自动化工具开发指南》在数字化营销时代,搜索引擎优化(SEO)已成为网站获取流量的重要手段,本文将带您使用Python开发一套完整的SEO自动化工具,需要的可以了解下... 目录前言项目概述技术栈选择核心模块实现1. 关键词研究模块2. 网站技术seo检测模块3. 内容优化分析模

Java实现复杂查询优化的7个技巧小结

《Java实现复杂查询优化的7个技巧小结》在Java项目中,复杂查询是开发者面临的“硬骨头”,本文将通过7个实战技巧,结合代码示例和性能对比,手把手教你如何让复杂查询变得优雅,大家可以根据需求进行选择... 目录一、复杂查询的痛点:为何你的代码“又臭又长”1.1冗余变量与中间状态1.2重复查询与性能陷阱1.

Python内存优化的实战技巧分享

《Python内存优化的实战技巧分享》Python作为一门解释型语言,虽然在开发效率上有着显著优势,但在执行效率方面往往被诟病,然而,通过合理的内存优化策略,我们可以让Python程序的运行速度提升3... 目录前言python内存管理机制引用计数机制垃圾回收机制内存泄漏的常见原因1. 循环引用2. 全局变

从基础到进阶详解Python条件判断的实用指南

《从基础到进阶详解Python条件判断的实用指南》本文将通过15个实战案例,带你大家掌握条件判断的核心技巧,并从基础语法到高级应用一网打尽,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一... 目录​引言:条件判断为何如此重要一、基础语法:三行代码构建决策系统二、多条件分支:elif的魔法三、

Python WebSockets 库从基础到实战使用举例

《PythonWebSockets库从基础到实战使用举例》WebSocket是一种全双工、持久化的网络通信协议,适用于需要低延迟的应用,如实时聊天、股票行情推送、在线协作、多人游戏等,本文给大家介... 目录1. 引言2. 为什么使用 WebSocket?3. 安装 WebSockets 库4. 使用 We

Python多线程应用中的卡死问题优化方案指南

《Python多线程应用中的卡死问题优化方案指南》在利用Python语言开发某查询软件时,遇到了点击搜索按钮后软件卡死的问题,本文将简单分析一下出现的原因以及对应的优化方案,希望对大家有所帮助... 目录问题描述优化方案1. 网络请求优化2. 多线程架构优化3. 全局异常处理4. 配置管理优化优化效果1.

MySQL中优化CPU使用的详细指南

《MySQL中优化CPU使用的详细指南》优化MySQL的CPU使用可以显著提高数据库的性能和响应时间,本文为大家整理了一些优化CPU使用的方法,大家可以根据需要进行选择... 目录一、优化查询和索引1.1 优化查询语句1.2 创建和优化索引1.3 避免全表扫描二、调整mysql配置参数2.1 调整线程数2.