最优化理论分析复习--最优性条件(一)

2024-01-09 01:28

本文主要是介绍最优化理论分析复习--最优性条件(一),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

  • 上一篇
  • 无约束问题的极值条件
  • 约束极值问题的最优性条件
  • 基本概念
    • 只有不等式约束时
  • 下一篇

上一篇

最优化理论复习–对偶单纯形方法及灵敏度分析

无约束问题的极值条件

由于是拓展到向量空间 R n R^n Rn, 所以可由高数中的极值条件进行类比

  1. 一阶必要条件
    设函数 f ( x ) f(x) f(x) 在点 x ˉ \bar{x} xˉ 处可微, 若 x ˉ \bar{x} xˉ 是局部极小点,则 ▽ f ( x ˉ ) = 0 \bigtriangledown f(\bar{x}) = 0 f(xˉ)=0
    类比于若 x ˉ \bar{x} xˉ 是极小值点则 f ′ ( x ˉ ) = 0 f'(\bar{x}) = 0 f(xˉ)=0

  2. 二阶必要条件
    f ( x ) f(x) f(x) x ˉ \bar{x} xˉ 处二阶可微,若 x ˉ \bar{x} xˉ 是局部极小点, 则 ▽ f ( x ˉ ) = 0 \bigtriangledown f(\bar{x}) = 0 f(xˉ)=0, 且 H e s s i a n Hessian Hessian 矩阵 ▽ 2 f ( x ˉ ) \bigtriangledown^2f(\bar{x}) 2f(xˉ) 是半正定的。
    类比于 若 x ˉ \bar{x} xˉ是极小值点则 f ′ ( x ˉ ) = 0 , 且 f ′ ′ ( x ˉ ) ≥ 0 f'(\bar{x}) = 0, 且 f''(\bar{x}) \geq 0 f(xˉ)=0,f(xˉ)0

  3. 二阶充分条件
    设函数 f ( x ) f(x) f(x) 在点 x ˉ \bar{x} xˉ 处二次可微,若梯度 ▽ f ( x ˉ ) = 0 \bigtriangledown f(\bar{x}) = 0 f(xˉ)=0, 且 H e s s i a n Hessian Hessian 矩阵 ▽ 2 f ( x ˉ ) 正 定 \bigtriangledown^2f(\bar{x})正定 2f(xˉ), 则 x ˉ \bar{x} xˉ是严格局部极小点。
    类比于 f ′ ( x ˉ ) = 0 , f ′ ′ ( x ˉ ) > 0 f'(\bar{x}) = 0, f''(\bar{x}) > 0 f(xˉ)=0,f(xˉ)>0 x ˉ \bar{x} xˉ 是极小值点

  4. 充要条件
    f ( x ) f(x) f(x) 是定义在 R n R^n Rn 上的可微凸函数 x ˉ ∈ R n \bar{x} \in R^n xˉRn, 则 x ˉ \bar{x} xˉ 为整体极小点的充要条件是 ▽ f ( x ˉ ) = 0 \bigtriangledown f(\bar{x}) = 0 f(xˉ)=0
    注:如果 f ( x ) f(x) f(x) 是严格凸的,则全局极小点是唯一的。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

约束极值问题的最优性条件

基本概念

定义: 对 m i n f ( x ) min f(x) minf(x), 设 x ˉ ∈ R n \bar{x} \in R^n xˉRn 是任给一点, d ≠ 0 d \not = 0 d=0, 若存在 δ > 0 \delta > 0 δ>0, 使得对任意的 λ ∈ ( 0 , δ ) \lambda \in (0, \delta) λ(0,δ), 有 f ( x ˉ + λ d ) < f ( x ˉ ) f (\bar{x} + \lambda d) < f(\bar{x}) f(xˉ+λd)<f(xˉ), 则称 d d d f ( x ) f(x) f(x) 在点 x ˉ \bar{x} xˉ 处的下降方向。

  1. 引理: 设函数 f ( x ) f(x) f(x) 在点 x ˉ \bar{x} xˉ 可微, 若存在 d ≠ 0 d \not = 0 d=0, 使得 ▽ f ( x ˉ ) T d < 0 \bigtriangledown f(\bar{x})^T d < 0 f(xˉ)Td<0, 则存在 δ > 0 \delta > 0 δ>0, 是使得对 ∀ λ ∈ ( 0 , δ ) \forall \lambda \in (0, \delta) λ(0,δ), 有 f ( x ˉ + λ d ) < f ( x ˉ ) f(\bar{x} + \lambda d)<f(\bar{x}) f(xˉ+λd)<f(xˉ)
    与梯度方向成钝角的方向是下降方向
    表示为
    F 0 = { d ∣ ▽ f ( x ˉ ) T d < 0 } F_0 = \{ d | \bigtriangledown f(\bar{x})^T d < 0\} F0={df(xˉ)Td<0}

  2. 定义: 设集合 S ⊂ R n , x ˉ ∈ c l S . S \subset R^n, \bar{x} \in clS. SRn,xˉclS., d d d 为非零向量, 若存在数 δ > 0 \delta > 0 δ>0, 使得对任意 λ ∈ ( 0 , δ ) , \lambda \in (0, \delta), λ(0,δ), 都有 x ˉ + λ d ∈ S \bar{x} + \lambda d \in S xˉ+λdS 则称 d d d 为集合 S S S x ˉ \bar{x} xˉ 的可行方向。
    就是移动方向在可行域内
    表示为 D = { d ∣ d ≠ 0 , x ˉ ∈ c l S , ∃ δ > 0 , ∀ λ ∈ ( 0 , δ ) , 有 x ˉ + λ d ∈ S } D = \{ d | d \not = 0, \bar{x} \in clS, \exists \delta > 0, \forall \lambda \in (0, \delta), 有 \bar{x} + \lambda d \in S \} D={dd=0,xˉclS,δ>0,λ(0,δ),xˉ+λdS}
    x ˉ 处 的 可 行 方 向 锥 \bar{x} 处的可行方向锥 xˉ

  3. 定义: 若问题的可行点 x ˉ \bar{x} xˉ 是某个不等式约束 g i ( x ) ≥ 0 g_i(x) \geq 0 gi(x)0 变成等式, 则该不等式约束称为关于可行点 x ˉ \bar{x} xˉ 的起作用约束; 否则称为不起作用约束。
    表示为
    I = { i ∣ g i ( x ˉ = 0 , x ˉ ∈ S ) } I = \{ i| g_i(\bar{x} = 0, \bar{x} \in S) \} I={igi(xˉ=0,xˉS)}

  4. 定义:在起作用约束作对应切线,获得对应梯度,与这两个梯度同时呈锐角的方向为积极约束的可行方向。
    表示为 G 0 = { d ∣ ▽ g i ( x ˉ ) T d > 0 , i ∈ I ( x ) } G_0 = \{d | \bigtriangledown g_i(\bar{x})^T d > 0, i \in I(x) \} G0={dgi(xˉ)Td>0,iI(x)}
    即由约束条件求出的可行方向
    G 0 ⊂ D G_0 \subset D G0D
    问题标准形式:
    m i n f ( x ) \ \ \ \ \ \ \ \ min f(x)         minf(x)

s . t . { g i ( x ) ≥ 0 , 不 等 式 约 束 h j ( x ) = 0 , 等 式 约 束 x ∈ R n s.t.\left \{\begin{matrix} g_i (x) \geq 0,不等式约束 \\ \\h_j(x) = 0,等式约束 \\ \\ x \in R^n \end {matrix} \right. s.t.gi(x)0hj(x)=0xRn

几何最优性条件:设 S S S R n R^n Rn 的非空集合, x ˉ ∈ S , f ( x ) \bar{x} \in S, f(x) xˉS,f(x) x ˉ \bar{x} xˉ 处可微, 若 x ˉ \bar{x} xˉ 是局部最优解, 则 F 0 ∩ D = ∅ F_0 \cap D = \emptyset F0D=
即所有的可行方向都是上升方向

只有不等式约束时

由于 G 0 ⊂ D G_0 \subset D G0D 所以也有 F 0 ∩ G 0 = ∅ F_0 \cap G_0 = \emptyset F0G0=,可行域之内不能有空洞

  • (F-J条件) 设 x ˉ ∈ S , I = { i ∣ g i ( x ˉ ) = 0 } , f ( x ) , g i ( x ) ( i ∈ I ) \bar{x} \in S, I = \{ i | g_i(\bar{x}) = 0\}, f(x), g_i(x) (i \in I) xˉS,I={igi(xˉ)=0},f(x),gi(x)(iI) x ˉ \bar{x} xˉ 处可微, g i ( x ) ( i ∉ I ) g_i(x) (i \notin I) gi(x)(i/I) x ˉ \bar{x} xˉ 处连续, 若 x ˉ \bar{x} xˉ 是问题的最优解,则存在不全为零的数 w 0 , w i ( i ∈ I ) w_0, w_i (i \in I) w0,wi(iI) 使得
    w 0 ▽ f ( x ˉ ) − ∑ i ∈ I w i ▽ g i ( x ˉ ) = 0 w_0 \bigtriangledown f(\bar{x}) - \sum\limits_{i \in I} w_i \bigtriangledown g_i(\bar{x}) = 0 w0f(xˉ)iIwigi(xˉ)=0
    x ˉ \bar{x} xˉ F − J F-J FJ
    为必要条件,极小值点一定是 F-J点, 但 F-J点不一定为极小值点

在这里插入图片描述

在这里插入图片描述
w 0 = 0 w_0 = 0 w0=0 是另外另个约束条件的梯度必须能相互抵消,这种情况才有最优解,因此更多的是关注 w 0 ≠ 0 w_0 \not = 0 w0=0的情况

  • (KKT条件) 设 x ˉ ∈ S \bar{x} \in S xˉS , f , g i ( i ∈ I ) 在 x ˉ 处 可 微 , g i ( i ∉ I ) 在 x ˉ 连 续 f, g_i(i \in I)在\bar{x} 处可微, g_i(i \notin I) 在\bar{x}连续 f,gi(iI)xˉ,gi(i/I)xˉ(保证无空洞), { ▽ g i ( x ˉ ) ∣ i ∈ I } 线 性 无 关 \{ \bigtriangledown g_i(\bar{x}) | i \in I\} 线性无关 {gi(xˉ)iI}线, 若 x ˉ \bar{x} xˉ 是局部最优解, 则存在非负数 w i , i ∈ I , w_i, i \in I, wi,iI, 使得
    ▽ f ( x ˉ ) − ∑ i ∈ I w i ▽ g i ( x ˉ ) = 0 \bigtriangledown f(\bar{x}) - \sum\limits_{i \in I} w_i \bigtriangledown g_i(\bar{x}) = 0 f(xˉ)iIwigi(xˉ)=0

在这里插入图片描述
凸规划的判别方法:

  1. 可行域是凸集, 目标函数是凸函数
  2. 可行域是 ≥ \geq 的凹函数, 目标函数是凸函数

求KKT点

  • KKT条件的另一种表述
    x ˉ ∈ S \bar{x} \in S xˉS , f , g i ( i ∈ I ) 在 x ˉ f, g_i(i \in I)在\bar{x} f,gi(iI)xˉ 处可微, { ▽ g i ( x ˉ ) ∣ i ∈ I } 线 性 无 关 \{ \bigtriangledown g_i(\bar{x}) | i \in I\}线性无关 {gi(xˉ)iI}线, 若 x ˉ \bar{x} xˉ 是局部最优解, 则存在非负数 w i , i = 1 , 2... m w_i, i =1,2...m wi,i=1,2...m 使得
    { ▽ f ( x ˉ ) − ∑ i = 1 m w i ▽ g i ( x ˉ ) = 0 ( 没 要 求 对 应 的 g i ( x ) 为 约 束 条 件 ) w i g i ( x ˉ ) = 0 , i = 1 , 2... m ( 互 补 松 弛 条 件 ) w i ≥ 0 i = 1 , 2... m \left \{\begin{matrix} \bigtriangledown f(\bar{x}) - \sum\limits_{i = 1}^{m} w_i \bigtriangledown g_i(\bar{x}) = 0(没要求对应的g_i(x)为约束条件) \\ \\w_ig_i(\bar{x}) = 0, i = 1, 2...m (互补松弛条件) \\ \\ w_i \geq 0 i = 1,2...m \end {matrix} \right. f(xˉ)i=1mwigi(xˉ)=0(gi(x))wigi(xˉ)=0,i=1,2...mwi0i=1,2...m

通过这个表述方式,加上原来的约束然后将所有的方程列出来求解
在这里插入图片描述
在这里插入图片描述
有人会算的话请留言,感谢

下一篇

最优化理论复习–最优性条件(二)

这篇关于最优化理论分析复习--最优性条件(一)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/585491

相关文章

从基础到进阶详解Python条件判断的实用指南

《从基础到进阶详解Python条件判断的实用指南》本文将通过15个实战案例,带你大家掌握条件判断的核心技巧,并从基础语法到高级应用一网打尽,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一... 目录​引言:条件判断为何如此重要一、基础语法:三行代码构建决策系统二、多条件分支:elif的魔法三、

Android 缓存日志Logcat导出与分析最佳实践

《Android缓存日志Logcat导出与分析最佳实践》本文全面介绍AndroidLogcat缓存日志的导出与分析方法,涵盖按进程、缓冲区类型及日志级别过滤,自动化工具使用,常见问题解决方案和最佳实... 目录android 缓存日志(Logcat)导出与分析全攻略为什么要导出缓存日志?按需过滤导出1. 按

Linux中的HTTPS协议原理分析

《Linux中的HTTPS协议原理分析》文章解释了HTTPS的必要性:HTTP明文传输易被篡改和劫持,HTTPS通过非对称加密协商对称密钥、CA证书认证和混合加密机制,有效防范中间人攻击,保障通信安全... 目录一、什么是加密和解密?二、为什么需要加密?三、常见的加密方式3.1 对称加密3.2非对称加密四、

MySQL中读写分离方案对比分析与选型建议

《MySQL中读写分离方案对比分析与选型建议》MySQL读写分离是提升数据库可用性和性能的常见手段,本文将围绕现实生产环境中常见的几种读写分离模式进行系统对比,希望对大家有所帮助... 目录一、问题背景介绍二、多种解决方案对比2.1 原生mysql主从复制2.2 Proxy层中间件:ProxySQL2.3

python使用Akshare与Streamlit实现股票估值分析教程(图文代码)

《python使用Akshare与Streamlit实现股票估值分析教程(图文代码)》入职测试中的一道题,要求:从Akshare下载某一个股票近十年的财务报表包括,资产负债表,利润表,现金流量表,保存... 目录一、前言二、核心知识点梳理1、Akshare数据获取2、Pandas数据处理3、Matplotl

python panda库从基础到高级操作分析

《pythonpanda库从基础到高级操作分析》本文介绍了Pandas库的核心功能,包括处理结构化数据的Series和DataFrame数据结构,数据读取、清洗、分组聚合、合并、时间序列分析及大数据... 目录1. Pandas 概述2. 基本操作:数据读取与查看3. 索引操作:精准定位数据4. Group

MySQL中EXISTS与IN用法使用与对比分析

《MySQL中EXISTS与IN用法使用与对比分析》在MySQL中,EXISTS和IN都用于子查询中根据另一个查询的结果来过滤主查询的记录,本文将基于工作原理、效率和应用场景进行全面对比... 目录一、基本用法详解1. IN 运算符2. EXISTS 运算符二、EXISTS 与 IN 的选择策略三、性能对比

MySQL 内存使用率常用分析语句

《MySQL内存使用率常用分析语句》用户整理了MySQL内存占用过高的分析方法,涵盖操作系统层确认及数据库层bufferpool、内存模块差值、线程状态、performance_schema性能数据... 目录一、 OS层二、 DB层1. 全局情况2. 内存占js用详情最近连续遇到mysql内存占用过高导致

深度解析Nginx日志分析与499状态码问题解决

《深度解析Nginx日志分析与499状态码问题解决》在Web服务器运维和性能优化过程中,Nginx日志是排查问题的重要依据,本文将围绕Nginx日志分析、499状态码的成因、排查方法及解决方案展开讨论... 目录前言1. Nginx日志基础1.1 Nginx日志存放位置1.2 Nginx日志格式2. 499

Olingo分析和实践之EDM 辅助序列化器详解(最佳实践)

《Olingo分析和实践之EDM辅助序列化器详解(最佳实践)》EDM辅助序列化器是ApacheOlingoOData框架中无需完整EDM模型的智能序列化工具,通过运行时类型推断实现灵活数据转换,适用... 目录概念与定义什么是 EDM 辅助序列化器?核心概念设计目标核心特点1. EDM 信息可选2. 智能类