二次规划（Lagrange 方法，起作用集方法）

本文主要是介绍二次规划（Lagrange 方法，起作用集方法），希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

二次规划是非线性规划中一种特殊情形，它的目标函数是二次实函数，约束是线性的。由于二次规划比较简单，便于求解，且一些非线性规划可以转化为求解一系列二次规划问题，因此二次规划算法较早引起人们的重视，成为求解非线性规划的一个重要通径。二次规划的算法较多，本章介绍其中几个典型的方法，它们是 Lagrange 方法，起作用集方法，Lemke 方法和路径路踪法。

一、Lagrange 方法

考虑二次规划问题
$\begin{aligned} &\min\quad\quad \dfrac{1}{2} \pmb x^T\pmb H \pmb x + \pmb c^T \pmb x\\[2ex] &\mathrm{ \ s.t.}\quad\quad\ \ \pmb A\pmb x=\pmb b \end{aligned}$

其中， $\pmb H$ 是 $n$ 阶对称矩阵， $\pmb A$ 是 $m\times n$ 矩阵， $\pmb A$ 的秩为 $m$ ， $\pmb b$ 是 $m$ 维列向量。

通过 Lagrange 乘子法求解：首先定义 Language 函数
$L(\pmb x,\pmb\lambda) = \frac{1}{2}\pmb x^T\pmb H \pmb x + \pmb c^T \pmb x - \pmb\lambda^T(\pmb A\pmb x-\pmb b)$

令
$\nabla_xL(\pmb x,\pmb\lambda)=0,\quad\nabla_{\pmb\lambda}L(\pmb x,\pmb\lambda)=0$

得到方程组
$\begin{aligned} &\pmb H\pmb x + \pmb c - \pmb A^T\pmb\lambda=\pmb 0\\[1ex] &-\pmb A\pmb +\pmb b = \pmb 0 \end{aligned}$

将此方程组写成
$\left[ \begin{matrix} \pmb H & - \pmb A^T\\[1ex] -\pmb A & - \pmb 0\\ \end{matrix} \right] \left[ \begin{matrix} \pmb x \\[2ex] \pmb \lambda\\ \end{matrix} \right]= \left[ \begin{matrix} -\pmb c \\[2ex] -\pmb b\\ \end{matrix} \right]$

将系数矩阵称为 Lagrange 矩阵。

设上述 Lagrange 矩阵可逆，且为对称矩阵，则其逆矩阵也为对称矩阵，可表示为
$\left[ \begin{matrix} \pmb H & - \pmb A^T\\[1ex] -\pmb A & - \pmb 0\\ \end{matrix} \right]^{-1}= \left[ \begin{matrix} \pmb Q & - \pmb R^T\\[1ex] -\pmb R & - \pmb S\\ \end{matrix} \right]$

由可逆矩阵性质，即
$\left[ \begin{matrix} \pmb H & - \pmb A^T\\[1ex] -\pmb A & - \pmb 0\\ \end{matrix} \right] \left[ \begin{matrix} \pmb Q & - \pmb R^T\\[1ex] -\pmb R & - \pmb S\\ \end{matrix} \right]=\pmb I_{m+n}$

推得
$\begin{aligned} &\pmb{HQ}+\pmb{A^TR}=\pmb I_n\\[1ex] &\pmb{HR^T}+\pmb(A^TS)=\pmb0_{n\times m}\\[1ex] &\pmb{AQ}=\pmb 0_{m\times n}\\[1ex] &\pmb{AR^T} = \pmb I_m \end{aligned}$

假设矩阵 $\pmb H$ 可逆，则可以得到矩阵 $Q,R,S \pmb{Q,R,S}$ 的表达式
$\begin{aligned} &\pmb{Q}=\pmb H^{-1} - \pmb H^{-1}\pmb A^T(\pmb A\pmb H^{-1}\pmb A^T)^{-1}\pmb A\pmb H^{-1},\\[1ex] &\pmb R = (\pmb A \pmb H^{-1}\pmb A^T)^{-1}\pmb A \pmb H^{-1},\\[1ex] &\pmb S = -(\pmb A \pmb H^{-1}\pmb A^T)^{-1} \end{aligned}$

从而可得问题的解
$\begin{aligned} &\pmb x^\ast = -\pmb{Qc} + \pmb R^T\pmb b\\[1ex] &\pmb \lambda^\ast = \pmb {Rc}-\pmb{Sb} \end{aligned}$

二、起作用集方法

1、起作用集方法的分析推导

考虑具有不等式约束的二次规划问题
$\begin{aligned} &\min\quad\quad f(\pmb x)=\dfrac{1}{2} \pmb x^T\pmb H \pmb x + \pmb c^T \pmb x\\[2ex] &\mathrm{ \ s.t.}\quad\quad\ \ \pmb A\pmb x\geq\pmb b \end{aligned}$

其中， $\pmb H$ 是 $n$ 阶对称正定矩阵， $\pmb A$ 是 $m\times n$ 矩阵， $\pmb A$ 的秩为 $m$ ， $\pmb b$ 是 $m$ 维列向量。

由于不等式约束的存在，不能直接用 Lagrange 方法求解，因此需将它转化为求解等式约束问题。运用起作用集方法，在每次追代中，以已知的可行点为起点，把在该点起作用约束作为等式约束，在此约束下极小化目标函数 $f(\pmb x)$ ，而其余的约束暂且不管。求得新的比较好的可行点后，再重复以上做法，下面加以具体分析。

设在第 $k$ 此迭代中，已知可行点 $x(k) \pmb x^{(k)}$ ，在该点起作用约束指标集用 $I^{(k)}$ 表示。这时需要求解等式约束
$\begin{aligned} &\min\quad\quad f(\pmb x)=\dfrac{1}{2} \pmb x^T\pmb H \pmb x + \pmb c^T \pmb x\\[2ex] &\mathrm{ \ s.t.}\quad\quad\ \ \pmb a^i\pmb x=b_i,\quad i\in I^{(k)} \end{aligned}$

其中 $ai \pmb a^i$ 是矩阵 $\pmb A$ 的第 $i$ 行。

为方便起见，现将坐标原点移至 $x(k) \pmb x^{(k)}$ ，令
$\pmb\delta = \pmb x - \pmb x^{(k)}$

则
$\begin{aligned} f(\pmb x) &=\dfrac{1}{2} (\pmb\delta + \pmb x^{(k)})^T\pmb H (\pmb\delta + \pmb x^{(k)}) + \pmb c^T (\pmb\delta + \pmb x^{(k)})\\[2ex] &=\dfrac{1}{2}\pmb\delta^T\pmb H \pmb\delta + \pmb\delta ^T\pmb H\pmb x^{(k)}+\frac{1}{2}{\pmb x^{(k)}}^T \pmb H\pmb x^{(k)} +\pmb c^T\pmb\delta +\pmb c^T\pmb x^{(k)} \\[2ex] &=\frac{1}{2}\pmb\delta^T\pmb H \pmb\delta +\nabla f(\pmb x^{(k)})^T\pmb\delta + f(\pmb x^{(k)}) \end{aligned}$

于是问题转化为求校正量 $δ(k) \pmb\delta^{(k)}$ 的问题
$\begin{aligned} &\min\quad\quad \frac{1}{2}\pmb\delta^T\pmb H \pmb\delta +\nabla f(\pmb x^{(k)})^T\pmb\delta\\[2ex] &\mathrm{ \ s.t.}\quad\quad\ \ \pmb a^i\pmb\delta=0,\quad i\in I^{(k)} \end{aligned}$

解二次规划，求出最优解 $δ(k) \pmb\delta^{(k)}$ ，然后区别不同情形，决定下面应采取的步骤。

如果 $\pmb x^{(k)} + \pmb\delta^{(k)}$ 是可行点，且 $\pmb\delta^{(k)}\neq\pmb0$ ，则在第 $k + 1$ 次迭代中，已知点取作 $\pmb x^{(k+1)}=\pmb x^{(k)}+\pmb\delta^{(k)}$ 。
如果 $\pmb x^{(k)} + \pmb\delta^{(k)}$ 不是可行点，则沿方向 $\pmb d^{(k)}=\pmb\delta^{(k)}$ 搜索，令
$\pmb x^{(k+1)} = \pmb x^{(k)} + a_k\pmb d^{(k)}$

现在分析怎样确定步长 $a_k$ ，根据保持可行性的要求，其应满足
$\pmb a^i(\pmb x^{(k)} + a_k\pmb d^{(k)})\geq b_i,\quad i\notin I^{(k)}$

由于 $x(k) \pmb x^{(k)}$ 是可行点，即 $\pmb a^i\pmb x^{(k)}\geq b_i$ ，因此
当 $\pmb a^i\pmb d^{(k)}\geq 0$ 时，对于任意非负数 $a_k$ ，上式总成立；
当 $\pmb a^i\pmb d^{(k)}< 0$ 时，只要取正数
$a_k\leq\underbrace{\min\Bigg\lbrace\frac{b_i-\pmb a^i\pmb x^{(k)}}{\pmb a^i\pmb d^{(k)}}\bigg|i\notin I^{(k)},\ \pmb a^i\pmb d^{(k)}<0\Bigg\rbrace}_{\hat a_k}$