【整理】深入理解拉格朗日乘子法（Lagrange Multiplier) 和KKT条件

mo-wang 2021-12-20 原文

　　在求解最优化问题中，拉格朗日乘子法（Lagrange Multiplier）和KKT（Karush Kuhn Tucker）条件是两种最常用的方法。在有等式约束时使用拉格朗日乘子法，在有不等约束时使用KKT条件。

　　我们这里提到的最优化问题通常是指对于给定的某一函数，求其在指定作用域上的全局最小值(因为最小值与最大值可以很容易转化，即最大值问题可以转化成最小值问题)。提到KKT条件一般会附带的提一下拉格朗日乘子。对学过高等数学的人来说比较拉格朗日乘子应该会有些印象。二者均是求解最优化问题的方法，不同之处在于应用的情形不同。

一般情况下，最优化问题会碰到一下三种情况：

（1）无约束条件

　　这是最简单的情况，解决方法通常是函数对变量求导，令求导函数等于0的点可能是极值点。将结果带回原函数进行验证即可。

（2）等式约束条件

设目标函数为f(x)，约束条件为h_k(x)，形如:

　　s.t. 表示subject to ，“受限于”的意思，l表示有l个约束条件。

　　　　　　　　

　　　则解决方法是消元法或者拉格朗日法。消元法比较简单不在赘述，这里主要讲拉格朗日法，因为后面提到的KKT条件是对拉格朗日乘子法的一种泛化。

　　　例如给定椭球:

　　　　　　　　　　

　　求这个椭球的内接长方体的最大体积。这个问题实际上就是条件极值问题，即在条件下，求的最大值。

　　当然这个问题实际可以先根据条件消去 z (消元法)，然后带入转化为无条件极值问题来处理。但是有时候这样做很困难，甚至是做不到的，这时候就需要用拉格朗日乘数法了。

　　首先定义拉格朗日函数F(x)：

　　　　　　　　（其中λk是各个约束条件的待定系数。）

然后解变量的偏导方程：

　　　　……,

　　　如果有l个约束条件，就应该有l+1个方程。求出的方程组的解就可能是最优化值（高等数学中提到的极值），将结果带回原方程验证就可得到解。

　　　回到上面的题目，通过拉格朗日乘数法将问题转化为

　　　　

　　　对求偏导得到

　　　

　　　联立前面三个方程得到和，带入第四个方程解之

　　　　

　　　带入解得最大体积为：

　　　　

　　　至于为什么这么做可以求解最优化？维基百科上给出了一个比较好的直观解释。

　举个二维最优化的例子：

　　　　 min f(x,y)

　　　　　 s.t. g(x,y) = c

　这里画出z=f(x,y)的等高线（函数登高线定义见百度百科）：

　　　　　　　　　　　　　　　　　　　　

绿线标出的是约束

　　如果我们对约束也求梯度∇g(x,y)，则其梯度如图中绿色箭头所示。很容易看出来，要想让目标函数f(x,y)的等高线和约束相切，则他们切点的梯度一定在一条直线上(f和g的斜率平行)。

　　也即在最优化解的时候：∇f(x,y)=λ（∇g(x,y)-C) （其中f(x)的梯度 = λ* g(x)的梯度，λ是常数,可以是任何非0实数，表示左右两边同向。）

即：

　　那么拉格朗日函数： F(x,y)=f(x,y)+λ(g(x,y)−c) 在达到极值时与

　　简单的说，在F(x,λ)取得最优化解的时候，即F(x,λ)取极值（导数为0，▽[f(x,y)+λ(g(x,y)−c)]=0）的时候，f(x)与g(x) 梯度共线，此时就是在条件约束g(x)下，f(x)的最优化解。

（3）不等式约束条件

设目标函数f(x)，不等式约束为g(x)，有的教程还会添加上等式约束条件h(x)。此时的约束优化问题描述如下：

　　　　　　　　

则我们定义不等式约束下的拉格朗日函数L，则L表达式为：

　　　　　　　　

其中f(x)是原目标函数，hj(x)是第j个等式约束条件，λj是对应的约束系数，gk是不等式约束，uk是对应的约束系数。

　　常用的方法是KKT条件，同样地，把所有的不等式约束、等式约束和目标函数全部写为一个式子L(a, b, x)= f(x) + a*g(x)+b*h(x)，

　　KKT条件是说最优值必须满足以下条件：

　　　　1）L(a, b, x)对x求导为零；

　　　　2）h(x) =0;

　　　　3）a*g(x) = 0;

　　求取这些等式之后就能得到候选最优值。其中第三个式子非常有趣，因为g(x)<=0，如果要满足这个等式，必须a=0或者g(x)=0. 这是SVM的很多重要性质的来源，如支持向量的概念。

　　接下来主要介绍KKT条件，推导及应用。详细推导过程如下：

参考：

　　【1】拉格朗日乘数法

　　【2】KKT条件介绍

　　【3】深入理解拉格朗日乘子法（Lagrange Multiplier) 和KKT条件

　　【4】拉格朗日乘子法和KKT条件

版权声明：本文为mo-wang原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://www.cnblogs.com/mo-wang/p/4775548.html

【整理】深入理解拉格朗日乘子法（Lagrange Multiplier) 和KKT条件的更多相关文章

拉格朗日乘子法（Lagrange Multiplier) 和KKT条件
参考文献：https://www.cnblogs.com/sddai/p/5728195.html 在求解最优 […]...
深入理解拉格朗日乘子法（Lagrange Multiplier) 和KKT条件
在求取有约束条件的优化问题时，拉格朗日乘子法（Lagrange Multiplier) 和KKT条件是非常重要 […]...
深入理解拉格朗日乘子法（Lagrange Multiplier) 和KKT条件【整理】
　　在求解最优化问题中，拉格朗日乘子法（Lagrange Multiplier）和KKT（Karush Kuh […]...

随机推荐

WeakHashMap
WeakHashMap 今天在阅读《Effective Java》的【消除过期的对象引用】一章中，讲到了Wea […]...
剑指 Offer 09. 用两个栈实现队列
剑指 Offer 09. 用两个栈实现队列用两个栈实现一个队列。队列的声明如下，请实现它的两个函数 appe […]...
用户信息不同步的问题 – joe
用户信息不同步的问题今日遇到一个怪问题：我在AD改了某个用户的姓名，然后在SSP同步一次用户信息 […]...
layout_gravity
layout_gravity——当前View，本身，在父一级的控件所分配的显示范围内的，对齐方式常用在： […]...
C# GDI基础
处理图形包括两个步骤：创建Graphics对象。使用Graphics对象绘制线条和形状、呈现文本或显示与操 […]...
tomcat下载与安装
https://www.cnblogs.com/limn/p/9358657.html...
SQL触发器实例(下)
SQL触发器实例(下) 1 基本语法: 2 Create Trigger [TriggerName] 3 ON […]...
Java容器知识总结
剖析面试最常见问题之Java集合框架说说List,Set,Map三者的区别？ List(对付顺序的好帮手)： […]...

展开目录

目录导航