5.3 *扩展阅读:静态优化

5.3.1 无约束的静态优化

我们首先给出无约束的静态优化的定义及相关概念。

定义 5.3.1 (无约束的静态优化) 设开集ΩRn非空,f:ΩR目标函数,无约束的静态优化问题是指求解maxxΩf(x)

定义 5.3.2 (最大值点、极大值点、驻点、临界点) xΩ为(全局)最大值点,若xΩ,成立f(x)f(x)

xΩ极大值点,若δ>0使得xB(x,δ),成立f(x)f(x)

xΩ驻点临界点,若fx处可微且f(x)=0

为了求解无约束优化问题,我们需要借助以下定理。这些定理涉及函数的梯度,故称为一阶条件

定理 5.3.3 (一阶必要条件) fx处可微,若xΩf的极大值点(或最大值点),则xf的驻点。

定理 5.3.4 (一阶充分条件) fΩ上凹且可微,xΩf的最大值点当且仅当xf的驻点。

证明 必要性:设x为最大值点(或极大值点),则δ>0使得 f(x)f(x)0,xB(x,δ)fx可微,设x=x+tv(其中t>0v=f(x)f(x)),考虑f沿v的方向导数,有 f(x)=f(x)v=fv(x)=limt0+f(x+tv)f(x)t0f(x)=0

充分性:由fΩ上凹且可微,知 f(x)f(x)+f(x)(xx)=f(x),xΩx为最大值点。

除了利用函数的梯度以外,我们还可以利用函数的Hesse矩阵来求解无约束优化问题,故称为二阶条件

定理 5.3.5 (二阶必要条件) fΩ上二阶连续可微,xΩf的极大值点,则xf的驻点,且Hf(x)半负定。

证明 由于fΩ上二阶连续可微,设δ>0,考虑x的邻域B(x,δ),由Taylor公式可得 f(x)=f(x)+f(x)(xx)+12(xx)THf(ξ)(xx),ξB(x,xx) 由一阶必要条件可得f(x)=0

x=x+tv(其中t>0vRn满足v=1),利用极大值点条件f(x)f(x),上式可改写为 vTHf(ξ)v0,ξB(x,t), vRn, v=1t0+得到vTHf(x)v0;由于v任意,故Hf(x)半负定。

定理 5.3.6 (二阶充分条件) fΩ上二阶连续可微,xΩf的驻点,则当Hf(x)负定时,xf的极大值点。

证明 由于fΩ上二阶连续可微,故δ>0使得Hf(x)B(x,δ)内保持负定2。由Taylor公式可得 f(x)=f(x)+f(x)(xx)+12(xx)THf(ξ)(xx),ξB(x,xx) 利用驻点条件可得f(x)=0;且由于Hf(ξ)负定,故当xx时,有(xx)THf(ξ)(xx)<0,从而 f(x)<f(x),xB(x,δ), xxx为极大值点。

对于带参数的无约束优化问题,我们有以下结论。

定理 5.3.7 (包络定理) f:Ω×RkR,定义f:RkRf(r):=maxxΩf(x,r),且rRkx(r)Ω使得f(r)=f(x(r),r)。若f(x(r),r)处对r可微,且x(r)为内点,则有 frj(r)=frj(x(r),r),j=1,2,,k

证明 考虑一个简单的情形:认为xr处可微3,由链式法则可得 fr(r)=fx(x(r),r)xr(r)+fr(x(r),r)=xf(x(r),r)xr(r)+fr(x(r),r) 由一阶必要条件可得xf(x(r),r)=0,故上式右端第一项为零,得证。

5.3.2 带等式约束的静态优化

定义 5.3.8 (带等式约束的静态优化) 设开集ΩRn非空,f,gi:ΩRi=1,2,,m。带等式约束的静态优化问题是指求解 maxxΩf(x)s.t.gi(x)=0,i=1,2,,m. 其中S={xΩg(x)=0}称为可行域(其元素称为可行解)。

同样地,我们也可以借助一阶必要条件来求解带等式约束的静态优化问题。

定理 5.3.9 (一阶必要条件) f,giΩ上可微,且{gi(x)}i=1m线性无关,若xΩS的内点(以下简称内点xS)且为带等式约束的最大值点,则存在唯一的λiRi=1,2,,m使得 f(x)=i=1mλigi(x)=[gx(x)]Tλ

一阶必要条件的几何意义是:在最大值点处,目标函数f(x)的等值线与约束曲面g(x)=0的等值线相切。

PIC

图 5.3.1: 如果上升方向f(x)与约束曲面的法向λgi(x)不共线,则约束曲面的切平面存在可行方向d使得f增大。

证明u=(x1,x2,,xm)Tv=(xm+1,xm+2,,xn)T。由于{gi(x)}i=1m线性无关,对于曲面g(x)=g(u,v)=0,由隐函数定理可得存在内点x的邻域UShC1使得u=h(v),且有 hv=(gu)1gv 简而言之,在邻域U内,约束曲面可表示为前m个变量关于后nm个变量的函数,nm称为曲面的维度。

此时带等式约束的静态优化转换为无约束静态优化。记F(v)=f(h(v),v),根据一阶必要条件,有 Fv=fuhv+fv=fu(gu)1gv+fv=0λT=fu(gu)1,则 fu=λTgu,fv=λTgvfx=λTgxf=(gx)Tλ

一阶必要条件的重要推论是Lagrange乘子法。

定理 5.3.10 (一阶必要条件) f,giΩ上可微,且{gi(x)}i=1m线性无关,定义Lagrange函数L:Ω×RmRL(x,λ):=f(x)i=1nλigi(x)=f(x)λg(x) 若内点xS为带等式约束的最大值点,则λRm使得(x,λ)L的驻点,即L(x,λ)=0。由于λL(x,λ)=g(x)=0自然成立,故驻点条件可简记为xL(x,λ)=0

同样地,如果函数f,gi满足一定的性质,我们也可以给出一阶充分条件。

定理 5.3.11 (一阶充分条件) (x,λ)满足一阶必要条件,且L(x,λ)关于xS凹,则内点xS为带等式约束的最大值点。

证明L(x,λ)关于xS凹,知 f(x)=L(x,λ)L(x,λ)+xL(x,λ)(xx)=L(x,λ)=f(x),xS 即内点xS为带等式约束的最大值点。

若想仅通过f,gi的性质给出一阶充分条件,需要λRm都有L(x,λ)关于xΩ凹,此时不难发现:

定理 5.3.12 fΩ上可微且凹,gi为线性函数,且(x,λ)满足一阶必要条件,则内点xS为带等式约束的最大值点。

为了给出二阶条件,我们需要先定义约束曲面的切空间

定义 5.3.13 (切空间) 曲面g(x)=0x处的切空间为Tg(x):={dRngi(x)d=0, i=1,2,,m}

定理 5.3.14 Tg(x)=C(xv(v)),其中C表示列空间,v满足x=(h(v),v)

证明 注意到 gx(x)xv(v)=gu(x)hv(v)+gv(x)=0dC(xv(v)),都有gx(x)d=0,即C(xv(v))Tg(x)

另一方面,由于{gi(x)}i=1m线性无关,故rank(gx(x))=m,从而dim(Tg(x))=nm

又由于xv(v)的下(nm)×(nm)子矩阵为单位矩阵,故rank(xv(v))=nm

综上可得dim(C(xv(v)))=rank(xv(v))=dim(Tg(x)),从而Tg(x)=C(xv(v))

An阶对称矩阵。由于Tg(x)=C(xv(v)),故A在切空间Tg(x)上半负定等价于 dT[xv(v)]TA[xv(v)]为 nm 阶半负定矩阵d0,dRnm;xv(v)=((gu(x))1gv(x)Inm) 其余情况(半正定、负定、正定、不定)类同。

定理 5.3.15 (二阶必要条件) f,giΩ上二阶连续可微,L(x,λ):=f(x)λg(x)。若内点xSf限制在g(x)=0上的极大值点,则λRm使得(x,λ)L的驻点,且HxL(x,λ)在切空间Tg(x)上半负定。

证明 将约束曲面表示为u=h(v)。令x(v)=x(v+td)(其中t>0dRnm满足d=1),由xv的连续性可得其在邻域上有界(M,δ>0使得xv(η)MηB(v,δ)内恒成立);再由Taylor公式可得 xx=txv(η)d,ηB(v,t)xxtM 由于LΩ上二阶连续可微,设δ>0λRm,考虑x的邻域B(x,δ),由Taylor公式可得 L(x,λ)=L(x,λ)+xL(x,λ)(xx)+12(xx)THxL(ξ,λ)(xx),ξB(x,tM) 由一阶必要条件可得xL(x,λ)=0

利用极大值点条件f(x)=L(x,λ)L(x,λ)=f(x)可将上式改写为 [xv(η)d]THxL(ξ,λ)[xv(η)d]0,ξB(x,tM), ηB(v,t), dRnm, d=1t0+可得 dT[xv(v)]THxL(x,λ)[xv(v)]d0,dRnm, d=1HxL(x,λ)在切空间Tg(x)上半负定。

定理 5.3.16 (二阶充分条件) f,giΩ上二阶连续可微,L(x,λ):=f(x)λg(x)。若λRm使得(x,λ)L的驻点,且HxL(x,λ)在切空间Tg(x)上负定,则内点xS为此规划的极大值点。

证明 将约束曲面表示为u=h(v)。令x(v)=x(v+td)(其中t>0dRnm满足d=1),由Taylor公式可得 x=x+txv(v)d+t22i=1neidTHxi(η)d,ηB(v,t)Hxi的连续性可得其在邻域上有界(Mi,δ>0使得Hxi(η)MiηB(v,δ)内恒成立),则有 r(v):=xxtxv(v)dr(v)t2M,M=12i=1nMi 由于LΩ上二阶连续可微,故δ>0使得HxL(x,λ)B(x,δ)Tg(x)内保持负定。由Taylor公式可得 L(x,λ)=L(x,λ)+xL(x,λ)(xx)+12(xx)THxL(ξ,λ)(xx),ξB(x,tM) 其中Mxv(v)B(v,δ)内的上界。记HxL(x,λ)B(x,tM)内的上界为L。 利用驻点条件可得xL(x,λ)=0,代入上式可得 L(x,λ)L(x,λ)=t22[xv(v)d]THxL(ξ,λ)[xv(v)d]+tr(v)THxL(ξ,λ)[xv(v)d] +12r(v)THxL(ξ,λ)r(v),ξB(x,tM), vB(v,t) 由于d0xv(v)列满秩,故xv(v)dTg(x){0};再由HxL(ξ,λ)的负定性可得 c(d):=[xv(v)d]THxL(ξ,λ)[xv(v)d]>0 与此同时,由于r(v)t2M,故 r(v)THxL(ξ,λ)[xv(v)d]t2MLM,r(v)THxL(ξ,λ)r(v)t4M2L 因此,当tmin{c3MLM,2c3M2L}时,有 L(x,λ)L(x,λ)t22(c+tMLM+12t2M2L)c6t2<0L(x,λ)<L(x,λ),从而f(x)<f(x)

HxL(x,λ)自身负定,则其在切空间Tg(x)上亦负定。这给了我们一个更简单的二阶充分条件。

同样地,我们也可以给出带等式约束的静态优化问题的包络定理。

定理 5.3.17 (包络定理) 设开集ΩRn非空,f,gi:Ω×RkRi=1,2,,m。定义S(r)={xΩg(x,r)=0}f:RkRf(r):=maxxΩf(x,r),且rRkx(r)S(r)使得f(r)=f(x(r),r)。定义Lagrange函数为 L(x,λ,r):=f(x,r)λg(x,r) x(r)对应的Lagrange乘子为λ(r)。若f(x(r),r)处对r可微,且x(r)S(r)的内点,则有 frj(r)=Lrj(x(r),λ(r),r),j=1,2,,k

证明 类似无约束情形,考虑一个简单的情形:认为x,λr处可微,由链式法则可得 fr(r)=fx(x(r),r)xr(r)+fr(x(r),r) 由一阶必要条件可得xf(x(r),r)=[gx(x(r),r)]Tλ(r),故 fr(r)=λ(r)Tgx(x(r),r)xr(r)+fr(x(r),r) 注意到rRk,恒有g(x(r),r)=0,令对r求导可得 gx(x(r),r)xr(r)+gr(x(r),r)=0gx(x(r),r)xr(r)=gr(x(r),r) 代入上式得 fr(r)=fr(x(r),r)λ(r)Tgr(x(r),r)=Lr(x(r),λ(r),r)

为了进一步探讨λ的含义,我们考虑如下带松弛约束的静态优化问题: maxxΩf(x)s.t.g(x)=cL(x,λ,c)=f(x)λ(g(x)c) 其最优解可记为x(c),对应的Lagrange乘子和最优目标函数值分别记为λ(c)f(c)。由包络定理可得 fc(c)=Lc(x(c),λ(c),c)=λ(c)Tcf(c)=λ(c) 由此可见,Lagrange乘子λ(c)表示目标函数值对约束松弛量c的敏感度,即约束松弛量ci每增加一个单位,目标函数值将增加λi(c)个单位。在经济学中,约束对应资源限制,Lagrange乘子即反映了资源限制对最优值的边际影响,因此也称为影子价格

上述含义为我们提供了另一种计算Lagrange乘子的方法:λ=cf(0),这种思想在后续带不等式约束的静态优化中起到重要作用。

5.3.3 带不等式约束的静态优化

定义 5.3.18 设开集ΩRnf,gi,hj:ΩRi=1,2,,mj=1,2,,l。带不等式约束的静态优化问题是指求解 maxxΩf(x)s.t.{gi(x)0,i=1,2,,mhj(x)=0,j=1,2,,l 可行域S={xΩgi(x)0, hj(x)=0, i=1,2,,m, j=1,2,,l}

我们先定义一些必要的概念。

定义 5.3.19 (起作用约束) 设可行解x0S,考虑某不等式约束gi(x0)0

  • gi(x0)=0,则称gi(x0)0是在x0处的起作用约束
  • gi(x0)<0,则称gi(x0)0是在x0处的不起作用约束

等式约束hj(x0)=0恒为起作用约束。将fx0处的起作用约束下标集记作I(x0)

定义 5.3.20 (上升方向、可行方向) x0S,若d0满足δ>0使得λ(0,δ)f(x0+λd)>f(x0),则称dfx0处的上升方向

d0满足δ>0使得λ(0,δ)x0+λdS,则称dfx0处的可行方向

利用上升方向和可行方向的概念,我们可以给出带不等式约束的静态优化问题的一阶必要条件。

定理 5.3.21 (一阶必要条件) x是极大值点,且为约束曲面h(x)=0正则点,则不存在fx处的上升方向d同时为可行方向,即FGH=

利用Motzkin定理4,可将一阶必要条件代数化。

定理 5.3.22 (Motzkin定理) A,B,C为矩阵、A0,记>()表示逐元素大于(等于),以下两个命题择一成立:

  • Ax>0, Bx0, Cx=0有解x
  • ATy1+BTy2+CTy3=0有解y1,y2,y3,其中y10, y20y10

定理 5.3.23 (一阶必要条件,Fritz John条件) x是极大值点,则存在不全为零的λ00λi0 (iI)μj (j=1,2,,l)使得 λ0f(x)=iIλigi(x)+j=1lμjhj(x)

证明I={i1,i2,,ik},以及 A=(f(x)Tgi1(x)Tgik(x)T),B=0,C=(h1(x)Th2(x)Thl(x)T) 则一阶必要条件可化为 =FGH={dRnAd>0, Bd0, Cd=0} 由Motzkin定理可知,存在y1=(λ0,λi1,,λik)T满足y10y10y3=(μ1,,μl)T使得 ATy1+CTy3=0λ0f(x)=iIλigi(x)+j=1lμjhj(x)

我们不关心λ0=0的情形,因为此时约束条件(的梯度)线性相关,说明可以用较少的约束条件描述可行域。若λ0>0(此时引入正则条件),则可将上式两端同时除以λ0,得到KKT条件。

定理 5.3.24 (一阶必要条件,Karush-Kuhn-Tucker条件) x为正则点,即gi(x),hj(x)线性无关(其中iI(x)j=1,2,,l)。若x是极大值点,则存在λi0 (iI)μj (j=1,2,,l)使得 f(x)=iIλigi(x)+j=1lμjhj(x)

为了将不起作用约束也纳入考虑,我们引入互补松弛条件λigi(x)=0,λi0,i=1,2,,m

综合KKT条件与互补松弛条件,可借助Lagrange乘子法,得到带不等式约束的静态优化问题的一阶必要条件:

定理 5.3.25 (一阶必要条件,Lagrange乘子法·KKT条件) x为正则点,即gi(x),hj(x)线性无关(其中iI(x)j=1,2,,l)。定义 L(x,λ,μ):=f(x)i=1mλigi(x)j=1lμjhj(x) x是极大值点,则存在λi0 (i=1,2,,m)μj (j=1,2,,l)使得xL(x,λ,μ)=0,且成立互补松弛条件: λigi(x)=0,i=1,2,,m

同理,在经济学中,这里的λi,μi也称为影子价格,反映了约束对最优值的边际影响。注意到λi可以是0,对应的不等式约束对最优值没有边际影响,此时约束并不起作用,亦即对应的资源不稀缺,由此得到经典名言——不稀缺的资源无边际价值,有边际价值的资源稀缺

一阶必要条件的几何意义是:在最大值点处,目标函数f(x)的等值线与起作用约束曲面的等值线相切,且f的上升方向与曲面的法向同向。

PIC

图 5.3.2: 如果上升方向f(x)与起作用约束曲面的法向λigi(x)不共线,则切平面存在可行方向d使得f增大;而λi0保证了当f(x)λigi(x)共线时,两者同向,此时f(x)不为可行方向,亦即不存在可行方向使得f增大。

为了给出一阶充分条件,我们需要限制f,gi,hj的性质,由此给出凹规划的概念。

定义 5.3.26 (凹规划) 称以下规划问题为凹规划,若fΩ上凹,giΩ上凸,hj为线性函数。容易证明其可行域S为凸集。 maxxΩf(x)s.t.{gi(x)0,i=1,2,,mhj(x)=0,j=1,2,,l

凹规划并未要求f可微,故f的梯度未必存在。为此,我们引入超梯度的概念:

定义 5.3.27 (超梯度) λRnfx0处的超梯度,若xΩ,成立 f(x)f(x0)λ(xx0)

凹函数的超梯度必定存在。若凹函数fx0处可微,则其超梯度存在且唯一,且为f(x0)

为了证明凹规划的一阶充分条件,我们需要计算出不等式约束对应的Lagrange乘子λ。利用Lagrange乘子的经济学含义,我们考虑对不等式约束进行松弛,考虑如下带参数的凹规划: P(c):maxxΩf(x)s.t.{gi(x)ci,i=1,2,,mhj(x)=0,j=1,2,,l 其中可行域S(c):={xSg(x)c, h(x)=0}满足S(0)。上述规划的最优目标函数f(c)c=0处的(超)梯度λ即为我们需要的Lagrange乘子。为了保证超梯度存在,f的性质需要足够好(如f凹)。

考虑新的目标函数L(x,λ):=f(x)λg(x),即可消除不等式约束,将问题转化为仅含等式约束的静态优化: P:maxxΩL(x)s.t.h(x)=0 如果P的最优解与P(0)的最优解相同,且L的性质足够好(如L关于x凹),则可利用等式约束的静态优化的一阶充分条件,得到凹规划的一阶充分条件。

C:={cRmS(c)},设0C的内点(否则不等式约束退化为等式约束),由此得到下面的定理:

定理 5.3.28

(1)

cC,凹规划P(c)的最优目标函数f(c)存在。

(2)

f凹,故f0处的超梯度λ存在。

(3)

f0处的任意超梯度λ0

(4)

x(c)P(c)的最优解,则成立互补松弛条件λigi(x(0))=0 (i=1,2,,m)

(5)

L(x,λ)关于xΩ凹,故P的一阶充分条件适用。

(6)

P的最优解与P(0)的最优解相同。

证明 (1) S(c)为非空紧集,连续函数在非空紧集上存在最值,故f(c)存在。

(2) 下证f为凹函数,即 f(tc1+(1t)c2)tf(c1)+(1t)f(c2),c1,c2C, t[0,1]t[0,1],记c=tc1+(1t)c2,注意到xk:=x(ck) (k=1,2)满足 g(xk)ck,h(xk)=0,k=1,2 由于g凸、h为线性函数,因此x=tx1+(1t)x2满足 {g(x)tg(x1)+(1t)g(x2)tc1+(1t)c2=ch(x)=th(x1)+(1t)h(x2)=0xS(c) 因此x为凹规划P(c)的可行解,故有 f(c)f(x)tf(x1)+(1t)f(x2)=tf(c1)+(1t)f(c2) 由此表明f为凹函数,其在0处的超梯度λ存在。

(3) 下证λ0,由超梯度的定义可得 f(c)f(0)λc,cCc0C0:=[0,+)m,则 S(0)={xSg(x)0, h(x)=0}{xSg(x)c0, h(x)=0}=S(c0)c0C 亦即与P(0)相比,P(c0)的可行域更大、对应更弱的约束,故f(c0)f(0)。分别取ciC0满足“第i个分量为1,其余分量为0”,则由超梯度的定义可得 0f(ci)f(0)λci=λi,i=1,2,,mλ0

(4) 下证互补松弛条件:λigi(x(0))=0 (i=1,2,,m),只需考虑λi>0的那些不等式约束。由于0C的内点,设δ>0满足δciC,由超梯度的定义可得 f(δci)f(0)λ(δci)=δλi<0f(δci)<f(0)=f(x(0)) 规划P(δci)的最优目标函数值f(δci)<f(x(0)),说明x(0)不为P(δci)的可行解,亦即 x(0)S(δci)δ<gi(x(0))0δ0+gi(x(0))=0λigi(x(0))=0 故互补松弛条件成立。

(5) 下证L(x,λ)关于xΩ凹。设t[0,1],记x=tx1+(1t)x2,利用f凹、gi凸、λi0可得 L(x,λ)=f(x)λg(x)[tf(x1)+(1t)f(x2)]λ[tg(x1)+(1t)g(x2)]=t[f(x1)λg(x1)]+(1t)[f(x2)λg(x2)]=tL(x1,λ)+(1t)L(x2,λ)x1,x2Ω

(6) 下证两个规划的最优解相同。记P的最优解为x,其满足h(x)=0,故xS(g(x)),亦即g(x)C。注意到xP(g(x))的可行解,故有 f(x)f(g(x)) 由超梯度的定义可得 f(g(x))f(0)λg(x) 再由互补松弛条件可得 λg(x(0))=0 因此 f(x)λg(x)f(g(x))λg(x)f(0)=f(x(0))=f(x(0))λg(x(0)) 因此x(0)亦为P的最优解,两个规划的最优解相同。

借助这个定理,我们最终将凹规划转换成带等式约束的静态优化,此时目标函数L(λ,x)关于xΩ还是凹函数,从而得到一阶充分条件:

定理 5.3.29 (凹规划的一阶充分条件·KKT条件) 对于凹规划,设(x,λ)满足互补松弛条件 λigi(x)=0,λi0,i=1,2,,m (x,μ)满足L(x,λ):=f(x)λg(x)的一阶充分条件xL(x,λ,μ)=0,其中 L(x,λ,μ):=L(x,λ)μh(x)=f(x)i=1mλigi(x)j=1lμjhj(x) 则内点x为凹规划的最大值点。换言之,内点x为凹规划的最大值点当且仅当其满足KKT条件。

类似切空间,我们可以定义可行空间的概念,由此给出带不等式约束的静态优化问题的二阶条件。

定义 5.3.30 (可行空间) 约束g(x)0, h(x)=0x处的可行空间T(x)定义为 T(x)={dRn | gi(x)d0,iI(x)hj(x)d=0,j=1,2,,l}=GH{0}

定理 5.3.31 (二阶必要条件) 若内点xS为此规划的极大值点,则(x,λ,μ)满足KKT条件,且HxL(x,λ,μ)T(x)上半负定。

定理 5.3.32 (二阶充分条件) (x,λ,μ)满足KKT条件,且HxL(x,λ,μ)T(x)上负定,则内点xS为此规划的极大值点。

证明留作练习。

最后提一类特殊的规划:拟凹规划,其目标函数为拟凹函数,约束函数为拟凸函数。

定义 5.3.33 (拟凹、拟凸) 称函数f:ΩR拟凹,若x1,x2Ωt[0,1],成立 f(tx1+(1t)x2)min{f(x1),f(x2)} 称函数g:ΩR拟凸,若g为拟凹。

简而言之,拟凹(凸)函数只有一个峰(谷),其上(下)水平集均为凸集。如果拟凹(凸)函数可微,则其梯度满足

定理 5.3.34 (拟凹函数的一阶性质) f:ΩR为可微函数,则f拟凹的充分必要条件为:x1,x2Ω,若f(x2)>f(x1),则 f(x1)(x2x1)>0

拟凹规划的一阶充分条件与凹规划相同。

定理 5.3.35 (拟凹规划的一阶充分条件·KKT条件) fΩ上拟凹,giΩ上拟凸,hj为线性函数,且x为正则点。内点x为拟凹规划的最大值点当且仅当其满足KKT条件。

证明(x,λ,μ)满足KKT条件。xSgi(x)0,则λigi(x)0=λigi(x),由λigi拟凸可得 λigi(x)λigi(x)λigi(x)(xx)0i=1mλigi(x)(xx)0 hj是线性约束,其可以表示为hj(x)=hjx+c,故有 hj(x)=hj(x)=0hj(x)(xx)=0j=1lμjhj(x)(xx)=0 两式相加可得 [i=1mλigi(x)+j=1lμjhj(x)](xx)0 借助KKT条件可得 f(x)(xx)0 假设x不为拟凹规划的最优解,即xS使得f(x)>f(x)。由f的连续、拟凹,vB(0,δ)使得 f(x)>f(x+v)>f(x)f(x)(x+vx)0 因此 0f(x)(xx)f(x)vv=tf(x)t>0足够小,则有f(x)v=tf(x)20f(x)=0,不满足正则条件,故x为拟凹规划的最优解。

5.3.4 静态规划的 Big Picture

优化问题
ray 0gray 0约束条件
ray 0gray 0maxxΩf(x)
ray 0gray 0一阶必要条件
ray 0gray 0x为极值点
ray 0gray 0一阶充分条件
ray 0gray 0一阶必要条件+
ray 0gray 0x最值点
ray 0gray 0二阶必要条件
ray 0gray 0x为极值点
ray 0gray 0一阶必要条件+
ray 0gray 0二阶充分条件
ray 0gray 0一阶必要条件+
ray 0gray 0x为极值点
无约束 —— f(x)=0 f Hf(x)半负定 Hf(x)负定
带等式约束 g(x)=0
ray 0gray 0xL(x,λ)=0
ray 0gray 0L(x,λ)关于x
ray 0gray 0或f凹,gi线性
ray 0gray 0HxL(x,λ)
ray 0gray 0在Tg(x)半负定
ray 0gray 0HxL(x,λ)
ray 0gray 0在Tg(x)负定
带不等式约束
ray 0gray 0g(x)0
ray 0gray 0h(x)=0
ray 0gray 0xL(x,λ,μ)=0
ray 0gray 0λigi(x)=0, λi0
ray 0gray 0拟凹规划
ray 0gray 0f拟凹,gi拟凸,hj线性
ray 0gray 0HxL(x,λ,μ)
ray 0gray 0在T(x)半负定
ray 0gray 0HxL(x,λ,μ)
ray 0gray 0在T(x)负定
表 5.3.1: 静态优化问题的总结

优化问题 Lagrange函数 切空间/可行空间
带等式约束 L(x,λ):=f(x)λg(x) Tg(x):={dRngi(x)d=0, i=1,2,,m}
带不等式约束 L(x,λ,μ):=f(x)λg(x)μh(x) T(x):={dRn | gi(x)d0,iI(x)hj(x)d=0,j=1,2,,l}
表 5.3.2: 带约束优化问题的Lagrange函数与切空间/可行空间

2可以借助顺序余子式判定:Hf(x)负定其顺序余子式的符号负正交替;由于Hf连续,故在某邻域内其顺序余子式的符号保持不变,从而保持负定。

3对于非退化极值点,即Hxf(x,r)可逆的极值点,可以借助隐函数定理由xf(x,r)=0确定可微的x(r)

4参考:http://benisrael.net/M0TZKIN.pdf