资源描述
3.目标均衡
精品资料
3.目标均衡
所谓目标均衡是指给定经济单位,如居民户、厂商或者整个经济等的最优状态;而且这些经济单位主动谋求均衡的实现。
经济学基本上是一门关于选择的科学。当要实现一个特定的经济目标,如要实现一个特定水平的产出,通常有许多可供选择的方式。但是在这诸多选择中,按照某一标准,会有一种方式会比其它方式更好;根据所规定的标淮,选择最适宜的方式,这就是最优化问题的实质。
在经济学中,最常见的选择标准是最大化目标(如厂商利润最大化、消费者效用最大化、厂商或一国经济增长率最大化等)或最小化目标(如在给定产出下使成本最低等)。在经济学上,我们可以把最大化问题和最小化问题归为最优化问题这一类,表示“寻求最优”。
系统地阐述一个最优化问题,首先要确定目标函数,其中因变量表示最大化或最小化的对象;而自变量则表示这样一组对象,其大小由所涉及的经济单位出于最优化的考虑而进行选择。因此,我们持这些自变量称作选择变量(有时也被称为决策变量或政策变量)。简单地说,最优化的实质就是求出那些能够使目标函数达到极值的选择变量的值的集合。
3.1无约束条件的最优化问题:
一、经典微积分方法求解极值
(一)一元函数:y=f(x)
1、最优化的条件:
2、
(二)二元函数:z=f(x,y)
最优化条件:1、
2、
例1:求函数的极值。
解:令解得,x1=2,x2=6
代入二阶条件,
极值为:
例2:求函数的极值
解:
,,
若x=0,y=0,则二阶导数为
若x=1/3,y=1/3,则
二、极值条件的微分表示法
函数在已知极点处达到极大值。
驻点的微分条件为d z=0
在极大值点,比如图中的A点,在图形上具有这样的性质:当我们沿曲线以无穷小变化向A点的左侧(d z<0)和右侧(d z>0)滑动时,z在两个方向上均是递减的。达到这一点的充分条件是在A点的最小邻域内,在A点左右两边均有d z<0。由于d z在A点等于零,在A点两侧小于零这—事实,意味着无论从哪个方向移离A点,d z必然都是递减的。换言之,此条件相当于对任意d z不为零,d(d z)<0或用更简单的符号表示:。符号=d(d z)表示微分的微分,称之为z的二阶微分。
这意味着对于任意非零d x值,微分条件与导数条件是等价的。
在z取极小值的点,微分条件可表示为:或。
两变量的情况下,要是d z在d x和d y取任何值时都能等于零,则
为判断二阶微分无论d x,d y取何值时都始终大于或小于零,可借助高中一些知识(一元二次函数)
若
若
y
f(x)衡大于零
f(x)衡小于零
x
所以二阶微分要衡大于或小于零的条件可写作:
和
三、利用海赛矩阵判断极值点
将二阶微分表示成二次型可得:,其中,
为便于判定多个自变量最优化的二阶条件,引入海赛矩阵。海赛矩阵是由所有的二阶偏导数构成的,其中二阶直接偏导数位于主对角线上,交叉偏导数位于非对角线的位置,所以二元函数的海赛行列式为:
若
对于
例3:证明在x0=1,y0=2处达到最大值。
解:,,利用海赛行列式证明二阶条件
,,所以海赛矩阵为正定矩阵,因此已知函数在该点取得极小点。
再扩展为更多自变量(n个)函数极值问题
求极大值,二阶微分小于零,则对于海赛行列式要负定,即各阶主子式应先出现负然后正负相间;
求极小值,二阶微分大于零,则对于海赛行列式要正定,即各阶主子式都应大于零。
例4:(a)用克莱姆法则判断一阶条件及(b)海赛行列式判断二阶条件,求下列函数最优解。
解:(a)一阶条件为:
,
用矩阵表示为:
因为,所以由克莱姆法则可得:
X1=0.89,X2=0.41,X3=-0.02
(b)求已知函数的二阶偏导数以构造海赛矩阵
所以该海赛矩阵正定,从而在驻点处取得最小值。
四、特征根与特征向量:
1、判断二次形的有定符号除了上面介绍的行列式检验外,还有另一种利用所谓矩阵的“特征根”概念来进行检验的方法。
2、给定矩阵A,如能找到一向量V≠0及标量c,使得AV=cV,则标量c称为特征根,向量V称为与特征根c对应的特征向量。
整理得:AV-c V=0→(A-c I)V=0
A-c I为特征矩阵,由于假设V≠0,所以特征矩阵的行列式应为零,由此可解出特征根。
3、如果所有的特征根为正,则矩阵A为正定;
如果所有的特征根为负,则矩阵A为负定;
如果所有的特征根为非负,且至少有一个等于零,则A为半正定;
如果所有的特征根为非整,且至少有一个等于零,则A为半负定;
如果有些特征根为正,有些为负,则A的符号不定。
例5:利用特征根求下列A的符号定性。
,,
二阶微分
海赛矩阵
各阶主子式
特征值
极大值
负定
从负开始,正负相见
全为负
极小值
正定
全为正
全为正
作业:
1、完全竞争市场上的一个企业生产两种产品,总收益与总成本函数为
;
利用(a)用克莱姆法则求解一阶条件;(b)用海赛行列式判断二阶条件,使企业利润最大化。
2、已知一个完全垄断企业生产两种相关产品,即,如果两种产品为互替,产品需求函数及总成本函数为:, , ,利用(a)克莱姆法则;(b)海赛行列式求出使企业利润最大化的产量点。
3.2有线性等式约束条件的目标均衡问题
若某一消费者的效用函数为U=x1x2+2x1,且该消费者在两种商品上准备支付的总额为60美元,两种商品价格为P1=4和P2=2,则预算约束可以用线性方程表示:4xl十2x2=60。
求解该有线性等式约束的目标均衡问题我们可以将x2用x1表出,x2=30-2x1,并将其代入效用函数中,则此时效用函数为,利用经典微积分求极值的方法可得:在x1=8,x2=14点效用函数取得极大值,最大值为U=128。
但是,当约束函数本身是一个复杂的函数,或者存在几个需要考察的函数时;或者是从约束条件中无法用其中一个变量表示另一个变量的显函数形式时,以代入法和消元法求解变得非常麻烦。在这种情况下,我们可以借助于拉格朗日乘数法。
一、构建拉格朗日函数
一般而言给定目标函数z=f(x,y),满足约束条件g(x,y)=c,其中c为一个常数,我们可以将拉格朗日函数写做:Z=f(x,y)+λ[c-g(x,y)]。
对于Z(可把Z视为三个变量λ,x和y的函数)的稳定值,必要条件是
因为上式中的第一个方程仅是约束条件的重新表述,拉格朗日函数Z的极值自然满足原函数z的约束。而且因为表达为[c—g(x,y)]现在必然为零,所以拉格朗日函数中Z的极值必然与满足约束条件的原函数的极值一致。
例6:求函数z=xy,满足约束x+y=6的极值。
第一步是写出拉格朗日函数:
Z=x y十λ(6—x—y)为求Z的一个稳定值,必须
或
因此,根据克莱姆法则或者其它方法,我们可求得:
λ=3,x=3,y=3
此极值为Z=9,在我们确定它为极大值还是极小值之前还需要对其进行二阶条件检验。
二、一阶条件
1、全微分:
在讨论z=f(x,g)的自由极值时,我们知道一阶必要条件可按全微分dz表示如下:
这种表述在加入约束g(f,y)=c后仍然成立。但是在出现这个约束后,我们不能再像以前那样将dx和dy视作“任意”变化的量,因为若g(x,y)=c,则dg必定等于dc,因为c是常数,dc为零。因此
而且这个联系使dx和dy彼此相关。这样,一阶必要条件变成dz=0,满足约束g=c,因此也满足dg=0。考察上述两式,应该明确,为满足这—必要条件,我们必须有
该条件与g(x,y)=c构成两个方程,由此可解出x和y的驻点。
2、由拉格朗日乘数法可得:
可见拉格朗日乘数法可得和全微分法得到相同的x和y的解值,但是全微分法无法得到λ乘数的值。
3、λ乘数的含义:将构造的拉格朗日函数的一阶条件再求二阶导数构造雅可比行列式得:
若该雅可比行列式不等于零,则可用常数c表示三个内生变量:
它们均具有连续导数,且满足下列等式:
现在Z的极值取决于,即
可将Z看作是c的函数,将对c求导数可得:
这就证实:拉格朗日乘数的解值是由参数c引起的约束条件变化对目标函数最优值影响的度量。
拉格朗日函数可推广至n个变量的情况。即目标函数为
,约束条件为
由此可构建拉格朗日函数:
其一阶条件由下述等式构成:
二、二阶条件
由约束条件可得:
为求出的新的合适的表达式,我们必须在微分时(若d x保持不变)将d y视为依赖于x和y的变量。
第三项和第六项可合并为
由
,由此解出代入,则有:
因为二阶偏导数为:
所以d(dz)又可表示为:
二阶充分条件为:二阶充分条件为:
对于z的极大值:为负定,满足dg=0;
对于z的极小值:为正定,满足dg=0。
为发展这一思想作准备,我们首先分析满足线性约束的两个变量的二次型,比如
满足约束,由此可解出v并将其在代入q中可得:
很明显,当且仅当括号内的表达式为正(负)时,q为正(负)定。现在,恰巧下列对称行列式
因此我们可以表述为当且仅当
因此,对于满足上文提到的约束的dx和dy值,我们现在有如下关于定性符号的行列式判别准则:当且仅当
上边的行列式被称为海塞加边行列式,通常用表示。
由上式表达可知雅可比行列式等于相应的海塞加边行列式。
当有n个变量时,海塞加边行列式为:
定义各阶加边主子式,等。
这时正负定的条件为:当且仅当
例:求,满足约束x+y=56的优化问题。
解:
其一阶条件为:可解出x=36,y=20,λ=348
求二阶条件可得到加边海赛行列式:
,海塞加边行列式正定,所以在驻点处该函数取得极小值。Zmin=9744
作业:
1、求解满足约束2x+8=104的效用函数的最大化问题。
2、求解在满足约束条件x+y+z=56下的极值问题。
3.3函数的凸(凹性)和拟凸(凹性)
一个在整个定义域中给出峰形(谷底)的函数被称作凹(凸)函数。在非严格的情况下,允许峰形或谷底包含一个或多个平坦(相对于弯曲)的部分,比如线段(在曲线上)或者线段和平面(在曲面上)。但“严格”一词的存在,则排除了线段或平面存在的可能性。
考虑到凹性和严格凹性与整体峰形之间的联系,凹函数的极值必然是极大值——锋顶。而且,此极大值必定为绝对极大值(与相对极大值对照),因为峰形覆盖整个定义域。但绝对极大值可能不是唯一的,因为如果山峰包含一个平顶,则可能存在多重绝对极大值。仅当我们限定为严格凹性时,才可以排除后一种可能性。只有如此,峰值才包括一个单一的点,绝对极大值才是唯一的。唯一的(非唯一的)绝对极大值也称作强(弱)绝对极大值。
通过类似推理可知,凸函数的极值必定为绝对(或整体)极小值,但可能不是唯一的。但严格凸函数的极值必定是唯一的绝对极小值。
(一)一般函数凸凹性的判断:
对于函数z=f(x1,x2),在函数曲面上找任意两个不同的点M和N,连接线段MN,当且仅当MN位于曲面表面或曲面下方(上方)时,函数z为凹(凸)函数。当且仅当除了点M和N外,线段MN完全位于曲面下方(上方)时,函数z为严格凹(严格凸)函数。
为便于推广到不能图形化的n维情况,我们需要将几何定义转换为等价的代数形式。令u=(u1,u2)和v=(v1,v2)为z=f(xl,x2)定义域内的任意两个不同的有序偶(2维向量),则对应于它们的z值(曲面的高度)分别为f(u)=f(ul,u2)和f(v)=f(v1,v2)。我们已假定,变量可取所有实数值,所以,若u与v在定义域内,则线段uv上所有的点也都在定义域内。而线段uv上所有的点,实质上是u和v的“加权平均”。因此,我们可以θu+(1-θ)v来表示此线段,其中θ不同于u和v,是一个取值范围为0≤θ≤1的可变的标量。同理,表示f(u)和f(v)加权平均值的所有点的集合的线段MN,可用θf(u)+(1-θ)f(v)表示,θ的取值范围仍为0到l。那么,曲面上的弧线段MN又如何呢?因为弧线表示函数f在线段uv上不同点计算的值,所以可以将弧线MN简单地写成f[θu+(1—θ)v]。利用这些表达式,我们现在可以给出如下代数定义:
对于函数f定义域内任意两个不向的点u和v,且对于0<θ<1当且仅当
将弱不等号“≤”和“≥”分别变换成严格不等号“<”和“>”,上述定义便适应于严格凹性和凸性的定义。
定理I(线性函数) 若f(x)是一个线性函数,则此函数既可以是凹函数,也可以是凸函数。但不是严格凹或凸函数。
定理Ⅱ(函数的正负与凹凸性) 若f(x)为凹函数,则-f(x)为凸函数,反之亦然;类似地,若f(x)为严格凹函数,则-f(x)为严格凸函数,反之亦成立。
定理Ⅲ(函数的和) 若f(x与g(x)均为凹(凸)函数,则f(x)+g(x)也为凹(凸)函数;若f(x)和g(x)均为凹(凸)函数。且其中至少有一个为严格凹(严格凸)函数,则f(x)+g(x)为严格凹(严格凸)函数。
例1:检验的凸凹性。
为应用判断凸凹性的代数条件,令u=(u1,u2)和v=(v1,v2)为定义域中任意两个不同的点。则我们有:
带入凸凹性判断条件中,从左边表达式中减去右边表达式合并各项可得其差为:
因θ是一个正分数,θ(1—θ)必然为正。进而因(u1,u2)和(v1,v2)为不同的点,所以或者有u1≠v1,或者有u2≠v2(或者二者都不相等),因而括号内的表达式必定也为正。因此,判别式中的严格大于号成立,则该函数是严格凸函数。
另外,我们还可以单独检验项和项。因为这两项中每项都是严格凸的,所以其和也是严格凸的。
例2 检验的凹凸性。此函数为例1函数的负数。因此,根据定理II,它是严格凹函数。
例3 检验z=(x+y)2的凹凸性。尽管这里变量以x和y表示而不以x1,x2表示,但我们仍可用u=(u1,u2)和v=(vl,v2)表示定义域中的两个不同的点,用下标i表示第i个变量。这样,我们有
带入凸凹性判断条件中,从左边表达式中减去右边表达式合并各项可得其差为:
同例l中—样,θ(1-θ)为正,括号中的表达式的平方为非负(这时不能排除其为零)。因此,凸凹性判断式中的大于等于号成立,函数为凸函数,但不是严格凸函数。
(二)可微函数凸凹性的判断:
在单变量情况下,对于定义域中的任意两个不同的给定点u和v,当且仅当
时,可微函数f(x)为。
上式中的不等号被严格不等号代替的话,上面的定义就是严格凹函数和严格凸函数的定义。
当函数中有两个或两个以上的自变量时,对于定义域中任意两点u=(u1,u2,……un)和v=v(v1,v2……vn),当且仅当
时,可微函数f(x1,x2……xn)为
上式中的不等号被严格不等号代替的话,上面的定义就是严格凹函数和严格凸函数的定义。
例4 运用导数条件检验函数z=-x4的凸凹性。
使用可微函数凸凹性的判断条件,左右两边的表达式分别是-v4和-u4-4u3(v-u)。从前式中减去后式,得到其差为:
给定v≠u,此时的符号必定为负。即可微函数凸凹性判断式中的严格小于号成立,所以函数z=-x4为严格凹函数。这意味着该函数有唯一的绝对极大值。
例5 用导数条件检验的凸凹性。
在定义域中有任意两点u=(u1,u2),v=(v1,v2)。公式的两边为:
从左边减去右边可得:
给定(u1,u2)≠(v1,v2),此差值总为正。因此检验条件的严格大于号成立,所以,该函数是严格凸函数。
(三)凸函数与凸集
为便于直观把握,我们首先介绍凸集的几何特征。令S为2维空间或3维空间中的点集,对于S中的任意两点,若连接两点的线段完全位于S内,则称S为凸集。很明显,直线满足此条件并构成了一个凸集。习惯上,仅包含一个点的集合也称为凸集,空集(没有点)也视为凸集。圆盘——即“实”圆,亦即一个圆加上其内部的所有点——是一个凸集,但要注意,中空的圆本身不是凸集。类似地,三角形或五边形本身不是凸集,实的三角形或五边形则是凸集。现在可将凸集定义如下:对于任意两点u∈S和v∈S,且对于每一个标量θ∈[0,1],当且仅当w=θu+(1—θ)v∈S为真时,集合S为凸集。
凸函数与凸集的联系。首先,在定义凸函数时,我们需要定义域为凸集。凸集和凸函数的另一个联系为若f(x)为凸函数则对任意常数k,它可以引致一个凸集
下图描述了单变量的情形。集合由在虚水平线上或位于其下方的f(x)曲线的弧段相联系的x值组成。因此,它是横轴上以重黑点标示的线段,它是一个凸集。注意,如果k值变化,集合会变成横轴上的不同线段,但它仍然是个凸集。
对应于给定的常数k,凹函数g(x)可以产生一个凸集。
关于和定义也适用于多变量函数。
作业:
1、运用凸凹函数判断公式检验下列函数是凸函数、凹函数、严格凸函数、严格凹函数或者什么都不是。
2、运用可微函数凸凹性判断的导函数表达式检验下列函数是凸函数、凹函数、严格凸函数、严格凹函数或者什么都不是。
3、绘出下列集合的图形,指出哪个是凸集。
二、拟凸函数和拟凹函数
对于自由极值问题,知道目标函数的凹性和凸性,可以免去检验二阶条件的必要性。在约束最优化问题中,如果曲面和超曲面具有适当类型的图形,也可免除检验二阶条件。这里的极大值所要求的图形是拟凹性(而非凹性),极小值所要求的图形是拟凸性(而非凸性)。
令u和v为函数f定义域(凸集)中的两个不同的点,定义域中的线段uv在函数f图形上给出弧段MN,使得点N高于或等于点M。如果弧段MN上除点M和N外的所有点均高于或等于点M(低于或等于点N),则称函数f为拟凹(拟凸)函数。如果弧段MN上除M和N外的所有点均严格高于点M(严格低下点N),则称f为严格拟凹(严格拟凸)函数。
由此定义可以明确,严格拟凹(严格拟凸)函数必为拟凹(拟曲)函数,但反之不成立。
(一)一般函数拟凸拟凹性的判断:
当且仅当对于函数f(凸)定义域中的两个不同的点u和v和0<θ<1,
将弱不等号“≤”和“≥”分别变换成严格不等号“<”和“>”,上述定义便适应于严格拟凹性和拟凸性的定义。
(二)利用凸集和函数拟凸拟凹性的关系进行判断
对于任意常数k,当且仅当是凸集时,函数f(x)(其中x是一个变量向量)是。
如下图中图(a)中为凸集,所以该函数为拟凹函数;图(b)中为凸集,所以该函数据为拟凸函数;图(c)中和都是凸集,所以该函数既是拟凸函数,又是拟凹函数。
例1:检验函数的拟凸形和拟凹性。
从几何上很容易判断该函数是凸函数,且是严格凸函数,所以肯定也是严格拟凸函数。但有趣的是该函数还是拟凹函数。
我们若想利用拟凸拟凹函数的代数判断式,可令u和v为x的任意两个不同的非零值,且v>u。则有
因为v>u,所以f(v)>f(u)且加权平均值介于u和v之间,由此可写出不等式:
f(v)>f[u+(1-θ)v]>f(u)(0<θ<1)。由判断式可得该函数既为拟凸函数也是拟凹函数。
例2:z=f(x,y)=xy(x,y≥0)是拟凹函数。
运用拟凸函数拟凹函数和凸集的关系来判断该函数的拟凸拟凹性。则集合
对任意k值(k≥0)均是凸集。当k>0的情况下,此等值曲线是xy平面第一象限中的等轴双曲线。由等轴双曲线上及其上部的所有点组成的集合是个凸集。在k=0的另一种情况下,由xy=0定义的等值曲线是一个L形线,且L与x和y轴的非负部分重合。这时集合,包括了整个非负象限,仍是一个凸集。因此,根据判断条件所求函数z=xy(x,y>0)是拟凹函数
例3:判断函数为拟凸函数。
令,我们知道k必定为非负。对于每一k值,等值曲线是xy平面上以(a,b)为圆心,以为半径的圆。因为是圆及圆内所有点的集合,所以它构成了一个凸集。甚至当k=0,圆退化成一个点(a,b)时也是如此,因为习惯上—个点被视作凸集。因此给定函数是拟凸函数
(三)可微函数拟凸拟凹性的判断
对于一元可微函数f定义域中任意两个不同的点u和v,当且仅当
当右边的弱不等号变成严格不等号时。定义便成为严格拟凹性与严格拟凸性的定义。当存在两个及两个以上自变量时,定义修正如下:1
对于可微函数f(x1,x2……xn)定义域中任意两个不同点, u=(u1,u2,……un)和v=v(v1,v2……vn),当且仅当
同样,对于严格拟凹性和严格拟凸性,右边的弱不等号应改变为严格不等号。
练习:
1、下面的函数是拟凹的吗?是严格拟凹的吗?先用图形进行检验,在用拟凸拟凹性判断的代数式进行代数检验。假设x≥0。
(a)f(x)=a;(b)f(x)=a+bx(b>0);(c)
2、通过考察图形并运用凸集和拟凸拟凹性关系的判断式,检验下列函数是如下情况中的哪
一种:拟凹;拟凸;既是拟凹,又是拟凸;既非拟凹,也非拟凸。
当且仅当对于函数f(凸)定义域中的两个不同的点u和v和0<θ<1,
将弱不等号“≤”和“≥”分别变换成严格不等号“<”和“>”,上述定义便适应于严格拟凹性和拟凸性的定义。
定理Ⅰ(函数的负数) 若f(x)为拟凹(严格拟凹),则-f(x)为拟凸(严格拟凸)。
定理Ⅱ(凹性与拟凹性) 任意凹(凸)函数是拟凹(拟凸)函数,但反之不成立。类似地,任意严格凹(严格凸)函数是严格拟凹(严格凸)函数,但反之亦不成立。
定理Ⅲ(线性函数) 若f(x)是线性函数,则它既是拟凹函数,也是拟凸函数。
3.4不等式约束的线性最优化
1、最大化问题
或 或
2、最小化问题
或 或
例:假设如下:一个厂商生产两个系列产品,产品I和产品II,此工厂由三个生产车间构成,即切割车间、混合车间和包装车间。每个车间的设备每天可使用8个小时;因此,我们可将8小时看成每个车间每天的工作能力。产品的生产过程可按述如下:(1)产品I首先切割,然后包装。每吨该产品用掉切割能力的1/2小时和包装能力的/3小时。(2)产品II首先混合,然后包装。每吨该产品用掉混合能力的1小时和包装能力2/3小时。最后,产品I和产品11分别以每吨80美元和60美元的价格出售,但是分别扣除发生的可变成本后,每吨产品分别可以产生40美元和30美元的净值。问题是:为了使总(毛)的利润最大,该厂商应选择怎样的产量组合?
解:
例:为保持健康,一个人每日摄入的几种营养成份必须达到某一最低量。为简化计,假设只考虑三种营养成份:钙、蛋白质及维生素A。我们还假设此人的饮食仅由两种食物构成,即食品I和食品II,其价格和营养成份列在表19.1中,我们还在表中列出了每日所需的各种食养物质的最小量。问题是:两种食物的何种组合能够既满足日常需要,又能使成本最低呢?
解:
求解线性不等式约束条件的极值可引入松弛变量,使得不等式约束变成等式约束。上述两例可写作
解: 和
在等式约束条件中,共有三个等式五个变量,表示成矩阵乘法为
令x1,x2,s1,s2,s3中任意两个为零,求其他三个变量的值,只要满足不全等于零,则所求值即为一极值点坐标。把不同点带入目标函数,比较大小,即可求得最优解。
上述两例的最优解分别为:
(π,x1,x2)=(640,16,0)
(C,x1,x2)=(2.8,3,1)
在有些最优化问题中会出现非线性的目标函数或者非线性约束条件,这一类问题可归结为非线性规划问题。求解非线性问题,常使用库恩——塔克条件。
这里我们介绍三个具体例子,每个例子都因具有区别非线性规划与线性规划之间的某些特性而受到人们的注意。
例1 Min C=(x2-4)2+(x2-4)2
s.t. 2x1+3x2≥6
-3x1-2x2≤-12
和 x1,x2≥0
因为这个问题的约束条件是线性的,可行区域的形状确实与线性规划没有根本的不同。如图中的阴影区域所示,由第一个约束条件可得到可行区域的西南边界,由第二个约束条件可得
到其东北边界。因为目标函数是非线性的,它不能产生一族平行的等值直线,得到的是一族同心团,其圆心在点(4,4),每个相继变小的圆都与较小的C值相联系。当然,在自由极值的问题中、我们可选点(xl,x2)=(4,4)得到极小值C=0。但要限制在阴影区域上,只好选点,该点是东北边界与某一圆的切点。则C的极小值为
。
x1和x2的精确值也可以通过代数方法求出。首先,因最优解位于东北边界上,它必满足方程
3xl+2x2=12 (由第二个约束条件)
其次,与边界相切的圆在切点必与此边界有相等的斜率,即-3/2。又因该圆的斜率是(对方程F=(x1,x2)=(x1-4)2+(x2-4)2-C=0使用隐函数法则):
由此可得另一方程:2x1-3x2=-4
联立解这两个方程,使得到最优值
这里要注意,正如我们在线性规划中所预期的那样,最优解不在可行区域的极点上。因而,我们看到只有一个而不是两个约束条件被满足。还要注意,当沿东北方向接近点(4,4)时,最初使C递减。然而继续沿同一方向移动,越过这一点时,便会得到较大的C值。这样,再也没有理由像在线性规划中那样,沿某个单一的特定方向尽可能远地移动等值曲线得到极值解。
例2 Min C=(x2-4)2+(x2-4)2
s.t. x1+ x2≥5
-x1 ≥-6
-2x2≥-11
且 x1,x2≥0
本例与上题的区别仅在于约束条件部分有所不同。考虑到它是线性约束,可行区域又是实心多边形,但对于等值圆来说,这种新的几何位置会产生一个新的结果。正如图所说明的那样,自由极小值解点(4,4)这时在可行集之内,因而就在这一点找到了约束最优解,且有C=0。因此,本例中的最优解甚至不在可行区域的边界上,因而最优解一个约束条件也不满足。与线性规划的情况相反,现在再也不可能把选择区域缩小到可行区域的极点集合了。
例3 Max π=2x1+x2
s.t. -x12+4x1-x2≤0
2x1+3x2≤12
且 x1,x2≥0
因此,可行区域总共由不相交的两部分F1和F2所组成。所以,在这种情况下可行区域甚至不是一个凸集!
由线性目标函数,我们得到一簇线性等值曲线。就F1而言,在点P得出π的最大值,但因F2也是可行区域,点P只能称为局部最优值,不是整体最优值。事实上,选择F2中任意一点均比点P都要好。这足以说明:当可行集不是凸集时,就不满足整体性定理的充分条件。因此,局部最优值不一定是整体最优值。
总之,非线性规划与线性规划的不同之处至少有下列五个方面,其中有些是彼此密切相关的:(1)选择范围扩充到整个可行区域,不只是极点的集合;(2)所满足的约束条件(和非负限制)的个数不一定恰好等于选择变量的个数;(3)沿着不变方向移动,不一定能得到目标函数连续的递增(递减)值;(4)可行区域可能不是凸集;(5)局部最优值可能不是整体最优值。由于这些差别,适用于线性规划的解法,在非线性的结构中,在很大程度上已不适用了,需要新的解法。
一、我们考察具有非负限制但没有其他约束条件的问题考察单变量的情况,得到
由于x1≥0的限制,极值点有三种情况:
a
b
c
x1
x1
x1
0
0
0
Π=f(x1)
Π=f(x1)
Π=f(x1)
为使π在值x1处得到局部极大值,必满足下列三个条件之—:
这三个条件可合并为:
当含有n个选择变量时,问题变为:
所要求的一阶条件为
二、不等式约束非线性规划库恩—塔克条件
1、极大化问题
构造拉格朗日函数
则该最优化问题的库恩—塔克条件为:
2、极小化问题:
构造拉格朗日函数
则该最优化问题的库恩—塔克条件为:
例:
解:该规划的拉格朗日函数为:
求四个边界条件:
由于x1,x2非零,所以Z对x1,x2的偏导数为零。
对y1和y2的取值分四种情况讨论,可解得当x1=28/13,x2=36/13,y1=0,y2=16/13时,该规划取得极值。
作业:
单纯形法:求极点
一个线性规划的最优解可以在极点中得到。如果给定一个可用图示的可行区域F,那么要找到极点是很容易的。但是,对于那些无法图示的n个变量的情形又该如何呢?让我们再回过头来考察一下具有两个变量情况的极点,以便能尽可能找到一些线索。
图中的极点分属于三种主要类型。这些类型可在图19.6中得到充分地说明。该图重新构造出图19.2b的可行区域。
第一种类型的极点是由两个约束边界的交点构成的。这些例子可在点(8,8)和点(16,4)处找到。并且这样的点确实能完全地满足那两个约束条件,但它却不一定能完全地满足余下的约束条件。例如,点(16,4)能完全地满足切割和包装的约束条件,但却不能完全地满足混合的约束条件,这是因为该点位于混合边界的下方。由于一些约束条件得不到完全满足,所以一定存在着某种能力未得到充分利用的情况。(或者,在饮食问题中,过度摄取一些营养物质而超过最低需求量。)也就是说,在能力的利用方面的松弛(或在营养物质摄取方面产生剩余)有待于改进。
第二类极点,以(0,8)和(16,0)为例说明。它们产生于一条约束边界与一个坐标轴的交点处,因为它只位于一条约束边界上,所以这样的点仅仅能完全满足一个约束条件。鉴于这种差异,现在就会在两个约束条件中产生松弛。
最后,作为第三类极点,我们得到的是原点(0,0),它对每个约束条件都不能完全满足。
结果是,在现在这个例子中,这里的约束条件的个数(3)超过了选择变量的个数(2),至少在其中一个约束条件中,每个极点都包含着一个松弛。而是,由每个极点所引起的松弛的特定数量是很容易计算出的。当我们确定某一点为最优解时,我们不仅确定x1和x2的值,而且还确定了松弛的最优值。让我们力图简明地考察一下松弛,并且用符号si表示第i个约束条件中的松弛。虽然在最小化问题中si会变成剩余变量,但是si仍代表松弛变量。这些变量都被称作虚拟变量。
简单地考察—下松弛和剩余,将使我们可以将约束条件的每个不等式都转换成一个严格的方程。更重要的是,它将能引导我们找出一种代数方法来求出可行区域中的极点。
如果,求解引入松弛变量后形成的方程组,得到的解值向量中的所有元素都是非负的。在这种情况下解将与可行区域极点中的一个相一致,并且该解将构成线性规划的一个基本可行解(BFS)。该解之所以是可行的,是因为它位于可行区域内,它既满足约束条件又满足非负限制。之所以又称其为基本的是因为该解的获得是依三个线性无关的系数向量(假定任意两个控制变量和松弛变量为零得到的约束条件方程)的存在而定的。而这三个向量一起构成了三维空间的一个基底。(这个三维空间,被称作需求空间,与约束条件有关;当然,它的维数是由我们所要求的约束条件的个数决定的。)由于上述的对应性,因此现在搜寻极点就相当于搜寻经过转换的约束方程的基本可行解。
举一例子加以说明。令生产问题中的x1=x2=0,则
或等价于
因为,最左侧的矩阵是—个单位矩阵,去掉它并不影响方程的解,所以就可以直接将解读出:s1=16,s2=8和s3=24。这个唯一解的存在是由三个系数(列)向量的线性无关性作保证的,而这三个系数向量是生成一个三维空间(需求空间)的单位向量。由于解是非负的,所以它是一个BFS,并且,因为该解值在解空间中形成了点(0,0,16,8,24)或是图中的点(0,0),所以BFS的确与某个极点是一致的。
单纯形法:求最优极点
给某一极点定位就是要找到某个基本可行解。但我们怎样才能找到最优极点和BFS呢?在低维数的规划中,我们当然可以找出所有的BFS的规划,计算出相应的被求极大值函数(或被求极小值函数)的值,然后从中挑选出最优的—个。当涉及到许多变量及约束条件时,这种方法需要的计算量很大。单纯形法的概念就是从某一初始点出发,计算出目标函数的值,然后通过向邻近极点运动来观察后者(目标函数值)是否有改进。如果能得到改进,我们就可以进行这次移动。然后,通过进一步的移动来决定是否会有进一步的改进。当我们最终达到一个不再会有进一步改进的某一极点时,它将构成最优解。这种从可行区域的一个隅角运动到另一个隅角的迭代过程之所以可以减少计算量,是因为在该过程中只需考虑所有极点所组合的集合的一个子集。
我们特通过进一步讨论上述生产问题中的那个经过转换的最大化问题的线性规划,来说明这种方法。
单纯形表
在利用松弛变量求解未知变量的值中,我们可以通过令x1=x2=0,找到了一个原始的BFS。在解空间中就产生了如下有序5元数组,s1及与其相对应的利润π1:
sl=(0,0,16,8,24)
π1=40(0)十30(0)=0
单纯形表Ⅰ
π
x1
x2
sl
s2
s3
常数
0行
1行
2行
3行
1
0
0
0
-40
1
0
1
-30
0
1
2
0
1
0
0
※
0
0
1
0
※
0
0
0
1
※
0
16
8
24
利用如表中所示的所谓的单纯形表,按照图示的方法也能得到同样的答案。
在这个表中,我们将每一个选择变量及松弛变量的专门结出一列。此外,还设有一个π值的列和一个常数列。包含π列可使我们既能够具体地了解到表中包含在目标函数中(0行)的信息,又能了解到三个经过转换的约束条件(1行,2行,3行)的数据。每个变量下的所有数字仅仅是相关方程中那个变量的系数,而常数列中的数字不属于任何一个变量。常数列左侧的那条垂直直线在各个方程中应是“=”号的位置。因此,0行就应读作π-40x1-30x2=0,这是目标函数的一种简单变形。类似地,l行可写成x1+s1=16(第一个约束条件)等等。它也许还有助于发现,如果不考虑0行和π列,表中剩下的数字恰好是经过适当转换的三个约束条件形成的矩阵表达式中的那些数字。
根据我们以往的讨论,找到一个BFS就是要找到对于三维需求空间的—个特定的基本解。这意味着,如果我们暂时不考虑0行,那么我们必须从后三行中找到三个线性无关的列向量。很显然应选探带星号的列,它们一起构成了一个3×3维的单位矩阵。因此,我们可以将s1,s2和s3考虑进基本解中,因而令x1=x2=0。如果将x1和x2列有目的地从此表中删掉,那么下部的三行恰好简化成单位矩阵方程组求解的形式,而得到,(s1,s2,s3)=(16,8,24)。它是非负的,因此是一个BFS。
由于产量为零,所以利润也是零,很显然,这个BFS不是最优的。但在最大化问题中,能够采用只包括松弛变量的解作为初始基本可行解总是非常理想的。松弛变量总有线性无关的单位向量作为其系数向量,因此它们自然能提供一个现行的基。
事实上,利润信息也可以从表中直接看到。因为若将0行与下面的3行一并考虑(但仍不考虑x1和x2列),则该表变成方程组
它不仅揭示出松弛变量的值,而且也给出额外信息π1=0(这里下标1是指初始BFS。一般而言,当表中出现4×4单位矩阵时,如表19.4,就可以确定一个BFS,而且与该BFS相关的目标函数的值,以及需求空间基变量的值,均可一并从表中读出。比较(19.14)与表194可知,表中常数列最上面的那个元素(圈起来以示强调)就是所求的利润值。为了解利润信息,今后,我们总是考察4
展开阅读全文