资源描述
3 非完全信息静态博弈
3.1 理论: 静态贝叶斯博弈和贝叶斯纳什均衡
例 不对称信息(asymmetric information)下的古诺竞争
市场中有两个企业。
市场需求: P(Q) = a – Q, Q = q1 + q2.
企业 1 成本: C1(q1) = cq1.
企业 2 成本: 以概率 q取C2(q2) = cHq2,
以概率 1– q取 C2(q2) = cLq2。
企业 2的产量依赖于成本:
max [(a - q1* - q2) - cH]q2
和
max [(a - q1* - q2) - cL]q2
企业 1 选择 q1
max q[(a - q1 - q2*(cH)) - c]q1 + (1–q)[(a - q1 - q2*(cL)) - c]q1
一阶条件
(a - q1* - cH) – 2q2*(cH) = 0
(a - q1* - cL) – 2q2*(cL) =0
{q[(a - q2*(cH)) - c] +(1-q)[(a - q2*(cL)) - c]} - 2q1*=0
解出
q2*(cH) = + (cH - cL)
q2*(cL) = – (cH - cL)
q1*=
比较完全信息下的古诺模型
qi*= (a - 2ci + cj)/3
静态贝叶斯博弈的标准式表示
参与人的类型空间 T1,…, Tn;
参与人i 类型: tiÎ Ti
其他人不知道ti,但知道ti的分布。
参与人 i 的推断 pi(t-i|ti).
参与人的行动空间 A1, …, An;
参与人 i 收益: ui(a1,…,an;ti)
n个参与人的静态贝叶斯博弈(static Bayesian game)的标准式表示,
G={ A1, …, An; T1, …, Tn; p1, …, pn; u1, …, un },
不对称信息下的古诺博弈:
T1={ c }, T2={ cL,cH }
p2(q1,q2;cL) = [(a - q1- q2) - cL]q2
p2 (q1,q2;cH) = [(a - q1 - q2) - cH]q2
p1 (q1,q2;c) = [(a - q1 - q2) - c]q1
用时间顺序描述静态贝叶斯博弈
(1)自然产生一个类型向量t = (t1,…,tn)
(2)自然向参与人 i显示ti;
(3)参与人同时选择行动
(4)各人得到收益.
参与人 i的战略: si(ti)Î A i
贝叶斯纳什均衡: s*=(s1*,…, sn*) 满足
max Sui*[s1*(t1), …, si-1*(ti-1), ai, si+1*(ti+1), …, sn*(tn); t]pi(t-i| ti)
3.2 应用
例1 信息不完全的性别战
帕特
歌剧 拳击
歌剧 2+ tc,1 0, 0
克丽斯
拳击 0, 0 1, 2+ tp
类型空间: Tc = Tp = [0, x]
tp和tc 为[0, x]上的均匀分布.
推断(密度函数): pc (tp) = pp (tc) = 1/x
直觉: 分别存在临界值c与p:
当 tc > c时,克丽斯选择歌剧, 否则选择拳击.
当 tp > p时,帕特选择拳击, 否则选择歌剧.
克丽斯的期望收益
看歌剧: (2 + tc) + (1 –)× 0 = (2 + tc)
看拳击: × 0 + (1 –) = 1 –
选择歌剧最优
(2 + tc) > 1 –
即 tc ³ – 3
因此临界值 c = – 3
帕特的期望收益
看拳击:(1 –)×0 +(2 + tp) = (2 + tp)
看歌剧: (1 –) + ×0 = 1 –
由选择拳击最优
tp ³ - 3
临界值 p = - 3
解得 p = c
和 p2 + 3p – x = 0.
克丽斯选择歌剧的概率
1 - = = 1 –
帕特选择拳击的概率
1 - = = 1 –
当x → 0时,
1 – → 1 –
例2 拍卖(an auction)
第一价格密封拍卖(First-price, sealed-bid)
两个投标人.
i 对物品的估价: vi , 独立,[0, 1]上的均匀分布
类型空间: Ti = [0, 1]
收益
vi – bi if bi > bj
ui (b1, b2; vi, v2) = (vi – bi)/2 if bi = bj
0 if bi < bj
战略,即报价: bi(vi)
贝叶斯纳什均衡 (bi(vi), bj(vj)) 满足
max (vi – bi)Prob{ bi> bj(vj)} +(vi – bi)Prob{ bi= bj(vj)}.
求线性战略
bi(vi) = ai + civi,
问题为
max(vi – bi)Prob{bi> aj + cjvj }
其中
Prob{ bi> aj + cjvj } = Prob{vj < } =
参与人 i的最优行动满足
– + = 0
即有
bi(vi) =
由估价与报价的关系:0 £ bi £ vi,得到 aj = 0
因此
bi(vi) = vi/2
例 3 双向拍卖 (A double auction)
一个买者和一个卖者, 分别提出价格 pb, ps
如果 pb ³ ps , 则以p = (pb + ps )/2交易; 否则不交易.
他们的估价为私人信息,vb和vs, 独立,为 [0, 1]上均匀分布.
买者收益
ub = vb – p if pb ³ ps
= 0 if pb < ps
卖者收益
us = p – vs if pb ³ ps
= 0 if pb < ps
战略 pb(vb), ps(vs)
贝叶斯纳什均衡 (pb(vb), ps(vs))满足
maxpb (vb –)Prob{ pb ³ ps(vs)}
maxps (– vs)Prob{ pb (vb) ³ ps}
(1) 单一价格均衡:
以预先决定的x成交。
如果 vb ³ x, pb = x; 否则pb = 0.
如果 vs £ x, ps = x; 否则ps = 1.
vb
交易
x
x vs
如果 vb ³ vs,交易就是有效率的,但不一定会进行交易。
(2)线性均衡
假设卖者的战略
ps(vs) = as + csvs,
则ps(vs)是区间[as,as + cs]上的均匀分布,
E[ps (vs) | pb ≥ ps (vs)] = (区间[as, pb]的中点)
Prob{ pb ³ ps(vs)} =
买方的问题
max[vb – { pb + }]
从一阶条件解出
pb = vb + as
假设买者的战略
pb(vb) = ab + cbvb,
卖者的问题
max[{ pb + } – vs ]
从一阶条件解出
ps = vs + (ab + cb)
比较系数,得到
cs =, cb =, ab=, as =
均衡战略
pb(vb) = vb +
ps(vs) = vs +
p
ps
pb
v
由交易条件 pb ³ ps, 有
vb ³ vs+
有部分有效的交易未发生。
vb
交易
x vs
3.3 显示原理
第一价格拍卖:在线性报价方式下,每个人的报价是他的估价的一半, bi(vi) = vi/2。
第二价格拍卖:出价最高者获得购买,但是按第二高的出价交易。
贝叶斯纳什均衡:每个人按自己的估价报价,即bi(vi) = vi
不同的拍卖方式,参与人的报价方式不同。
直接机制:每个人给出自己的类型(不一定是真实的)。
激励相容:每个人给出自己的真实类型。
显示原理:任何贝叶斯博弈的任何贝叶斯纳什均衡,都可以重新表示为一个激励相容的直接机制。
如对第一价格拍卖的规则作修改:
报价最高者获得购买权,但是按他的报价一半交易。
在线性报价方式下,每个人的报价:bi(vi) = vi。
展开阅读全文