当前位置:首页 >> 林学 >> 3 混合策略纳什均衡(1)

3 混合策略纳什均衡(1)


第二章同时决策博弈(2) 回顾

? 2-7箭头指向法 ? 2-8纳什均衡的正式定义
– 策略集都是实数的开区间且支付函数都是可微 的多元函数 – 连续情形纳什均衡的检验方法

? 2-9“最后归宿”博弈

? 2-10纳什均衡的应用
– 古诺竞争模型 – 伯川德双寡头竞争模型

? 2-11 纳什均衡的观察与验证 ? 2-12 弱劣势策略消去法的讨论
– 严格纳什均衡和普通纳什均衡

第三章 混合策略纳什均衡(1)

? 3-1混合策略与期望支付 ? 3-2 反应函数法 ? 3-3埃奇沃斯图与帕雷托有效

3-1混合策略与期望支付
? 两人博弈。每人从自己的扑克牌中抽一张,一起 翻开。如果颜色一样。甲输给乙一根火柴;如果 颜色不一样,甲赢得乙的一根火柴。试分析该博 弈纳什均衡的情况。

混合策略和纯策略
? 每个局中人最合理的做法。是随机地出红牌 或出黑牌。然后看能不能凭运气击败对手。 局中人这种随机化自己可选策略的做法,就 是采取“混合策略”的思想。 ? 混合策略和纯策略
– 纯策略是每个局中人具体明确了一个非随机性 的行动计划。 – 混合策略是局中人可以按照一定的概率,随机 地从纯策略集合中选择一种纯策略作为实际的 行动。

? 例:从局中人甲的角度看,他有出红牌和出黑牌 两种“纯策略”,还有以p的概率出红牌和以1-p的 概率出黑牌的“混合策略”。
– 若p=0.4,则甲的混合策略是(p,1-p),即(0.4, 0.6),甲以40%的概率出红牌,以60%的概率出黑牌。 – 甲的混合策略(0,1) 就是纯策略(只出黑牌)。 – 因此,混合策略概念是纯策略概念的推广。

? 乙的混合策略是(q,1-q)。就是说乙用q的概率出 红牌,用1-q的概率出黑牌。

? 如果一个局中人有三个纯策略可供选择, 选择三种策略的机会加起来是100%。用两 个字母q和r的组合(q,r,1-q-r)就可把所有可 能的策略选择表达出来。

? 与混合策略相伴随的一个问题是局中人支付的不 确定性,这就需要期望支付的概念。 ? 某数量指标的期望值定义:以发生概率作为权重 的所有可能取值的加权平均。

p1 X 1 + p2 X 2 + ... + pn X n

补充:圣彼得堡悖论
? 尼古拉斯.伯努利(1713) ? 赌博的参与人掷一个硬币,直到出现正面向上为 止。如果第n次掷硬币才出现正面向上,则参与人 得到2^(n-1)美元。人们愿意出多少钱来参加一次 这样的赌博?

∑ (1 / 2
n =1



n

)×2

n ?1

= 1/ 2 +1/ 2 +1/ 2 + K = ∞

期望效用理论
? 对于圣彼得堡悖论的思考,引导经济学家 提出期望效用理论。 ? 期望效用理论认为:人们并不直接关心得 到多少钱,而是关心这些钱所能带来的效 用。即人们直接关心的不是不确定性收益 的期望值,而是由不确定性收益产生的不 确定性效用的期望值。

数学语言表达
? 如果主体人对确定性收益x的效用为u(x),那么主体 人对不确定性收益X的效用就为E(u(X))。 ? E(u(X))称为X的期望效用,常记为EU(X)。将X看作 自变量, EU(X)称为期望效用函数。 ? 如果不确定性收益X退化成确定性收益x,则EU(X)= u(x),所以EU(X)可以同时表达主体人对确定性收益 和不确定性收益的效用。

? 期望效用理论很好地解答了圣彼得堡悖论。 ? 如果一个主体人对确定性收益的效用函数 u(x)=ln(x),那么这个主体人从赌博中得到 的期望效用为:

(1 / 2 n ) × ln 2 n ?1 = ln 2 ∑
n =1



回到扑克对色游戏
? 在博弈论中,当局中人并不清楚其他局中人的实 际策略选择时,他的支付便具有了不确定性,为 此,他只能通过计算期望支付的方式来预测自己 的得益情况,确定自己的策略选择。 ? 甲乙的混合策略如图:计算甲乙的期望支付。

U A ( p, q ) = ? 1 pq + 1 p (1 ? q ) + 1(1 ? p )q + (?1)(1 ? p )(1 ? q ) ( ) = ? pq + p ? pq + q ? pq + q ? pq = ?4 pq + 2 p + 2q ? 1 = 2 p (1 ? 2q ) + (2q ? 1)

U B ( p, q ) = 2q (2 p ? 1) ? (2 p ? 1)

扩展:二人博弈标准型

n人参与的策略式博弈混合策略定义

?



i

表示局中人 i 的混合策略空间

? p = ( p1 ,..., pi ,..., pn ), pi ∈ ∑ i 表示博弈的一个混合策 略组合 ? 表示局中人 i 在混合策略 p = ( p1 ,..., pi ,..., pn ) 下的期望支付,它是混 组合 合策略组合 p 的函数。
π i ( p) = π i ( p1 ,..., pi ,..., pn )

3-2 反应函数法
? 寻找同时决策有限博弈的混合策略纳什均衡

? B的混合策略设定为(q,1-q)时,A的最佳 反应函数是:

U A ( p, q ) = 2 p (1 ? 2q ) + (2q ? 1)

? A的混合策略设定为(p,1-p)时,B的最 佳反应函数是:

U B ( p, q) = 2q (2 p ? 1) ? (2 p ? 1)

? 纳什均衡是(p*,q*)=(1/2,1/2),即A和B出红牌还是 出黑牌的概率都是一半对一半。

情侣博弈的混合纳什均衡
? 试用反应函数法找出遗漏的纳什均衡。

? 纳什均衡之间的取舍

? 纯策略纳什均衡比混合策略纳什均衡具有 支付优势——帕累托优势。

补充:埃奇沃斯图与帕雷托有效
? 两个人、两种禀赋商品 1 2

? Edgeworth图 ? 禀赋点e为假设自主交换能够实现帕累托改进,达到更优的 配置点
– 对消费者1,其所偏好的区域为红色区域,最终的配置点必须在这一 区域内,否则,他拒绝交换或抵制这一配置。 – 对消费者2,其所偏好的区域为蓝色区域,最终的配置点必须在这一 区域内,否则,他拒绝交换或抵制这一配置。

? 因此,最终的配置点必须在重叠的区域中——凸透镜区域内 和边上。在这一区域里,双方或至少一方的福利能够提高。

? 设交换后形成的配置点x’在凸透镜内部,双方福利都得到改 善,同时各有一条无差异曲线交于此点。双方进一步通过交换 改善彼此福利。
– 对消费者1,其所偏好的区域为红色区域,最终的配置点必须在这一区 域内,否则,他拒绝交换或抵制这一配置。 – 对消费者2,其所偏好的区域为蓝色区域,最终的配置点必须在这一区 域内,否则,他拒绝交换或抵制这一配置。

? 因此,最终的配置点必须在重叠的区域中——凸透镜区域内和 边上。在这一区域里,双方或至少一方的福利能够提高。

? 交换过程持续下去,凸透镜越来越小,最终变为一 个点:两条无差异曲线的切点。此时,双方进一步 交换会使某一方福利下降。所以,双方的交换一旦 达到了切点位置,就不会有交换发生。实现了帕累 托最优。

? Edgeworth图中,所有的无差异曲线的切点 的连线构成契约线,帕累托效率点。

? 当禀赋点落在契约线上时,即为帕累托效 率点,无交换发生。


赞助商链接
更多相关文档:

博弈论复习题及答案

) 3、 若一个博弈出现了皆大欢喜的结局, 说明该博弈是一个合作的正和...一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或 者两次都采用混合战略...

博弈论习题集

4 11 考虑如下两人扩展式博弈: (1)写出此博弈的策略形式; (2)求出此博弈所有的纯策略纳什均衡; (3)求出此博弈所有的(包括混合策略)子博弈完美纳什均衡; (...

博弈论判断题

(2)正确。这是纳什均衡的基本性质之一——奇数性所保证的。 (3)不正确。虽然纯策略纳什均衡不一定存在,但在我们所分析的博弈中混合策略纳什均衡 总是存在的。...

用非线性规划模型求解有限博弈的混合策略纳什均衡

用非线性规划模型求解有限博弈的混合策略纳什均衡 博弈方2 策略 博弈方1 策略 U L 混合策略 X1 X2 A Y1 3,5 4,3 B Y2 1,4 2,5 C Y3 5,7 0,3...

博弈论知识点总结完整版

博弈论知识点总结,完整版本,包括纳什均衡,混合策略纳什均衡,多重纳什均衡,动态...1.3 博弈的分类:博弈论根据其所采用 的假设不同而分为合作博弈理论和非合作 ...

微观经济学答案 第10--12章

风险厌恶 D、不确定 我的答案:C 3 在博弈论中,“纳什均衡”也被称为: ? ...如果两家寡头垄断厂商都采取混合策略, 则双寡头垄断博弈模型就不会产生一个严格...

复习详解

纳什均衡 局中人單獨改變策略不會得到好處的對局即策略組合混合策略 局中人的...2.每一个严格占优战略均衡一定是纳什均衡,反之不然。 3.每一个逐步剔除严格...

更多相关标签:
网站地图

文档资料共享网 nexoncn.com copyright ©right 2010-2020。
文档资料共享网内容来自网络,如有侵犯请联系客服。email:zhit325@126.com