当前位置:首页 >> 林学 >> 3 混合策略纳什均衡(1)

3 混合策略纳什均衡(1)


第二章同时决策博弈(2) 回顾

? 2-7箭头指向法 ? 2-8纳什均衡的正式定义
– 策略集都是实数的开区间且支付函数都是可微 的多元函数 – 连续情形纳什均衡的检验方法

? 2-9“最后归宿”博弈

? 2-10纳什均衡的应用
– 古诺竞争模型 – 伯川德双寡头竞争模型

? 2-11 纳什均衡的观察与验证 ? 2-12 弱劣势策略消去法的讨论
– 严格纳什均衡和普通纳什均衡

第三章 混合策略纳什均衡(1)

? 3-1混合策略与期望支付 ? 3-2 反应函数法 ? 3-3埃奇沃斯图与帕雷托有效

3-1混合策略与期望支付
? 两人博弈。每人从自己的扑克牌中抽一张,一起 翻开。如果颜色一样。甲输给乙一根火柴;如果 颜色不一样,甲赢得乙的一根火柴。试分析该博 弈纳什均衡的情况。

混合策略和纯策略
? 每个局中人最合理的做法。是随机地出红牌 或出黑牌。然后看能不能凭运气击败对手。 局中人这种随机化自己可选策略的做法,就 是采取“混合策略”的思想。 ? 混合策略和纯策略
– 纯策略是每个局中人具体明确了一个非随机性 的行动计划。 – 混合策略是局中人可以按照一定的概率,随机 地从纯策略集合中选择一种纯策略作为实际的 行动。

? 例:从局中人甲的角度看,他有出红牌和出黑牌 两种“纯策略”,还有以p的概率出红牌和以1-p的 概率出黑牌的“混合策略”。
– 若p=0.4,则甲的混合策略是(p,1-p),即(0.4, 0.6),甲以40%的概率出红牌,以60%的概率出黑牌。 – 甲的混合策略(0,1) 就是纯策略(只出黑牌)。 – 因此,混合策略概念是纯策略概念的推广。

? 乙的混合策略是(q,1-q)。就是说乙用q的概率出 红牌,用1-q的概率出黑牌。

? 如果一个局中人有三个纯策略可供选择, 选择三种策略的机会加起来是100%。用两 个字母q和r的组合(q,r,1-q-r)就可把所有可 能的策略选择表达出来。

? 与混合策略相伴随的一个问题是局中人支付的不 确定性,这就需要期望支付的概念。 ? 某数量指标的期望值定义:以发生概率作为权重 的所有可能取值的加权平均。

p1 X 1 + p2 X 2 + ... + pn X n

补充:圣彼得堡悖论
? 尼古拉斯.伯努利(1713) ? 赌博的参与人掷一个硬币,直到出现正面向上为 止。如果第n次掷硬币才出现正面向上,则参与人 得到2^(n-1)美元。人们愿意出多少钱来参加一次 这样的赌博?

∑ (1 / 2
n =1



n

)×2

n ?1

= 1/ 2 +1/ 2 +1/ 2 + K = ∞

期望效用理论
? 对于圣彼得堡悖论的思考,引导经济学家 提出期望效用理论。 ? 期望效用理论认为:人们并不直接关心得 到多少钱,而是关心这些钱所能带来的效 用。即人们直接关心的不是不确定性收益 的期望值,而是由不确定性收益产生的不 确定性效用的期望值。

数学语言表达
? 如果主体人对确定性收益x的效用为u(x),那么主体 人对不确定性收益X的效用就为E(u(X))。 ? E(u(X))称为X的期望效用,常记为EU(X)。将X看作 自变量, EU(X)称为期望效用函数。 ? 如果不确定性收益X退化成确定性收益x,则EU(X)= u(x),所以EU(X)可以同时表达主体人对确定性收益 和不确定性收益的效用。

? 期望效用理论很好地解答了圣彼得堡悖论。 ? 如果一个主体人对确定性收益的效用函数 u(x)=ln(x),那么这个主体人从赌博中得到 的期望效用为:

(1 / 2 n ) × ln 2 n ?1 = ln 2 ∑
n =1



回到扑克对色游戏
? 在博弈论中,当局中人并不清楚其他局中人的实 际策略选择时,他的支付便具有了不确定性,为 此,他只能通过计算期望支付的方式来预测自己 的得益情况,确定自己的策略选择。 ? 甲乙的混合策略如图:计算甲乙的期望支付。

U A ( p, q ) = ? 1 pq + 1 p (1 ? q ) + 1(1 ? p )q + (?1)(1 ? p )(1 ? q ) ( ) = ? pq + p ? pq + q ? pq + q ? pq = ?4 pq + 2 p + 2q ? 1 = 2 p (1 ? 2q ) + (2q ? 1)

U B ( p, q ) = 2q (2 p ? 1) ? (2 p ? 1)

扩展:二人博弈标准型

n人参与的策略式博弈混合策略定义

?



i

表示局中人 i 的混合策略空间

? p = ( p1 ,..., pi ,..., pn ), pi ∈ ∑ i 表示博弈的一个混合策 略组合 ? 表示局中人 i 在混合策略 p = ( p1 ,..., pi ,..., pn ) 下的期望支付,它是混 组合 合策略组合 p 的函数。
π i ( p) = π i ( p1 ,..., pi ,..., pn )

3-2 反应函数法
? 寻找同时决策有限博弈的混合策略纳什均衡

? B的混合策略设定为(q,1-q)时,A的最佳 反应函数是:

U A ( p, q ) = 2 p (1 ? 2q ) + (2q ? 1)

? A的混合策略设定为(p,1-p)时,B的最 佳反应函数是:

U B ( p, q) = 2q (2 p ? 1) ? (2 p ? 1)

? 纳什均衡是(p*,q*)=(1/2,1/2),即A和B出红牌还是 出黑牌的概率都是一半对一半。

情侣博弈的混合纳什均衡
? 试用反应函数法找出遗漏的纳什均衡。

? 纳什均衡之间的取舍

? 纯策略纳什均衡比混合策略纳什均衡具有 支付优势——帕累托优势。

补充:埃奇沃斯图与帕雷托有效
? 两个人、两种禀赋商品 1 2

? Edgeworth图 ? 禀赋点e为假设自主交换能够实现帕累托改进,达到更优的 配置点
– 对消费者1,其所偏好的区域为红色区域,最终的配置点必须在这一 区域内,否则,他拒绝交换或抵制这一配置。 – 对消费者2,其所偏好的区域为蓝色区域,最终的配置点必须在这一 区域内,否则,他拒绝交换或抵制这一配置。

? 因此,最终的配置点必须在重叠的区域中——凸透镜区域内 和边上。在这一区域里,双方或至少一方的福利能够提高。

? 设交换后形成的配置点x’在凸透镜内部,双方福利都得到改 善,同时各有一条无差异曲线交于此点。双方进一步通过交换 改善彼此福利。
– 对消费者1,其所偏好的区域为红色区域,最终的配置点必须在这一区 域内,否则,他拒绝交换或抵制这一配置。 – 对消费者2,其所偏好的区域为蓝色区域,最终的配置点必须在这一区 域内,否则,他拒绝交换或抵制这一配置。

? 因此,最终的配置点必须在重叠的区域中——凸透镜区域内和 边上。在这一区域里,双方或至少一方的福利能够提高。

? 交换过程持续下去,凸透镜越来越小,最终变为一 个点:两条无差异曲线的切点。此时,双方进一步 交换会使某一方福利下降。所以,双方的交换一旦 达到了切点位置,就不会有交换发生。实现了帕累 托最优。

? Edgeworth图中,所有的无差异曲线的切点 的连线构成契约线,帕累托效率点。

? 当禀赋点落在契约线上时,即为帕累托效 率点,无交换发生。


赞助商链接
更多相关文档:

2011秋季博弈论复习题

d 对于参与者Ⅰ来说战略 L 严格劣于战略 R(因为 b<d)在完全理性人假设下纳什均衡为 (U,R) 、求解: 1、求二人猜硬币博弈的混合策略纳什均衡,并画出反应...

混合策略

4页 1下载券 混合策略纳什均衡 暂无评价 8页 1下载券混​合​策​略 ...(不是 BR 的策略最终会被排除在外) 1 个混合策略组合( P , P2 ,...

电大2015(本)博弈与决策作业1-4

(3)博弈的结果为(10,4) ,即 1 号厂商获得 10 单位支付,2 号厂商获得 4 单位支付。 (4)按照纳什均衡存在性定理,这里不存在混合策略纳什均衡。 [注:括号的...

博弈论答案

3、 纯策略和混合策略纳什均衡 纯策略纳什均衡:如果一个战略规定参与人在每一个给定的信息情况下只选择 一种特定的行动,。混合策略:如果一个战略规定参与人在给定...

博弈论习题

2、若博弈有两个纯战略纳什均衡则一定还存在混合战略纳什均衡3、博弈中混合策略纳什均衡一定存在,纯策略的不一定存在。 4、后行为的博弈方可以先观察到...

博弈论复习题及答案

(3) 求出该博弈的混合策略纳什均衡。 分) (7 (1)策略 甲:AB乙:ab 博弈树 (草图如下: 1 (2)Pure NE (A, a); (B, b) 都是 Pareto 有效,仅(B...

博弈论复习题及答案

(2)求纳什均衡。 3. 答: (1)由题目中所提供的信息,可画出 A、B 两企业...在本题中不存在混合策略的纳什均衡解,因此,最终的纯策略纳什均衡就是 A、B ...

博弈论复习题及答案

(√) 2、子博弈精炼纳什均衡不是一个纳什均衡。 (×) 3、 若一个博弈出现...一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或 者两次都采用混合战略...

博弈与决策作业讲评1

(3)博弈的结果为(10,4) ,即 1 号厂商获得 10 单位支付,2 号厂商获得 4 单位支付。 (4)按照纳什均衡存在性定理,这里不存在混合策略纳什均衡。 [注:括号的...

电大本科《博弈与决策》平时作业答案

[注:步骤(1) (2)颠倒亦可] 、根据优势策略下划线法找出以下博弈的纯策略纳什均衡,并指出是否存在混合策略纳什均 衡。 要求: (1)划出相应优势策略的下划线; ...

更多相关标签:
网站地图

文档资料共享网 nexoncn.com copyright ©right 2010-2020。
文档资料共享网内容来自网络,如有侵犯请联系客服。email:zhit325@126.com