当前位置:首页 >> 教育学/心理学 >> 寻找三个纳什均衡

寻找三个纳什均衡


1.首先将原始数据带入博弈计算程序,可以得到如下的答案: 可以看到其中一个是纯策略,两个是混合策略。 1:1 1 2 3 113/200 0 16/25 1:2 5/16 1 0 1:3 49/400 0 9/25 2:1 1/27 0 1/11 2:2 10/27 0 10/11 2:3 16/27 1 0

2.首先用划线法找出可以找到第一个纯策略。 纯策略下张三和李四的收益组合为:(60,76),张三和李四的策略分别为(0,1,0)和(0,0,1)

3.用消去法消去划线的两行

这样得到一个新的组合,

P

1-P

S

1-S

假设新的组合是符合混合纳什均衡策略 那么 张三选上下的策略为 P,1-P; 李四选左中的策略为 S,1-S. 根据纳什均衡的条件:李四的策略概率 S,1-S,使得张三选择上下策略收益相同: 得到一个等式:12S+42(1-S)=72S+36(1-S). S=1/11 1-S=10/11; 此时张三的收益为:=12×1/11+42×10/11 = 432/11 = 39.27; 同样张三的概率 P,1-P,使得李四选择左中的收益相等: 得等式:83P+47(1-P)=56P+95(1-P) P=16/25;1-P=9/25; 此时李四的收益:=83×16/25+47×9/25=53.12+16.92=70.04 综上为第二个混合策略纳什均衡张三和李四的策略分别为:(16/25,0,9/25)和(1/11,10/11,0),张三和李 四的收益为(39.27,70.04) 第三步:一般的混合纳什均衡

设张三选择上中下的策略概率分别为 p,q,1-p-q;李四选择左中右的策略概率分别为 s,t,1-s-t; 李四的策略要使张三的策略收益相同: 12s + 42t + 42(1-s-t)=24s + 12t + 60(1-s-t)=72s + 36t + 42(1-s-t) s=1/27, t=10/27, 1-s-t= 16/27 此时张三的收益 张三收益 = 12*1/27+42*10/27+42*16/27=(12+420+672)/27=1104/27=40.89 同上可知张三需要确定一个行动概率,以使李四的选择在其收益上没有差异,得等式: 83p + 12q +47(1-p-q) = 56p + 42q + 95(1-p-q)=45p + 76q + 59(1-p-q) p=113/200, q=5/16, 1-p-q=49/400 此时李四的收益为 李四收益 =83*113/200+12*5/16+47*49/400=46.895+3.755.7575=56.40 综上,此混合策略纳什均衡相对于张三和李四的策略选择用概率分别表述为(113/200,5/16, 49/400)和(1/27, 10/27,16/27),收益分别为(40.89,56.40) 第四步:最后策略 三个策略的收益为:(60,76)(39.27,70.04)和 40.89,56.40) 通过帕累托上策为(60,76)对双方来说收益最大,所以张三(0,1,0),李 四(0,0,1)的纳什均衡点应是实际行为最可能的结果。


赞助商链接
更多相关文档:
更多相关标签:
网站地图

文档资料共享网 nexoncn.com copyright ©right 2010-2020。
文档资料共享网内容来自网络,如有侵犯请联系客服。email:zhit325@126.com