沸腾文学

手机浏览器扫描二维码访问

第21部分(第1页)

功回球概率沿着图中的两条直线上升到交点之上,也就是超过48%。因此,40%的时间瞄准对方的正手就是发球者的最佳策略。

混合策略的确切比例是由基本行动配对而成的4种情况确定的。对于拥有不同的绝对优势和相对优势的选手,这里的数字90、60、30

和20会相应发生变化,而他们的最佳混合策略也会随之不同。我们很快就会发现,这样一些变化可能导致一些令人惊讶的结果。这里的关键在于,你必须通过估计你真正参加的博弈的4种基本情况,确定自己的最佳混合策略。

这里有一条捷径,使你不必画出前面提到的图表也可以计算出均衡策略。这个简单的算术方法归功于J。D.威廉斯。'3'回到基本情况的表格。对于发球者,如果选择瞄准对方正手的策略,就要观察对方选择两种不同的回应方式之一会使结果发生什么变化;我们得到90…30=60

。假设他瞄准对方反手发球,再做同样的计算,可得60…20=40 。将上述数字倒过来排列,就能得到最佳混合策略中采用这两种策略的概率。①

因此,发球者应该按照40:60的比例瞄准对方的正手和反手。

现在我们改从接球者的角度考察同一场比赛。图7…4显示了他的不同选择会有什么不同的结果。假如发球者瞄准他的反手,那么,他回①

我们可以用一点代数知识验证这个结果。假如纵列选手的得失情况如下图所示,左列对右列的均衡比例为(D…B):(

A…C)。纵列选手选择左列的概率是p,那么,无论横行选手选择上或者下都没有关系;pA+(1…p)B=pC十1…P)D 意味着p (

1…p )=(D…B )(A…C)

,如前所述。由于横行选手的得失是纵列选手的得失的负数,他的均衡混合策略就是上行对下行,即(D…C):(A…B)。

球的时候向反手方移动就能得到60%的成功回球概率,而向正手方移动的成功回球概率只有20%。从O到100%改变向正手方移动的概率,就得到一条和上述两点相交的直线。与前面的分析类似,若是发球者瞄准对手的正手,我们就得到一条从30%上升到90%的直线。这两条直线交于一点,在这一点,接球者向正手方移动的概率为30%

,无论发球者选择瞄准哪一方,他的成功回球概率始终维持在48%。任何其他混合策略都会让发球者占便宜,使他得以选择更好的策略,将接球者的成功回球概率进一步降低到48%以下。

图7…4 接球手向正手移动的概率(% )

此外,我们也可以采用威廉斯的方法。表格显示了接球者两种不同选择可能导致什么不同结果。若向正手方移动,我们得到90…20=70 ;

向反手方移动,我们得到60…30=30。将这两个数字倒过来排列就得到最佳混合策略的比例:30%的时间准备向正手方移动,70%的时间准备向反手方移动。

你可能已经注意到,从两位选手的不同角度计算最佳混合策略,会得到一个有趣的共同点:两次计算会得到同样的成功回球概率,即48%。接球者若采用自己的最佳混合策略,就能将发球者的成功概率拉低到发球者采用自己的最佳混合策略所能达到的成功概率。这并非巧合,而是两个选手的利益严格对立的所有博弈的一个共同点。这个结果称为最小最大定理,由前普林斯顿数学家约翰·冯·诺伊曼(John

von Nrumann)与奥斯卡·摩根斯顿(Oscar

Morgenstern)创立。这一定理指出,在零和博弈里,参与者的利益严格相反(一人所得等于另一人所失),每个参与者尽量使对手的最大收益最小化,而他的对手则努力使自己的最小收益最大化。他们这样做的时候,会出现一个令人惊讶的结果,即最大收益的最小值(最小最大收益)等于最小收益的最大值(最大最小收益)。双方都没办法改善自己的地位,因此这些策略形成这个博弈的一个均衡。

我们以网球比赛为例,并假设每个选手只有两种策略,以此证明这一定理。假如发球者想努力使接球者的最大成功率最小化,他应该在假设接球者已经正确预计到他的混合策略且会做出最优回应的基础上确定自己的行动。也就是说,接球者的成功率将是图7…5中两条直线的最大值。这个最大值的最小值出现在两条直线的相交处,该点的成功率为48%。

图7…5发球手攻正手的概率(% )

现在我们从接球者的角度考察这个问题:他要努力使自己的最小收益最大化。如图7…6所示,假如接球者一半时间向正手方移动,一半时间向反手方移动,他的新的收益曲线就是原来两条直线的平均值,以点线显示。由于这条直线是向上延伸的,其最小值永远出现在左端,该点的成功率为40%。无论接球者向两方移动的比例是多少,这条直线一定经过成功率为48%的那一点,这是因为发球者可以选择采用40:60的混合策略。假如这条直线出现任何倾斜,那么,它的一端一定落在48%以下。只有在接球者的混合策略为30:70的时候,这条直线才会变成一条水平直线,最小值变成48%。因此,最大值的最小值等于最小值的最大值——48%。

图7…6发球手攻正手的概率(%)

最小——最大定理的普遍证明相当复杂,不过,其结论却很有用,应该记住。假如你想知道的只不过是一个选手之得或者另一个选手之失,你只要计算其中一个选手的最佳混合策略并得出结果就行了。

我们的其他工具,比如威廉斯的方法和上述图表,能够很好地解决一切只有两个选手参加且他们各有两个策略的零和博弈。不幸的是,这些工具并不适用于任何非零和博弈,也不适用于选手数目超过两个或者他们拥有的策略数目超过两个的零和博弈。经济学家和数学家发明了更加普遍的技巧,比如线性规划方法,可以找出最复杂的零和博弈的均衡策略。虽然这些技巧超出了本书的范围,我们还是可以利用其中得出的结果。

所有混合策略的均衡具有一个共同点:每个参与者并不在意自己在均衡点的任何具体策略。一旦有必要采取混合策略,找出你自己的均衡混合策略的途径就在于使别人对他们自己的具体行动无所谓。虽然这听上去像是一种倒退,其实不然,因为它正好符合零和博弈的随机化动机:你想阻止别人利用你的有规则的行为占你的便宜。假如他们确实倾向于采取某一种特别的行动,从你的角度观察,这只能表示他们选择了最糟糕的方针。

(今天开始做魔王同人)你是我的唯一,我是你的谁  笑傲江湖之天下无双  消逝的军号  刺客  给青年的十二封信  智弈  今天,我们怎样评论中国  完美大小姐  人生之钥  圈单  飞得更高  拱出银行的小猪  YOU-身体使用手册  老粗能干大事  专注--解读中国隐形冠军企业  班主任兵法2·实战篇  左公关右广告  沉浮史玉柱  玄幻:我为诡神转世,横推万古  这些心态是必需的  

热门小说推荐
快穿:我只想种田

快穿:我只想种田

一锄头挖地挖到大咸鱼干不是事儿,被咸鱼干臭晕就有点尴尬了,晕了后做梦预见凄惨未来就玄幻了,悲惨1,秦鱼郁郁寡欢。然后浑身带着咸鱼干醉人芳香的一只猫出现了。猫本殿是天神之子,为了消灭邪恶选择被封印千年万年,你就是我的有缘人!快,别废话了,跟我一起拯救三千小世界吧!说完后,它的肚子咕咕叫了。一面现实种田,一面快穿攻略各种邪恶Boss,后来她从内心闺秀喜欢种田的温柔少女进化成了表里不一笑里藏刀的温柔小姐姐。秦鱼我真的只是想种田而已。ps本文可撩妹撩男神,主暧昧,无cp,会防盗,先宣告一般,因此希望广大读者们事先有心理准备,不要强求cp或者抗议防盗,谢谢支持。...

诱夫入怀:喵系萌妻别病娇!

诱夫入怀:喵系萌妻别病娇!

疼轻点少女蹙眉祈求道。乖忍忍男人黯哑的嗓音响起,利落将她伤口的碎片拔出。身体被夺舍,雇佣兵女王无忧重生成了受到诅咒的喵系少女池婉。敢夺她身体,她就夺她男人!从此,墨尘枭身后多了个小尾巴,在他的养成下,她成功成长为一名优秀的病态!人前,她是羞涩萌萌小萝莉,人后,她是妖娆嗜血暗黑女王!他是杀伐果断,冷血不留情面的战神,却偏偏对她宠入骨髓!众人瑟瑟抖爷,您老婆是病娇您知道么?!墨尘枭露出尖尖獠牙,神色魅惑的舔了舔唇瓣腹黑配病娇,天生一对。1V1男强女强打脸甜宠文)...

巫师再临

巫师再临

凡力量回归,巫师也从历史的尘埃中再度降临,站在凡力量回归的浪潮顶端,沙兰于尘埃和无数位面之中寻找巫师的真意,总有一天,真正的巫师将再临世间。...

武林风流传(多情皇帝)

武林风流传(多情皇帝)

中原武林大地北有天芳谱七朵名花,南有美人图十二美人!武林之中,侠女成风,我一出世,无一落空。皇帝本多情,情深意更浓,武林有南北,皇帝就是我。...

海贼之文虎大将

海贼之文虎大将

哥尓d罗杰,你接下来的举动,会掀起一个混乱的时代,造成民不聊生,海贼祸乱的局面,你确定要如此做?世界破坏者瓦尔多,你的罪行,已不需要任何的宽恕与容忍,死亡是你唯一的下场!赤犬,你的所作所为,已经违背了正义二字,立刻停手!否则,以海军正义之名,我将立刻制裁你!五老星,你们以往数百年的暴行,违背了正义,请滚出玛丽乔亚,接受人民的审判!获得军魂系统的唐恩,渐渐现这个世界,与他原本所想的完全不同。在炮火与鲜血交织的战场中,只有海军,才是正义!而他,代号文虎,是海军有史以来最强大将!所有违背正义,三观不正的存在,都将是他的敌人!ps已有完本精品海贼之最强附身,请放心收藏。...

我的不死外挂

我的不死外挂

周天渴望死亡,因为每死一次都能让他变的更强不能修炼的凡人,借助不死系统一个个强悍的技能,在异界搅风搅雨的故事枪脏了就要擦,我的外挂叫不死...

每日热搜小说推荐