《策略思维》——回合制下的博弈、赌局与均衡

我们玩个游戏——

现在有1块钱的钞票，请大家开价。每次叫价以0.1元为单位递增。出价最高者得到这个钞票，但是出价最高者和出价次高者都会支付相当于出价数目的费用。

为了避免那种无穷无尽的攀升，我们将上限设定成最多只能出价2.5元。也就是说，从0.1开始出价，最高到2.5元封顶。

假如说，参与这个游戏的都是极度理智和聪明的人，你觉得谁会赚？

庄家？为什么？

玩家？为什么？怎么赚？_{（答案，可以在看这篇文章的时候慢慢思考）}

一、所谓回合制

回合制就是参与博弈的各方轮流出招，前面人的行动会引起局势的变动，进而影响你的策略；而你的出招也会影响后续的局势，引动后人的策略。

每个参与者在轮到自己的时候，必须展望一下他的这一步行动将会给其他人以后的行动造成什么影响，反过来又会对自己以后的行动造成什么影响。

这种相继出招的博弈有一个总的原则，就是每一个参与者必须预计其他参与者接下来会有什么反应，据此盘算自己的最佳策略。

从这些点，我们可以推导得出一个回合制博弈下的基本法则：

向前展望，倒后推理。

在昨天神枪手的案例之中，A、B、C每个人的行为策略，都是遵循这一法则。

A向前展望：无论第一轮攻击B还是C，形成的结果都不会比自己放空更好；

B向前展望：如果C能活过这一轮，自己一定会被干掉，那么倒后推理——自己要尽量干掉C；

C向前展望：A、B都活着，跟A进入第二轮面对30%的死亡率，跟B进入第二轮面对80%的死亡率，倒后推理——自己的最佳策略显然是干掉B跟A进入第二轮。

C为什么一定会攻击B？

二、弱点均衡

对于绝大多数的普通玩家来说，正手接球跟反手接球的成功率基本上不会相等，无论是兵乓球、羽毛球、网球还是什么类似的游戏。

现在我们不妨假定有这么一个玩家A：正手接球成功的概率是80%，反手接球的概率只有50%。

那么作为他的对手会怎么进攻？他又会如何防守？_{（为了简化描述，姑且假定对手为B）}

可以想象，如果B将球朝A最适宜的位置去打，A将球击回的概率几乎无限趋近于80%。

但是如果位置不顺畅，方式别扭的话，这一概率会下降。

那么这样的话，从B角度上来看，A反手接球的成功率明显低于正手，那么显然每一次进攻之中B进攻反手的倾向性更重。

然而有第三个属性：位置。有过打球经验的人都可以明白，如果自己在某一方面比较劣势，可以通过自己的站位来进行预期的抵消。

A虽然反手接球成功率较低，但是如果位置比较正确比较靠近反手的顺畅位置，那么其成功击回的概率还是可以接受的。

也就是说，从A的角度，愿意牺牲部分正手的位置，用这部分位置换取反手接球成功率的提升。

涉及到数值的部分在这里就不做演算，这个现象称之为最小最大定理：在零和博弈里，参与者的利益严格相反（一人所得等于另一人所失），每个参与者尽量使对手的最大收益最小化，而他自己的对手则努力使自己的最小收益最大化。他们这样做的时候，会出现一个令人惊讶的结果，即最大收益的最小值（最小最大收益）等于最小收益的最大值（最大最小收益）。双方都没办法改善自己的地位，因此这些策略形成这个博弈的一个均衡。

这一结论，我们生活之中但凡玩过赌局的可能深谙此道——

一个拿到烂牌立马就丢，拿到好牌死命加价的玩家，不可能赢到钱。你的策略太明显了，跟你玩的对家只要不傻立马就知道放弃。

此道高手往往是真真假假相互混合，烂牌“诈”好牌，好牌“装”好牌，总之他的牌面会被他的表情和技术均衡。

“三个筹码。”

“跟！加10个筹码。”

“……他什么鬼牌？他是真的大牌，还是炸我？”这就是博弈的艺术了。