《策略思维》——回合制下的博弈、赌局与均衡

我们玩个游戏——

现在有1块钱的钞票,请大家开价。每次叫价以0.1元为单位递增。出价最高者得到这个钞票,但是出价最高者和出价次高者都会支付相当于出价数目的费用。

为了避免那种无穷无尽的攀升,我们将上限设定成最多只能出价2.5元。也就是说,从0.1开始出价,最高到2.5元封顶。

假如说,参与这个游戏的都是极度理智和聪明的人,你觉得谁会赚?

庄家?为什么?

玩家?为什么?怎么赚?(答案,可以在看这篇文章的时候慢慢思考)

一、所谓回合制

回合制就是参与博弈的各方轮流出招,前面人的行动会引起局势的变动,进而影响你的策略;而你的出招也会影响后续的局势,引动后人的策略。

每个参与者在轮到自己的时候,必须展望一下他的这一步行动将会给其他人以后的行动造成什么影响,反过来又会对自己以后的行动造成什么影响。

这种相继出招的博弈有一个总的原则,就是每一个参与者必须预计其他参与者接下来会有什么反应,据此盘算自己的最佳策略。

从这些点,我们可以推导得出一个回合制博弈下的基本法则:

向前展望,倒后推理。

在昨天神枪手的案例之中,A、B、C每个人的行为策略,都是遵循这一法则。

A向前展望:无论第一轮攻击B还是C,形成的结果都不会比自己放空更好;

B向前展望:如果C能活过这一轮,自己一定会被干掉,那么倒后推理——自己要尽量干掉C;

C向前展望:A、B都活着,跟A进入第二轮面对30%的死亡率,跟B进入第二轮面对80%的死亡率,倒后推理——自己的最佳策略显然是干掉B跟A进入第二轮。

C为什么一定会攻击B?

二、弱点均衡

对于绝大多数的普通玩家来说,正手接球跟反手接球的成功率基本上不会相等,无论是兵乓球、羽毛球、网球还是什么类似的游戏。

现在我们不妨假定有这么一个玩家A:正手接球成功的概率是80%,反手接球的概率只有50%。

那么作为他的对手会怎么进攻?他又会如何防守?(为了简化描述,姑且假定对手为B)

可以想象,如果B将球朝A最适宜的位置去打,A将球击回的概率几乎无限趋近于80%。

但是如果位置不顺畅,方式别扭的话,这一概率会下降。

那么这样的话,从B角度上来看,A反手接球的成功率明显低于正手,那么显然每一次进攻之中B进攻反手的倾向性更重。

然而有第三个属性:位置。有过打球经验的人都可以明白,如果自己在某一方面比较劣势,可以通过自己的站位来进行预期的抵消。

A虽然反手接球成功率较低,但是如果位置比较正确比较靠近反手的顺畅位置,那么其成功击回的概率还是可以接受的。

也就是说,从A的角度,愿意牺牲部分正手的位置,用这部分位置换取反手接球成功率的提升。

涉及到数值的部分在这里就不做演算,这个现象称之为最小最大定理:在零和博弈里,参与者的利益严格相反(一人所得等于另一人所失),每个参与者尽量使对手的最大收益最小化,而他自己的对手则努力使自己的最小收益最大化。他们这样做的时候,会出现一个令人惊讶的结果,即最大收益的最小值(最小最大收益)等于最小收益的最大值(最大最小收益)。双方都没办法改善自己的地位,因此这些策略形成这个博弈的一个均衡。

这一结论,我们生活之中但凡玩过赌局的可能深谙此道——

一个拿到烂牌立马就丢,拿到好牌死命加价的玩家,不可能赢到钱。你的策略太明显了,跟你玩的对家只要不傻立马就知道放弃。

此道高手往往是真真假假相互混合,烂牌“诈”好牌,好牌“装”好牌,总之他的牌面会被他的表情和技术均衡。

“三个筹码。”

“跟!加10个筹码。”

“……他什么鬼牌?他是真的大牌,还是炸我?”这就是博弈的艺术了。

三、讨价还价

假设现在有两个叫疼讯和阿狸的孩子商量分一块会融化的冰激凌蛋糕。

首先我们假定这个过程只有一步:疼讯提议,阿狸只能选择同意或者不同意。如果同意疼讯的方案,蛋糕吃掉;如果不同意,蛋糕化了,两个孩子都吃不到。

这个时候疼讯就处在一个非常强有力的地位上——他可以拿走绝大多数的份额,哪怕只给阿狸舔一舔自己吃过的刀叉;阿狸如果不同意疼讯的这个骚主意,那就是连刀叉都没得舔。

如果是绝对理性的策略人,阿狸只能选择同意,不然自己毛都没一个。

但是一旦这个过程可以有两步的时候,情况就不一样了——

疼讯提议,阿狸拒绝之后,此时桌子上还有半个蛋糕。如同之前那般,阿狸提议只给疼讯舔一舔自己的刀叉,疼讯也就面对舔一口刀叉和毛都没两种选择。那疼讯在这种情况下也只能选择舔一口刀叉。

但是倒推回去,既然知道阿狸也掌握了另一半的反手权力,那么疼讯在第一轮提议的时候就知道,必须提议一个阿狸也感到满意的分配方案,否则阿狸反对之后自己可能会沦落到只剩下舔一口的命。

但是阿狸的最大收益是什么?也就是一半的蛋糕,所以疼讯只要让阿狸的收益不低于一半的蛋糕,那么阿狸会老老实实接受这种分配方案,两边和和气气各拿一半。

但是如果这个游戏有三轮呢?四轮?五轮?……2N轮?2N+1轮?(大家可以自己想一想,这个很简单的)

这个案例就是我们现实里面最为常见的讨价还价策略,因为某些因素,讨价还价双方都希望尽快的达成一致(否则总体利益都会受到损害)

但是讨价还价还有几个小规律——

1、谁能在没有协议的情况下过得更好,谁就是越能从讨价还价的利益蛋糕中分得更大的一块。

就说刚刚那个例子之中,如果阿狸在蛋糕之外还有一个面包可以吃,而疼讯什么都没的话,那么阿狸是敢跟疼讯来个一无所有——到头来反正自己有的吃,而疼讯则不敢这样,疼讯只能让出更多的利益换取阿狸的同意。

2、你的损失远远超过我的损失

前面的例子之中,多次出现了让对方舔一口刀叉这种选择。然而实际上,在这种一方占据了绝大部分的主动权,另一方仅仅只能决定“接受”或者是“鱼死网破”的情况之下,真正“让对方只是舔一口刀叉”是极难出现的——因为占尽优势的一方担心对方“鱼死网破”,这时候自己的损失远远超过对方。

就像上例之中疼讯说我要整个蛋糕,给阿狸舔一口刀叉。

阿狸心中不服,玛德凭什么你吃整个蛋糕我就舔一口?反正蛋糕没了我就少舔一口的事,而你疼讯则是损失了整个蛋糕。

所以这种情况在现实之中基本上是不可能出现的,就算是出现了,往往是弱势一方不知道自己的“具体权力/价值”。(比如说公司明明从你身上赚了一百万,偏偏跟你说才赚了两万,然后分给你一万,你可能还感激涕零)

3、第三方或其他事情。

如果在跟阿狸扯皮分蛋糕的时候,疼讯还在跟摆渡就另一个甜品讨价还价,那么疼讯的心态一定是想尽快将某一方面的事情给结束掉,为此宁愿放弃部分利益。

末、小结

这一篇文章里面出现的很多东西可能大家在生活之中已经碰见过,并且也形成了类似的思维策略。

然而对于策略而言,难的不是想明白这些策略的原理,而是利用这些原理做好每一步的算计。

我们回到开篇那个游戏,假如说你是参与游戏的玩家之一,你更希望扮演什么角色(我完全相信你会扮演你认为预期收益更高的那个身份)

但是可以告诉大家,这个游戏,如果是跟一群“基础博弈推断”没有毕业的人玩,庄家基本上是稳赚不赔;

但如果所有的参与者都是一群“博弈推断”掌握娴熟的人,这个游戏其实只有一步,而且赢家是玩家。

EXM?

回复“一块钱”你将得到这个问题的完整推理过程和答案。

明天,将带来【概览系列】《策略思维》——即时博弈里面的囚徒困境与无限重复下的优势策略

经过按部就班的回合制,我们再来看看即时制会出现什么样的情况?

不妨想一想,同时落子的棋牌游戏?石头剪刀布?

还有有时候电话连接中断的时候“您拨打的号码正在通话?”

你的阅读时间就是最好的赞美。

关注我们,概览群书,长见识;修身明理,知是非。