什么是纳什均衡定律?

阿江和小姬是一对正在泡蜜月的情侣。星期六到了。我们应该安排什么节目?周六晚上,中国足球队将在世界杯小组赛中对阵巴西。阿姜天生就是超级球迷,国内甲级联赛他都不放过,更别说国家队和偶像巴西的比赛了。

巧合的是,这个周六晚上,一个著名的俄罗斯芭蕾舞团来到这座城市表演芭蕾舞剧《胡桃夹子》。小荠非常喜欢钢琴和芭蕾等高雅艺术,崇拜俄罗斯歌剧和芭蕾。她怎么能放下正宗的俄罗斯芭蕾?

我们做什么呢其实解决这个问题并不难:一个在家看电视足球比赛,一个去剧院看芭蕾表演。但是,问题是他们是热恋中的恋人,分开度过难得的周六是他们最不想要的。这样,他们才真正面对了一场“游戏”。

我们不妨给阿江和小姬的“满意度”赋一个值:如果阿江看球,小姬一个人去看芭蕾,双方满意度为0;如果两个人一起去看足球,阿姜的满意度是2,小姬的满意度是1。两个人一起去看芭蕾,阿姜的满意度是1。小荠的满意度为2;不应该出现一个人看球,姜一个人看芭蕾的情况。但是,人们还是把这个写出来,假设双方的满意度是-1。

在这个博弈中,双方没有像“囚徒困境”中那样的最优策略,但总会做出更好的选择,因为他们是蜜月中的夫妻。所以我们面对的是一个战略优势不太明显的博弈,而这个博弈的胜负恰恰是纳什均衡研究的对象。

战略优势不明显,也就是说双方都没有“无论对方采取什么策略,我都会采取这个策略比其他任何策略都好”的严格优势策略,所以他们只需要找到双方“相对优势策略”的组合。双方去看足球,或者双方去看芭蕾。这就是我们所说的比较优势战略的组合。一旦到了这样的位置,双方都不想单独改变策略,因为单独改变不好。

比如两个人一起看球,阿姜得2,小姬得1。如果姜改变主意一个人看球,对双方都没好处拿到0;如果小荠改变主意,一个人去看芭蕾舞,对双方都没有好处,所以他们一起去看足球是一个稳定的结局。同样,两个人去看芭蕾也是一个稳定的结局。

这种稳定的结局就是“纳什均衡”。在情侣博弈中,双方都去看足球或者芭蕾,这是博弈的两个纳什均衡。形象地说,纳什均衡其实是一种“僵局”。鉴于别人不改变策略,没有人有兴趣独自改变策略,这种自主改变不会给自己带来好处。

在这个博弈中,如果一方知道对方的策略,他就能做出对自己最有利的选择。所以要保证策略的随机性。

这个概念是由普林斯顿大学数学家约翰·纳什(johnf nash)在1950年建立的。1984因对博弈论的基础性贡献获得诺贝尔经济学奖。

如果用科学的语言来描述纳什均衡,就是说在一个策略组合中,所有参与者都面临这样一种情况:当别人不改变策略时,他此时的策略是最优的。换句话说,如果他此时改变策略,他的支付就会减少。在纳什均衡点上,每个理性的参与者都不会有单独改变策略的冲动。

这听起来很别扭,很难理解,但它是一门不折不扣的科学,受到经济学家的青睐。诺贝尔经济学奖得主萨缪尔森有一句幽默的话:你可以训练一只鹦鹉成为经济学家,因为它只需要学会两个词:供给和需求。博弈论专家坎多利引申说,要成为现代经济学家,这只鹦鹉还必须学会一个词,那就是“纳什均衡”。由此可见纳什均衡在现代经济学中的重要性。

小镇只有一个警察,他负责全镇的治安。现在让我们假设在城镇的一端有一家酒馆,另一端有一家银行。假设这个地区有一个小偷想偷东西。因为技能不足,警察一次只能在一个地方巡逻;而小偷只能去一个地方。

假设银行需要保障的财产价格为20000元,酒馆中的财产价格为1000元。如果警察巡逻一个地方,小偷选择去那里,就会被警察抓住;如果警察没地方巡逻,小偷去了,小偷就盗窃成功了。那么,警察如何巡逻才能发挥最佳效果呢?

警察权衡轻重,只巡逻银行,显然是可取的。这样,警察就可以防止2万元的财产被盗。但是,如果小偷去了酒馆,盗窃就成功了。

这是警察的最佳做法吗?有什么措施可以改进这个策略吗?

在发现纳什均衡之前,可能没有其他答案。但是纳什均衡为我们观察问题打开了一个新的视角。

对于这个例子,虽然不存在纯策略纳什均衡点,也就是玩家在自己的策略空间中选择唯一确定的策略。但是,存在一个混合策略均衡点,在这个均衡点下,参与者的策略选择就是他们的最优(混合)策略选择。

这样警察最好的办法就是警察抽签决定是去银行还是去酒馆。因为银行的价值是酒馆的两倍,所以用两个符号来代表银行,比如1和2符号画到银行,3符号画到酒馆。这样,警察有2/3的机会巡逻银行,有1/3的机会去酒馆。

小偷的最佳选择是:用同样的抽签方式决定是去银行还是去酒馆偷,只抽签1和2去酒馆,抽签3去银行。那么,小偷有1/3的几率去银行,2/3的几率去酒馆。

而且他们的策略要随机,不能让对方知道自己的策略,哪怕是“偏”的策略。如果一方知道另一方的策略之一是“可能的”,那么它就能做出对自己最有利的决定,获胜的可能性就大。

就单对情侣游戏而言,有两个“纳什均衡”:要么一起看球,要么一起看芭蕾。但是,最终结局会落实到什么样的情况,这是博弈论本身没有解决的问题。

我们可以根据经验来分析。更多情况下,结果也会体现先发优势。虽然双方都会受益,但先发者受益更大。中国古代有句话叫“先动者强”。大量的例子表明,在多个纳什均衡的情况下,往往是第一个会有一些优势。

在这里,因为决策或行动具有优先性,所以称之为“动态博弈”。比如说。还没等他们俩商量,就给姜打电话说:我已经买好票了。星期六我们一起去看芭蕾舞好吗?

况且他们是恋人,小姬已经开口了。姜还会当面反驳她吗?如果我们觉得不咨询就买票有点过分,那么我们可以把情况改成小姬打电话给江,建议我们一起去看芭蕾舞,得到允许后再买票。我们可以想象,当姜接到的电话时,他是不会当面反驳她的。这样双方才能最终得到一个满意的结局。