什么是纳什均衡定律？

阿江和小姬是一对正在泡蜜月的情侣。星期六到了。我们应该安排什么节目？周六晚上，中国足球队将在世界杯小组赛中对阵巴西。阿姜天生就是超级球迷，国内甲级联赛他都不放过，更别说国家队和偶像巴西的比赛了。

巧合的是，这个周六晚上，一个著名的俄罗斯芭蕾舞团来到这座城市表演芭蕾舞剧《胡桃夹子》。小荠非常喜欢钢琴和芭蕾等高雅艺术，崇拜俄罗斯歌剧和芭蕾。她怎么能放下正宗的俄罗斯芭蕾？

我们做什么呢其实解决这个问题并不难:一个在家看电视足球比赛，一个去剧院看芭蕾表演。但是，问题是他们是热恋中的恋人，分开度过难得的周六是他们最不想要的。这样，他们才真正面对了一场“游戏”。

我们不妨给阿江和小姬的“满意度”赋一个值:如果阿江看球，小姬一个人去看芭蕾，双方满意度为0；如果两个人一起去看足球，阿姜的满意度是2，小姬的满意度是1。两个人一起去看芭蕾，阿姜的满意度是1。小荠的满意度为2；不应该出现一个人看球，姜一个人看芭蕾的情况。但是，人们还是把这个写出来，假设双方的满意度是-1。

在这个博弈中，双方没有像“囚徒困境”中那样的最优策略，但总会做出更好的选择，因为他们是蜜月中的夫妻。所以我们面对的是一个战略优势不太明显的博弈，而这个博弈的胜负恰恰是纳什均衡研究的对象。

战略优势不明显，也就是说双方都没有“无论对方采取什么策略，我都会采取这个策略比其他任何策略都好”的严格优势策略，所以他们只需要找到双方“相对优势策略”的组合。双方去看足球，或者双方去看芭蕾。这就是我们所说的比较优势战略的组合。一旦到了这样的位置，双方都不想单独改变策略，因为单独改变不好。

比如两个人一起看球，阿姜得2，小姬得1。如果姜改变主意一个人看球，对双方都没好处拿到0；如果小荠改变主意，一个人去看芭蕾舞，对双方都没有好处，所以他们一起去看足球是一个稳定的结局。同样，两个人去看芭蕾也是一个稳定的结局。

这种稳定的结局就是“纳什均衡”。在情侣博弈中，双方都去看足球或者芭蕾，这是博弈的两个纳什均衡。形象地说，纳什均衡其实是一种“僵局”。鉴于别人不改变策略，没有人有兴趣独自改变策略，这种自主改变不会给自己带来好处。

在这个博弈中，如果一方知道对方的策略，他就能做出对自己最有利的选择。所以要保证策略的随机性。

这个概念是由普林斯顿大学数学家约翰·纳什(johnf nash)在1950年建立的。1984因对博弈论的基础性贡献获得诺贝尔经济学奖。

如果用科学的语言来描述纳什均衡，就是说在一个策略组合中，所有参与者都面临这样一种情况:当别人不改变策略时，他此时的策略是最优的。换句话说，如果他此时改变策略，他的支付就会减少。在纳什均衡点上，每个理性的参与者都不会有单独改变策略的冲动。

这听起来很别扭，很难理解，但它是一门不折不扣的科学，受到经济学家的青睐。诺贝尔经济学奖得主萨缪尔森有一句幽默的话:你可以训练一只鹦鹉成为经济学家，因为它只需要学会两个词:供给和需求。博弈论专家坎多利引申说，要成为现代经济学家，这只鹦鹉还必须学会一个词，那就是“纳什均衡”。由此可见纳什均衡在现代经济学中的重要性。

小镇只有一个警察，他负责全镇的治安。现在让我们假设在城镇的一端有一家酒馆，另一端有一家银行。假设这个地区有一个小偷想偷东西。因为技能不足，警察一次只能在一个地方巡逻；而小偷只能去一个地方。

假设银行需要保障的财产价格为20000元，酒馆中的财产价格为1000元。如果警察巡逻一个地方，小偷选择去那里，就会被警察抓住；如果警察没地方巡逻，小偷去了，小偷就盗窃成功了。那么，警察如何巡逻才能发挥最佳效果呢？

警察权衡轻重，只巡逻银行，显然是可取的。这样，警察就可以防止2万元的财产被盗。但是，如果小偷去了酒馆，盗窃就成功了。

这是警察的最佳做法吗？有什么措施可以改进这个策略吗？

在发现纳什均衡之前，可能没有其他答案。但是纳什均衡为我们观察问题打开了一个新的视角。

对于这个例子，虽然不存在纯策略纳什均衡点，也就是玩家在自己的策略空间中选择唯一确定的策略。但是，存在一个混合策略均衡点，在这个均衡点下，参与者的策略选择就是他们的最优(混合)策略选择。

这样警察最好的办法就是警察抽签决定是去银行还是去酒馆。因为银行的价值是酒馆的两倍，所以用两个符号来代表银行，比如1和2符号画到银行，3符号画到酒馆。这样，警察有2/3的机会巡逻银行，有1/3的机会去酒馆。

小偷的最佳选择是:用同样的抽签方式决定是去银行还是去酒馆偷，只抽签1和2去酒馆，抽签3去银行。那么，小偷有1/3的几率去银行，2/3的几率去酒馆。

而且他们的策略要随机，不能让对方知道自己的策略，哪怕是“偏”的策略。如果一方知道另一方的策略之一是“可能的”，那么它就能做出对自己最有利的决定，获胜的可能性就大。

就单对情侣游戏而言，有两个“纳什均衡”:要么一起看球，要么一起看芭蕾。但是，最终结局会落实到什么样的情况，这是博弈论本身没有解决的问题。

我们可以根据经验来分析。更多情况下，结果也会体现先发优势。虽然双方都会受益，但先发者受益更大。中国古代有句话叫“先动者强”。大量的例子表明，在多个纳什均衡的情况下，往往是第一个会有一些优势。

在这里，因为决策或行动具有优先性，所以称之为“动态博弈”。比如说。还没等他们俩商量，就给姜打电话说:我已经买好票了。星期六我们一起去看芭蕾舞好吗？

况且他们是恋人，小姬已经开口了。姜还会当面反驳她吗？如果我们觉得不咨询就买票有点过分，那么我们可以把情况改成小姬打电话给江，建议我们一起去看芭蕾舞，得到允许后再买票。我们可以想象，当姜接到的电话时，他是不会当面反驳她的。这样双方才能最终得到一个满意的结局。