高中语文第五册读书札记

诸葛亮误用马谡，致街亭失陷。孔明在西城，准备出发。他安排的时候，司马懿领兵15万。当时孔明身边没有将军，只有一群文官，五千军士，粮草已经发了一半，城内只剩下两千五百人马。听到这个消息时，所有的官员都面无人色。诸葛亮进城一看，果然尘土飞扬，邴巍兵分两路赶来。诸葛亮对所有的将军都下了命令，但所有的旗帜都被隐藏起来，所有的军队都关闭了他们的商店。开城门，每门用二十个军士，假扮百姓，扫大街。而诸葛亮则头戴仙鹤，头戴黑丝巾，带着两个孩子，一架钢琴，坐在城内瞭望塔前的栏杆上，焚香弹琴。马思毅来到大门口，看见诸葛亮正在烧香弹琴，面带微笑。司马懿大惊，立即叫后军为前军，前军为后军，迅速撤退。司马懿的儿子司马昭问:诸葛亮是不是假装自己没有军队，为什么他的父亲要撤退？司马懿曰:“梁一生谨小慎微，从不冒险。如果今天城门大开，一定会有埋伏。如果我们的士兵前进，他们将陷入计划中。”诸葛亮见魏军撤退，拍手笑逐颜开，众臣无不惊骇。诸葛亮说:司马懿料我一生谨小慎微，从不冒险。看到这里，我怀疑有埋伏，就撤退了。我不是在冒险，所以我必须使用它，因为我必须这样做。我们的士兵只有两千五。如果我们放弃这座城市，我们就会被它俘虏。

我们可以用下面的博弈矩阵来表示这个博弈:

在这场博弈中，“攻”是司马懿的“占优策略”。这个博弈有两个纳什均衡，分别是:(司马懿“进攻”，诸葛亮“守城”)；司马懿“攻城”，诸葛亮“弃城”。但司马懿不知道自己和对方在不同的行动策略下付出了什么，诸葛亮却知道。他们对博弈结构的认识是不对称的:诸葛亮的知识比司马懿多。当然，这种知识的不对称完全是诸葛亮“制造”出来的。

司马懿是怎么推理的？司马懿的推理是“归纳”。司马懿说:“梁一生谨小慎微，从不冒险。如果今天城门打开，就会有埋伏。如果我们的士兵前进，他们将陷入计划中。”在司马懿看来，诸葛亮一生谨小慎微。既然诸葛亮这辈子没冒过险，那这次肯定也不会冒。诸葛亮有埋伏。司马懿在“围”与“退”之间做出了“退”的选择。

在这里，司马懿做了一个错误的战略选择。尽管如此，也不能说司马懿不理智。司马懿因为信息不完全，做出了错误的战略选择。在孔明和司马懿的博弈中，孔明制造了一个空城的假象，目的是让司马懿觉得“围城”很可能会失败。如果用概率论的术语来说，诸葛亮的做法是增加了司马懿进攻失败的主观概率。此时，在司马懿看来，“攻城”更容易失败，“退”的预期效用大于“攻城”。即司马懿认为“攻城”的预期效用低于“撤退”。只有通过这种方法，诸葛亮才能让司马懿退兵。

我知道这是囚徒困境。

也就是AB，两个犯人被抓，关在两个不同的牢房。

如果两人都不坦白，每人只判三年，如果两人都坦白，每人判五年。

如果一个坦白一个不坦白，坦白的判一年，不坦白的判十年。

最好的结果，当然是两个人都不会表白，而是因为信息不对称。

对于A来说，B不表白，不如他表白，B表白，不如他表白。

那么坦白是他的优势策略，他会选择坦白

同样，分析B也会选择表白

最终的结果是两人都在招人并且为了达到不表白的最佳选择。

这就是囚徒困境

一般经济学书籍都会讲到。

囚犯的末日

“囚徒困境”是博弈论中最经典的例子之一。它的模型是这样的:

两名犯罪嫌疑人(A和B)在作案后被警方抓获，并被隔离审讯；警方的政策是“坦白从宽，抗拒从严”，如果两人都坦白，就各判八年；一人坦白，另一人不坦白，坦白释放，不坦白判10年；不坦白的话，证据不足判1年。

在这个例子中，游戏的参与者是两个嫌疑人A和b，他们每个人都有两种策略，分别是招供和不招供，入狱的年数就是他们的报酬。可能出现的四种情况:A和B都坦白或者不坦白，A坦白B不坦白，或者B坦白A不坦白，都是博弈的结果。A和B都是这个博弈的纳什均衡。这是因为，假设A选择坦白，B最好选择坦白，因为B坦白判8年，否认判10年；假设A选择否认，B最好选择坦白，因为B坦白不会被判刑，但否认会被判1年。也就是说，无论A坦白还是否认，B的最佳选择都是坦白。反过来，同样，无论B是坦白还是否认，A的最佳选择也是坦白。结果两人都选择了坦白，被判有期徒刑八年。在这个组合(告白，表白)中，A和B都不能通过单方面的改变行动增加自己的收益，所以谁都没有动力去游离这个组合，所以这个组合就是纳什均衡。

囚徒困境反映了个人理性和集体理性之间的矛盾。如果A和B都选择否认，则各判1年，这显然比两人都选择坦白，各判8年要好得多。当然，A和B在被警察抓到之前可以结成“攻守同盟”，但这未必有用，因为不构成纳什均衡，谁也没有遵守这个协议的积极性。

海盗分了钱

经济学上有一个“海盗分金”的模型，意思是五个海盗抢100金币，他们按照抽签的顺序提出自己的方案:首先1号提出分配方案，然后五个人投票，超过半数同意方案通过，否则他就被扔到海里喂鲨鱼，以此类推。

假设“每个海盗都是极其聪明和理性的”，那么“第一个海盗可以提出什么样的分配方案来最大化自己的收益？”

推理过程如下:

从后往前推。如果1到3的强盗都喂鲨鱼，只剩下4号和5号，5号肯定会投反对票，让4号喂鲨鱼拿走所有金币。所以4号只能靠支援3号保命。

知道了这一点，3号会提出“100，0，0”的分配方案，会把金币全部留给4号和5号，因为他知道4号什么都没得到，但他还是会投赞成票，有了自己的一票，他的方案就能通过。

但如果2号推断3号的计划，就会提出“98，0，1，1”的计划，即放弃3号，给4号和5号各一枚金币。既然方案对4号和5号比对3号更有利，他们就支持他，不希望他出局，被3号分配..这样2号就拿了98个金币。

同样，2号的方案也会被1号理解，会提出(97，0，1，2，0)或(97，0，1，0，2)的方案，即放弃2号，给3号一枚金币，同时，因为1号的方案对3号和4号(或者5号)来说比2号更好，他们会投1号，再加上1号自己的一票，1号的方案就能通过，97金币就能轻松落袋为安。这无疑是1号可以获得最大利益的方案！答案是:1号强盗给了3号强盗1金币，给了4号或5号强盗2，他自己得到了97块。分配方案可以写成(97，0，1，2，0)或(97，0，1，0，2)。

“海盗分金”其实是一个高度简化抽象的模型，体现了游戏的思想。在“海盗分钱”的模式中，任何“分发者”要想让自己的方案通过，关键是事先考虑清楚“挑战者”的分配方案是什么，以最小的成本获得最大的收益，从而拉拢“挑战者”分配方案中最不满意的人。企业中的高层领导在搞内部人控制的时候往往会抛弃二号人物，和会计、出纳搞好关系，因为公司里的小人物容易被收买。

1看似最有可能喂鲨鱼，但他牢牢把握住了先发优势，不仅消除了死亡威胁，而且受益最大。这不就是发达国家在全球化进程中的先发优势吗？而5号看起来最安全，没有死亡威胁，甚至可以占渔翁之利，但因为要看别人脸色，只能分到很少一部分。

但是模型任意改变一个假设条件，最后的结果是不一样的。现实世界远比模型复杂。

首先，现实中，每个人绝对不是“绝对理性”的。回到“海盗分金”的模型，只要3号、4号、5号中有一个偏离了绝对聪明的假设，海盗1无论怎么分都有可能被扔进大海。所以1号首先要考虑的是他的海盗兄弟们的智力和理性是否可靠，否则第一个倒霉。

如果有人更喜欢看自己的伴侣被扔进海里喂鲨鱼。如果是这样，1的自鸣得意方案岂不成了自掘坟墓！

于是就有了“心与腹分离”的说法。因为信息不对称，谎言和虚假承诺大有用武之地，阴谋就会像野草一样生长，乘虚而入。如果2号向3号、4号、5号扔烟雾弹，声称自己一定会在1号提出的任何分配方案中再加一个金币。这样，会有什么结果呢？

通常在现实中，每个人都有自己的公平标准，所以经常会嘀咕“谁动了我的奶酪？”可以预料，一旦1号提出的方案与其设想不符，就会有人大闹一场...在大家大吵大闹的时候，1号能毫发无伤，镇定自若的带着97个金币走出去吗？最有可能的是，盗版者会要求修改规则，然后重新分配。想想二战前希特勒的德国吧！

而如果从博弈变成重复博弈呢？比如说，我们明确一下，下次拿到100金币，海贼二号先分...然后海盗3号会把他们分开...有点像美国总统大选，轮流执掌大权。说白了，其实就是一种民主形式的赃物分享制度。

最可怕的是，另外四个人组成了反对1这个数字的大联盟，制定了新的规则:四个人平分金币，把1这个数字扔到海里...这就是阿q的革命理想:高举平均主义的旗帜，把富人扔进死亡的深渊...

制度规范行为，理性战胜无知！

假设变成了，10人分100金币，50%以上的票数通过，否则他就被扔到海里喂鲨鱼，以此类推。50%是问题的关键，海盗可以自己投。所以如果剩下两个人，不管什么方案都通过，就是100，0。

往上推一步，有三个人的时候，倒数第三个知道如果有两个人，那么它会联合第一个人，给他一个金币。

“向前迈一步。现在又增加了一个更凶猛的海盗P3。P1知道——P3知道他知道——如果P3的方案被否决，游戏将只能由P1和P2继续，P1得不到一枚金币。所以P3知道，只要给P1一枚金币，P1就会同意他的计划(当然，如果不给P1一枚金币，P1反正什么也得不到，宁愿投P3喂鱼)。所以P3的最佳策略是:P1得到1，P2什么也得不到，P3得到99。

P4的情况类似。他只需要两票，给P2一枚金币就能让他投票支持这个方案，因为P2在下一个P3方案中什么也得不到。P5使用了相同的推理方法，只是他必须说服他的两个同伴，所以他给了P1和在P4计划中一无所获的P3每人一个金币，自己留了98个。

以此类推，最终P10的最佳方案是:他自己得到96枚，给P9方案中一无所获的P2、P4、P6和P8一枚金币。

结果，“海盗分金”最后的结果是，P1，P2，P3，P4，P5，P6，P7，P8，P9，P10分别可以得到0，1，0，1，0。

在“海盗分金”中，任何一个“分发者”要想让自己的方案通过，关键在于事先考虑清楚“挑战者”的分配方案是什么，以最小的代价获得最大的利益，从而拉拢“挑战者”分配方案中最不满意的人。

真的难以置信。P10看似最有可能喂鲨鱼，但他牢牢把握住了先发优势，既消除了死亡威胁，又获得了最大利益。而P1看起来最安全，没有死亡威胁，甚至可以占渔翁之利。但是，因为它要看别人的脸色，所以连一小块蛋糕都拿不到，只能救命。

博弈论

博弈论是两个或两个以上的人在平等的博弈中，利用对方的策略来改变自己的对抗策略，以达到获胜目的的理论。博弈论是研究交互式决策的理论。游戏可以分析自己和对手的优缺点，从而确立自己在游戏中的优势。所以有很多博弈论可以帮助玩家分析形势，从而采取相应的策略，最终达到获胜的目的。博弈的类型分为合作博弈、非合作博弈、完全信息博弈、不完全信息博弈、静态博弈、动态博弈等等。

游戏的分类

游戏分为静态游戏和动态游戏。静态博弈是指在博弈中，两个参与者同时选择或者两个人不同时选择，但是后一个参与者不知道前一个参与者采取什么样的具体行动。对双方来说，容易形成混乱的行为重组。因为严格细致的规则，任何人都会因为时间问题、资金问题、心理问题等，在多次均衡后大输。大部分参与静态博弈和动态博弈。动态博弈是指在博弈中，两个参与者有行动的先后顺序，后一个行动者可以观察前一个行动者选择的行动。在动态博弈中，首先采取行动的参与者称为决策者，根据初始样本的选择标准对其进行识别，然后对样本的行为特征进行分类，确定决策者每次的背景信息特征。用人们非常关心的行为概率常数来求解，明显显示了优势的大小和概率分布。动静博弈本身就是一个国家，会有均衡，博弈的最终结果是国家有理。

根据参与者能否形成具有约束力的集体行动协议，博弈可以分为合作博弈和非合作博弈。纳什等博弈论专家研究更多的是非合作博弈。

所谓合作博弈，就是参与者从自身利益出发，与其他参与者协商达成协议或结盟，结果对双方都有利；非合作博弈是指参与者在选择行动时无法达成有约束力的协议。人们分工交换的经济活动是合作博弈，囚徒困境和公共资源的悲剧是非合作博弈。

游戏分为静态游戏和动态游戏。

静态博弈是指参与者同时采取行动，或者即使参与者的行动是有序的，但后来行动的人不知道先行动的人采取了什么行动。

动态博弈是指参与者的行动是有顺序的，后行动者可以知道先行动者的行动。

从知识占有程度来看，博弈可分为完全信息博弈和不完全信息博弈。信息是博弈论的重要内容。完全信息博弈是指参与者对策略组合下所有参与者的策略空间和支付有“完全的了解”，否则就是不完全信息博弈。严格来说，完全信息博弈指的是博弈双方的策略空间以及策略组合下的支付，是一个博弈所有参与者“公共知识”的博弈。对于不完全信息博弈，参与者所做的是最大化他们的期望支付或期望效用。

是一个在胜利之前优先预测比赛的游戏。——《游戏文化盛宴》

游戏哲学的语言也可以反映以下四种游戏分类:

完全信息静态博弈，完全信息动态博弈，不完全信息静态博弈，不完全信息动态博弈。

其中，战略博弈应该属于完全信息静态博弈，而完全信息动态博弈包括扩张博弈和重复博弈。不完全信息静态博弈是基于贝叶斯均衡理论的混合策略的重新解释，而不完全信息动态博弈是以完美贝叶斯均衡为核心概念的信号博弈。

灵活一点

石米把书挂在角落里。隋代的史弥十几岁的时候就被送到杨迪的宫廷里当侍卫。他天生灵活。当他值班时，他环顾四周，被杨迪皇帝发现了。他认为这个男孩不诚实，因此免除了他的差事。李密并不沮丧。回国后，他发奋读书，立志做一个有学问的人。有一次，石米骑着牛出去见朋友。途中他把《汉书》挂在喇叭上，抓紧时间学习。这件事被传为佳话。

董仲舒三年不窥园。董仲舒潜心研究，孜孜不倦。虽然书房后面有个园子，但他专心读书学习，三年没进园子欣赏。董仲舒潜心研究，成为西汉著名的思想家。

佑宁坐定。汉朝时，管宁和华歆是老朋友。有一天，两个人在同桌看书，一些达官贵人坐车路过。管宁不受打扰，照常学习，华歆出去看，羡慕不已。管宁看出华歆和他的朋友们并不是真的志同道合，于是他削桌坐下。管宁终于事业有成了！

匡衡偷走了光明。西汉时，有一个特别有学问的人，名叫匡衡。当匡衡还是个孩子的时候，他家很穷。为了读书，他凿穿邻居文盲家的墙，偷着蜡烛看书，终于感动了邻居的文盲。在大家的帮助下，小匡衡学到了一些东西。汉元帝时，任大夫，经傅、车漆将军石皋推荐，迁为大夫。

车胤胶囊萤火虫夜间阅读。车胤，字武子，晋代南平(今湖北公安)人。他家境贫寒，但学习非常努力。“穷人不常出油，而岳夏却练习抱着几十只萤火虫拍书，没日没夜。”的故事赵阅读已被作为一个美丽的谈话在历史上流传，激励着后世的学者。

陈平忍辱负重，努力学习。陈平在西汉时期很有名。他年轻的时候家里穷，和哥哥相依为命。为了维护父亲的命令，他才华横溢，没有生育，关起门来学习，却得不到嫂子的允许。为了消除兄妹之间的矛盾，他忍受了一次又一次的羞辱。在小姨子的愈演愈烈下，他终于忍无可忍，离家出走，想要环游世界。在被他的兄弟救回后，他不再计较过去。最后，一位老人来到这里免费授课。他完成学业后，辅佐刘邦，取得了巨大的成功。

陆羽弃佛从文。唐代著名学者陆羽，从小是孤儿，由智奇禅师抚养长大。鲁豫虽然在寺庙，但他不想整天念经念佛，喜欢读诗书。鲁豫坚持要下山学习，遭到禅师的反对。禅师为了给鲁豫出难题，更好地教育他，让他学习泡茶。在学习茶艺的过程中，陆羽遇到了一位善良的老婆婆，她不仅学会了复杂的制茶技艺，还学会了很多读书和做人的道理。当鲁豫最后给禅师端来一杯热气腾腾的苦丁茶时，禅师终于答应了他的请求，下山去学习。后来陆羽写出了广为流传的《茶经》，弘扬了祖国的茶文化！

少年包拯学破案。包青天，包拯，自幼聪明好学，特别喜欢推理破案。其父与知府交往密切，包拯从小学习了很多破案知识。尤其是在烧庙杀僧案中，包拯根据现场线索剥茧绢丝，筛选出犯罪嫌疑人后，假扮阎王，试图澄清真相，帮助知府捉到凶手，杀死百姓。他努力学习法律和刑罚的知识，为长大后像神一样破案、为民伸冤打下了深厚的知识基础。

万斯同闭门苦读。清初著名学者、史学家万斯同参与了中国重要的史书《二十四史》的编纂。但是万斯同年轻的时候也是一个淘气的男孩。万斯同因为贪玩，在客人面前丢了面子，所以受到了客人的批评。一怒之下，万斯同掀翻了客人的桌子，被父亲关进图书馆。万斯同从对阅读感到愤怒和厌恶到闭门思考。受到《茶经》的启发，他开始努力学习。转眼间，一年多过去了。万斯同在图书馆读了很多书。他的父亲原谅了他的儿子，万斯同理解他父亲的好意。经过长期的努力，万斯同终于成为一名熟悉史书的知名学者，并参与了《二十四史》中《明史》的编纂。

唐伯虎致力于绘画。唐伯虎是明代著名的画家和作家。当他年轻时，他在绘画方面表现出超人的才能。作为大画家沈周的弟子，唐伯虎自然更加努力学习，很快掌握了绘画技巧，并得到了沈周的高度赞扬。没想到，由于沈周的夸奖，一向谦虚的唐伯虎渐渐变得自满起来。沈周看在眼里，记在心里。一次吃饭时，沈周让唐伯虎打开窗户。唐伯虎发现他的窗户其实是沈周老师的一幅画。唐伯虎感到非常惭愧，并致力于绘画。

屈原在山洞里刻苦学习。屈原小时候不顾长辈反对，躲在山洞里偷偷读诗经，不顾风雨严寒。整整三年，他熟读了305首《诗经》，从这些民歌中汲取了丰富的营养，最终成为一名伟大的诗人。

范仲淹掰马蹄蟹，划粥。范仲淹生长在一个贫穷的家庭。为了学习，他省吃俭用。最后，他的求知欲感动了寺庙长老，他们送他到杜南学院学习。范仲淹仍然坚持简朴的生活习惯，不接受富家子弟的馈赠来磨砺自己的意志。经过努力学习，他终于成为了一名伟大的作家。

司马光的警枕励志。司马光是个爱玩爱睡的孩子，所以一直被丈夫惩罚，被同龄人嘲笑。在他的谆谆教导下，他决心改掉睡觉的坏习惯。为了早起，他睡前喝了满满一肚子的水，但早上没有被吵醒，而是在床上尿尿。于是聪明的司马光用园木做了一个警用枕头。早上一翻身，头就往床板上滑。

玄奘刻苦学佛。玄奘是唐朝的一个和尚。玄奘为了获得原始佛经，于贞观三年八月离开长安，跋涉万里，终于抵达印度。历时17年，撰写了《大唐西域记》，为佛教、人类进步和世界文明做出了巨大贡献。

岳飞是学艺术的，民族英雄岳飞生于乱世，从小家境贫寒。在邻居的支持下，他拜陕西名师周统为师学习武术。在此期间，他目睹了山河破碎，人民流离失所，萌发了学习报国的志向，克服了自满情绪。在名师周统的悉心教导下，最终成为岳家大盗，并带领桂王、唐宪等伙伴加入抗金救国的爱国洪流。

李贵镇学会了画老虎。五代著名的虎画家李贵镇，从小喜欢绘画，尤其喜欢画老虎。然而，因为他从未见过真正的老虎，所以他总是把它画成一只病猫。所以他决定到森林深处去看看真正的老虎。在猎户叔叔的帮助下，他终于看到了真正的老虎。通过大量的写生和临摹，他的画虎技艺突飞猛进，作品中的老虎栩栩如生，有些扑朔迷离。此后，他大半辈子都在游历许多名山大川，见多了飞禽走兽，最终成为一代绘画大师。

改革开放

中国改革开放取得了巨大成就。通过这场伟大的改革开放，实现了三个伟大转折:第一个伟大转折是从高度集中的计划经济体制向充满生机和活力的社会主义市场经济体制转变；第二次大转折是从封闭半封闭的社会向全方位开放的社会转变；第三个伟大转折是人民生活从温饱到基本小康的社会转型。没有改革开放，就不可能实现三大转变。因此，十一届三中全会提出的改革开放是当代中国命运的关键抉择。

改革开放是发展中国特色社会主义、实现中华民族伟大复兴的必由之路，指出只有改革开放才能发展中国、发展社会主义、发展马克思主义。我说的这两段话，高度概括了为什么要改革，为什么改革是必由之路，为什么是当代中国的命运选择。没有改革开放，就不可能发展中国，发展社会主义，发展马克思主义。因此，我们应该深刻理解十一届三中全会提出的这一高度理论化的概括。

用发展的眼光看问题

创新的想法

我自己组织的，我的检讨也不是我写的。...