在1930年代,约翰·冯·诺依曼(John von Neumann)和奥斯卡·摩根斯坦(Oscar Morgenstern)成为了一个新的有趣的数学领域(称为“博弈论”)的创始人。 在1950年代,年轻的数学家约翰·纳什(John Nash)对这一领域产生了兴趣。 平衡理论成为他论文的主题,他在21岁时就写了这篇论文。 因此诞生了一种名为“纳什均衡”的新游戏策略,该策略在多年后的1994年获得了诺贝尔奖。
![Image](https://images.aboutlaserremoval.com/img/novosti-i-obshestvo/6/ravnovesie-po-neshu-teoriya-igr-dlya-ekonomistov.jpg)
撰写论文和普遍接受之间的巨大差距是对数学家的考验。 天才没有得到承认,导致了严重的精神侵犯,但约翰·纳什(John Nash)凭借出色的逻辑思维得以解决这一问题。 他的“纳什均衡”理论被授予诺贝尔奖,他的电影改编自电影《美丽的心灵》(“ Mind Games”)。
博弈论
由于纳什均衡理论通过互动来解释人的行为,因此值得考虑博弈论的基本概念。
当结果取决于几个人的决策和行为时,博弈论根据博弈的类型研究参与者(代理人)在彼此互动的条件下的行为。 参与者根据他对他人行为的预测进行决策,这被称为游戏策略。
还有一种占主导地位的策略,即参与者获得其他参与者的任何行为的最佳结果。 这是玩家最好的双赢策略。
囚徒困境与科学突破
囚徒的困境是游戏的一个例子,参与者被迫做出理性的决定,在替代冲突的情况下达到一个共同的目标。 问题是,他要认识到他的个人和共同利益以及无法同时获得这两种选择,所以将选择哪种选择。 玩家似乎被困在严酷的游戏环境中,这有时会使他们思考效率很高。
美国数学家约翰·纳什(John Nash)探索了这个难题。 他带来的平衡变成了这种革命。 这种新思想尤其生动地影响了经济学家关于市场参与者如何通过紧密互动和利益交叉考虑他人利益来做出选择的观点。
最好用具体的例子研究博弈论,因为这种数学学科本身并不是一门枯燥的理论。
囚徒困境示例
例如,两个人被抢,落入警方手中,并在单独的牢房中受到讯问。 同时,警察为每位参与者提供了有利条件,如果他向伴侣作证,将在释放他的条件下。 每个犯罪分子都会考虑以下策略:
- 双方同时作证并被判处2.5年监禁。
- 双方都保持沉默,并分别获得1年,因为在这种情况下,他们有罪的证据基础很小。
- 一个提供证据并获得自由,而另一个则保持沉默并入狱5年。
显然,此案的结果取决于双方的决定,但由于他们坐在不同的牢房中而无法达成协议。 在争取共同利益的斗争中,他们个人利益的冲突也很明显。 每个囚犯有两个行动选择和四个结果选择。
推理链
因此,犯罪分子A正在考虑以下选择:
- 我保持沉默,我的伴侣保持沉默-我们俩都将被判入狱1年。
- 我给我的伴侣,他给我-我们俩都将坐牢2.5年。
- 我保持沉默,我的伴侣正在将我移交给我-我将被判5年徒刑,他将获得自由。
- 我租我的伴侣,他却保持沉默-我获得自由,他已入狱5年。
为了清楚起见,我们给出了可能的解决方案和结果的矩阵。
囚徒困境的可能结果表。
问题是每个参与者会选择什么?
“沉默,你不会说话”或“沉默,你不会说话”
要了解参与者的选择,您需要遍历他的思想链。 按照犯罪分子A的推理:如果我保持沉默并保持对伴侣的沉默,我们将获得最低任期(1年),但我无法确定他的行为。 如果他为我作证,那么我作证也更好,否则我可以坐5年。 我宁愿坐2.5年而不是5年。 如果他什么也没说,那么我还要作证,因为这样我将获得自由。 乙成员也以同样的方式争论。
不难理解,每个罪犯的主要策略都是作证。 当两名罪犯提供证据并获得他们的“奖品”时(即坐牢2.5年),就会出现该游戏的最佳点。 纳什的博弈论称其为均衡。
纳什最优最优解
纳什科夫观点的革命是,如果我们考虑个人参与者及其个人利益,那么这种平衡就不是最佳的。 毕竟,最好的选择是保持沉默,然后自由自在。
纳什均衡是利益汇合点,每个参与者只有在其他参与者选择特定策略时才选择最适合他的选项。
考虑到两个罪犯都保持沉默并且每人仅获得一年的选择权,我们可以称其为“帕累托最优”选择权。 但是,只有犯罪分子事先同意,才有可能。 但是,即使这样做也不能保证这一结果,因为诱使人们回避说服并避免惩罚的诱惑很大。 彼此之间缺乏完全的信任以及5岁的危险迫使人们选择认可的选择。 反思参与者将保持沉默,一致行动这一事实,这是不合理的。 如果我们研究纳什均衡,就可以得出这样的结论。 实例仅证明了这一点。
自私或理性
纳什均衡理论已经得出了惊人的结论,驳斥了以前存在的原理。 例如,亚当·斯密(Adam Smith)认为每个参与者的行为都是绝对自私的,这使系统处于平衡状态。 这种理论被称为“市场的看不见的手”。
约翰·纳什(John Nash)看到,如果所有参与者都为追求自己的利益而行动,那么这将永远不会导致最佳的团队结果。 考虑到每个参与者固有的理性思维,纳什均衡策略提供的选择更有可能。
纯男性实验
一个生动的例子是“金发悖论”游戏,尽管它似乎不合适,但却是生动的例证,展示了纳什博弈论的工作原理。
在这个游戏中,您需要想象自由球员的陪伴来到了酒吧。 接下来是一群女孩,一个金发女郎说,其中一个比其他女孩更好。 男人如何表现出自己的最佳女友?
因此,这些家伙的理由是:如果每个人都开始认识金发女郎,那么她很可能不会与任何人见面,那么她的朋友们将不愿见面。 没有人愿意成为第二个后备。 但是,如果男孩选择避开金发女郎,那么每个男孩在女孩中找到好女朋友的可能性就很高。
纳什均衡的情况对男人来说并不是最佳的,因为每个人追求自己的私利时,都会选择一个金发。 显然,只追求自私的利益将等于集团利益的崩溃。 纳什均衡意味着每个人都按照自己的个人利益行事,这与整个团队的利益息息相关。 这不是每个人个人的最佳选择,而是基于整体成功策略的每个人的最佳选择。
我们一生都是一场游戏
当您期望其他参与者做出某种理性行为时,在真实条件下进行决策与游戏非常相似。 在商业,工作,团队,公司,甚至与异性的关系中。 从大笔交易到普通的生活状况,所有事物都遵守一项法律或另一部法律。
当然,考虑到的与罪犯和酒吧的游戏情况仅仅是证明纳什平衡的出色例证。 这种困境的例子经常出现在真实的市场中,这在控制着市场的两个垄断者的情况下尤其有效。
混合策略
通常,我们不会一次参与多个游戏。 在一种理性策略的指导下为一种游戏选择一个选项,但您却进入了另一种游戏。 经过几次理性的决定,您可能会发现您的结果不适合您。 怎么办
考虑两种策略:
- 纯粹的策略是参与者的行为,它来自于思考其他参与者的可能行为。
- 混合策略或随机策略是随机选择纯策略或以一定概率选择纯策略。 此策略也称为随机。
考虑到这种行为,我们重新审视了纳什均衡。 如果早先说过玩家选择一次策略,那么可以想象出另一种行为。 我们可以接受玩家以一定概率随机选择策略的选项。 在纯策略中找不到纳什均衡的游戏总是将它们混合在一起。
混合策略中的纳什均衡称为混合均衡。 这是一种平衡,只要其他参与者以给定的频率选择他们的策略,每个参与者就可以选择最优的频率来选择他们的策略。