以太坊im钱包下载|纳什均衡点

作者: 以太坊im钱包下载
2024-03-08 02:20:03

三十分钟理解博弈论“纳什均衡” - 知乎

三十分钟理解博弈论“纳什均衡” - 知乎切换模式写文章登录/注册三十分钟理解博弈论“纳什均衡”大蟹科技互联网/通信/经济规律/博弈论/java/区块链本文出自Bin的专栏blog.csdn.net/xbinworld纳什均衡(或者纳什平衡),Nash equilibrium ,又称为非合作博弈均衡,是博弈论的一个重要策略组合,以约翰·纳什命名。约翰·纳什,生于1928年6月13日。著名经济学家、博弈论创始人、《美丽心灵》男主角原型。前麻省理工学院助教,后任普林斯顿大学数学系教授,主要研究博弈论、微分几何学和偏微分方程。由于他与另外两位数学家(经济学家,约翰·C·海萨尼和莱因哈德·泽尔腾)在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和经济学产生了重大影响,而获得1994年诺贝尔经济学奖。纳什的人生非常曲折,一度学术成果不被认可,甚至换上严重的精神分裂症,在爱的力量下在很多年后奇迹般地恢复,并最终获得诺内尔经济学奖。影片《美丽心灵》(A Beautiful Mind)是一部改编自同名传记而获得奥斯卡金像奖的电影,影片以约翰·纳什与他的妻子艾莉西亚(曾离婚,但2001年复婚)以及普林斯顿的朋友、同事的真实感人故事为题材,艺术地重现了这个爱心呵护天才的传奇故事。纳什均衡定义经济学定义[3]所谓纳什均衡,指的是参与人的这样一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。换句话说,如果在一个策略组合上,当所有其他人都不改变策略时,没有人会改变自己的策略,则该策略组合就是一个纳什均衡。数学定义纳什均衡的定义:在博弈G=﹛S1,…,Sn:u1,…,un﹜中,如果由各个博弈方的各一个策略组成的某个策略组合(s1*,…,sn*)中,任一博弈方i的策略si*,都是对其余博弈方策略的组合(s1*,…s*i-1,s*i+1,…,sn*)的最佳对策,也即ui(s1*,…s*i-1,si*,s*i+1,…,sn*)≥ui(s1*,…s*i-1,sij*,s*i+1,…,sn*)对任意sij∈Si都成立,则称(s1*,…,sn*)为G的一个纳什均衡。注:经济学定义从字面上还是相对比较好理解的;这里稍微解释一下数学定义,博弈论也称Game Theory,一场博弈用G表示,Si表示博弈方i的策略,ui表示收益。因此,纳什均衡的意思是:任何一方采取的策略都是对其余所有方采取策略组合下的最佳对策;当所有其他人都不改变策略时,为了让自己的收益最大,任何一方都不会(或者无法)改变自己的策略,这个时候的策略组合就是一个纳什均衡。纳什证明了在每个参与者都只有有限种策略选择、并允许混合策略的前提下,纳什均衡一定存在。以两家公司的价格大战为例,纳什均衡意味着两败俱伤的可能:在对方不改变价格的条件下,既不能提价,否则会进一步丧失市场;也不能降价,因为会出现赔本甩卖。于是两家公司可以改变原先的利益格局,通过谈判寻求新的利益评估分摊方案,也就是Nash均衡。类似的推理当然也可以用到选举,群体之间的利益冲突,潜在战争爆发前的僵局,议会中的法案争执等。纳什均衡案例以下介绍几个经典的纳什均衡案例[2][4],因为本文主要是以科普为主,所以案例不会涉及到复杂深奥的经济学问题(事实上,我也不懂,哈~)。(1)囚徒困境假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。此时产生了两个嫌疑人之间的一场博弈:表中的数字表示A,B各自的判刑结果。博弈论分析中一般都用这样的表来表示。该案例,显然最好的策略是双方都抵赖,结果是大家都只被判1年。但是由于两人处于隔离的情况,首先应该是从心理学的角度来看,当事双方都会怀疑对方会出卖自己以求自保、其次才是亚当·斯密的理论,假设每个人都是“理性的经济人”,都会从利己的目的出发进行选择。这两个人都会有这样一个盘算过程:假如他坦白,如果我抵赖,得坐10年监狱,如果我坦白最多才8年;假如他要是抵赖,如果我也抵赖,我就会被判一年,如果我坦白就可以被释放,而他会坐10年牢。综合以上几种情况考虑,不管他坦白与否,对我而言都是坦白了划算。两个人都会动这样的脑筋,最终,两个人都选择了坦白,结果都被判8年刑期。注:亚当·斯密的理论(“看不见的手”原理),在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。但是我们可以从“纳什均衡”中引出“看不见的手”原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。(2)智猪博弈猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。那么,两只猪各会采取什么策略?答案是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。(3)普通范式博弈GOO公司和SAM公司是某手机产品生态的两大重量级参与者,双方在产业链的不同位置上各司其职且关系暧昧,有时也往往因商业利益和产品影响力的争夺而各怀异心。二者的收益也随着博弈的变化而不断更替。上图表格模拟了两家公司的博弈现状,双方各有两个可选策略“合作”与“背叛”,格中的四组数据表示四个博弈结局的分数(收益),每组数据的第一个数字表示GOO公司的收益,后一个数字表示SAM公司的收益。博弈是同时进行的,一方参与者必须站在对方的角度上来思考我方的策略选择,以追求收益最大化。这在博弈论里称作Putting yourselves into other people’s shoes。现在我们以GOO公司为第一人称视角来思考应对SAM公司的博弈策略。假如SAM公司选择合作,那么我方也选择合作带来的收益是3,而我方选择背叛带来的收益是5,基于理性的收益最大化考虑,我方应该选择背叛,这叫严格优势策略;假如SAM公司选择背叛,那么我方选择合作带来的收益是-3,而选择背叛带来的收益为-1,为使损失降到最低,我方应该选择背叛。最后,GOO公司的分析结果是,无论SAM公司选择合作还是背叛策略,我方都必须选择背叛策略才能获得最大化的收益。同理,当SAM公司也以严格优势策略来应对GOO公司的策略选择时,我们重复上述分析过程,就能得出结论:无论GOO公司选择合作还是背叛策略,SAM公司都必须选择背叛策略才能获得最大化收益。最后我们发现,本次博弈的双方都采取了背叛策略,各自的收益都为-1,这是一个比较糟糕的结局,尽管对任何一方来说都不是最糟糕的那种。这种局面就是著名的“囚徒困境”。但是,博弈的次数往往不止一次,就像COO与SAM公司双方的商业往来也许会有很多机会。当二者经历了多次背叛策略的博弈之后,发现公式上还有一个(3,3)收益的双赢局面,这比(-1,-1)的收益结果显然要好很多,因此二者在之后的博弈过程中必然会尝试互建信任,从而驱使双方都选择合作策略。这里有一个理想化假设,那就是假设双方都知道博弈次数是无限的话,也就是说双方的商业往来是无止尽的,那么二者的策略都将持续选择合作,最终的博弈收益将定格在(3,3),这就是一个纳什均衡。既然博弈次数是无限的,那么任何一方都没有理由选择背叛策略去冒险追求5点短暂收益,而招致对方在下一轮博弈中的报复(这种报复在博弈论里称作“以牙还牙”策略)。还有另一种假设情况是,假使双方都知道博弈次数是有限的,也许下一次博弈就是最后一次,那么为了避免对方在最后一轮博弈中选择背叛策略而使我方遭受-3的收益损失,于是双方都重新采取了背叛的策略选择,最后的博弈结果又回到了(-1,-1),这就形成了第二个纳什均衡。由此可见,随着次数(博弈性质)的变化,纳什均衡点也并非唯一。(4)饿狮博弈假设有A、B、C、D、E、F六只狮子(强弱从左到右依次排序)和一只绵羊。假设狮子A吃掉绵羊后就会打盹午睡,这时比A稍弱的狮子B就会趁机吃掉狮子A,接着B也会午睡,然后狮子C就会吃掉狮子B,以此类推。那么问题来了,狮子A敢不敢吃绵羊?为简化说明,我们先给出此题的解法。该题须采用逆向分析法,也就是从最弱的狮子F开始分析,依次前推。假设狮子E睡着了,狮子F敢不敢吃掉狮子E?答案是肯定的,因为在狮子F的后面已没有其它狮子,所以狮子F可以放心地吃掉午睡中的狮子E。继续前推,既然狮子E睡着会被狮子F吃掉,那么狮子E必然不敢吃在他前面睡着的狮子D。再往前推,既然狮子E不敢吃掉狮子D,那么D则可以放心去吃午睡中的狮子C。依次前推,得出C不吃,B吃,A不吃。所以答案是狮子A不敢吃掉绵羊。推理结果如下图: 但是,如果我们在狮子F的后面增加了一只狮子G,总数变成7只,用逆向分析法按照上题步骤再推一次,很容易得出结论:狮子G吃,狮子F不吃,E吃,D不吃,C吃,B不吃,A吃。这次的答案变成了狮子A敢吃掉绵羊。对比两次博弈我们发现,狮子A敢不敢吃绵羊取决于狮子总数的奇偶性,总数为奇数时,A敢吃掉绵羊;总数为偶数时,A则不敢吃。因此,总数为奇数和总数为偶数的狮群博弈结果形成了两个稳定的纳什均衡点。(5)硬币正反你正在图书馆枯坐,一位陌生美女主动过来和你搭讪,并要求和你一起玩个数学游戏。美女提议:“让我们各自亮出硬币的一面,或正或反。如果我们都是正面,那么我给你3元,如果我们都是反面,我给你1元,剩下的情况你给我2元就可以了。”那么该不该和这位姑娘玩这个游戏呢?每一种游戏依具其规则的不同会存在两种纳什均衡,一种是纯策略纳什均衡,也就是说玩家都能够采取固定的策略(比如一直出正面或者一直出反面),使得每人都赚得最多或亏得最少;或者是混合策略纳什均衡,而在这个游戏中,便应该采用混合策略纳什均衡。假设我们出正面的概率是x,反面的概率是1-x,美女出正面的概率是y,反面的概率是1-y。为了使利益最大化,应该在对手出正面或反面的时候我们的收益都相等,由此列出方程就是3x + (-2)(1-x)=(-2) * x + 1*( 1-x )——解方程得x=3/8;同样,美女的收益,列方程-3y + 2( 1-y)= 2y+ (-1) * ( 1-y)——解得y也等于3/8。于是,我们就可以算美女每次的期望收益是: (1-y)(2x-(1-x)) + y(-3x+2(1-x)) = 1/8元,也就是说,双方都采取最优策略的情况下,平均每次美女赢1/8元。其实只要美女采取了(3/8,5/8)这个方案,不论你再采用什么方案,都是不能改变局面的。如果全部出正面,每次的期望收益是 (3+3+3-2-2-2-2-2)/8=-1/8元;如果全部出反面,每次的期望收益也是(-2-2-2+1+1+1+1+1)/8=-1/8元。比如你用完全随机(1/2,1/2)策略,收益是1/2(3/8 * 3 + 5/8 * (-20)) + 1/2(3/8 * (-2) + 5/8 * 1) = -1/8;实际上,不论你用什么策略,你的收益都是-1/8,也就是说,随便玩一种策略,你都是在纳什均衡状态中的,所以,这个把戏你随便怎么玩,都是亏的。这个例子中是没有纯战略纳什均衡的,因为只出一种策略,肯定有一方要亏钱,所以并不是其均衡状态(明明只要换一边就可以赚钱了,所以不是最佳策略);而混合纳什均衡是纯在的,事实上,Nash告诉我们“每个参与者都只有有限种策略选择、并允许混合策略的前提下,纳什均衡一定存在”,如果美女出(3/8,5/8)这个方案,另一边任何玩法都是期望收益一样的,也就满足了纳什均衡的条件。参考资料[1] http://baike.baidu.com/view/52630.htm,百度百科:约翰·纳什 [2] http://baike.baidu.com/view/28460.htm,百度百科:纳什均衡 [3] 高鸿业.西方经济学(微观部分)第五版:人民大学出版社,2011:292-296 [4] http://www.vccoo.com/v/7074d4,一般人也能看懂的纳什均衡案例发布于 2018-08-07 13:19​赞同 433​​29 条评论​分享​喜欢​收藏​申请

纳什均衡 (Nash Equilibrium) - 知乎

纳什均衡 (Nash Equilibrium) - 知乎首页知乎知学堂发现等你来答​切换模式登录/注册纳什均衡 (Nash Equilibrium)“纳什均衡“是由美国数学家小约翰·福布斯·纳什(John Forbes Nash Jr),在1950年获得美国普林斯顿大学的博士学位的只有28页的博士论文中提出的一个“博弈论”的概念,根据纳什的说…查看全部内容关注话题​管理​分享​百科讨论精华视频等待回答详细内容概念“纳什均衡“是由美国数学家小约翰·福布斯·纳什(John Forbes Nash Jr),在1950年获得美国普林斯顿大学的博士学位的只有28页的博士论文中提出的一个“博弈论”的概念,根据纳什的说法,“一个纳什平衡点是当其余参与者的策略保持不变时,能够令参与者的混合策略最大化其收益的一个n元组”。[1]“纳什均衡“广泛运用在经济学、计算机科学、演化生物学、人工智能、会计学、政策和军事理论等方面。1994年,纳什和其他两位博弈论学家约翰·海萨尼和莱因哈德·泽尔腾共同获得了诺贝尔经济学奖。[2]小约翰·福布斯·纳什最为我们所熟知的纳什均衡问题就是囚徒困境,这是一个非零和博弈问题。与零和博弈零和博弈所谓零和博弈,即博弈方的利益之和为零或一个常数,即一方有所得,其他方必有所失,比如分蛋糕问题。[3]有的人多必然有的人少,要达到平衡点或者说最公平的方案,就是让切蛋糕的人最后挑选,这样至少在两个人分蛋糕的时候他就会尽量让蛋糕均衡。纳什均衡问题却是一个非零和博弈问题,如果双方合作是可以取得共赢的。比如上面的囚徒困境,两个罪犯被警察抓住了,各自关押不能交流。如果双方都认罪,各自关押2年。如果一方认罪一方不认罪,则认罪的释放,不认罪的被关押3年。如果双方都不认罪,则各自关押1年,这就是“纳什平衡点”。如果从第三方看,两人都不认罪是最佳的,总共加起来只关押2年。但是从个人角度来看就有风险了,因为对方的背叛导致可能自己被关3年,所以最后很有可能两者选择了加起来被关押年数最差的结果,即各自关2年,互相不配合。这就是困境,它反应出难以达到“纳什平衡点”。生成网络GAN由于在图像处理领域,所以再举一个图像领域的例子,最近几年被广泛研究的生成对抗网络,就要求解一个纳什均衡问题。上面是生成对抗网络的损失,关于生成对抗网络如果不懂,可以自行查找资料或者移步我们的文章判别器D的学习目标:D(x)大,D(G(z))小,故要最大化上式生成器G的学习目标:D(G(z))大,故要最小化上式两者相互对抗,共同学习。训练的过程是一个交替进行的过程。先更新判别器,再更新生成器,然后往复循环。上面的图展示了这个过程,黑色虚线是真实分布,绿色实线是生成模型的学习过程,蓝色虚线是判别模型的学习过程。一开始的时候两者都很挫,判别器先学习,但是不能太好,太好一下子就优化完了(loss变得很低),生成器就没有了梯度的指导了,反之亦然。正是在判别器慢慢学,生成器也慢慢学,两者一起变好的美好愿望下才有可能优化地比较好,但是谁能保证对方乖乖配合呢?如上面的这个问题,x的学习要最小化xy,y的学习要最小化-xy,但是x和y两者不配合,各自有各自的变化方向,导致这个目标始终不能实现,这也是GAN面临的一个重要问题。浏览量927 万讨论量3202  帮助中心知乎隐私保护指引申请开通机构号联系我们 举报中心涉未成年举报网络谣言举报涉企虚假举报更多 关于知乎下载知乎知乎招聘知乎指南知乎协议更多京 ICP 证 110745 号 · 京 ICP 备 13052560 号 - 1 · 京公网安备 11010802020088 号 · 京网文[2022]2674-081 号 · 药品医疗器械网络信息服务备案(京)网药械信息备字(2022)第00334号 · 广播电视节目制作经营许可证:(京)字第06591号 · 服务热线:400-919-0001 · Investor Relations · © 2024 知乎 北京智者天下科技有限公司版权所有 · 违法和不良信息举报:010-82716601 · 举报邮箱:jubao@zhihu.

从博弈参与者的角度看,求纳什均衡点到底有什么意义? - 知乎

从博弈参与者的角度看,求纳什均衡点到底有什么意义? - 知乎首页知乎知学堂发现等你来答​切换模式登录/注册博弈论计算机博弈纳什均衡 (Nash Equilibrium)电力市场从博弈参与者的角度看,求纳什均衡点到底有什么意义?将实际问题建模成一个博弈问题,求出纳什均衡。该纳什均衡对于博弈方的实际决策是否有意义?(题主看到网上很多都是讲解纳什均衡的概念,但不太理解计算它是否有…显示全部 ​关注者2被浏览4,508关注问题​写回答​邀请回答​好问题​添加评论​分享​2 个回答默认排序能源杂谈中心​中国电力市场 | 海外能源研究 | 时间宝贵私信勿扰​ 关注试着从理论概念到实际应用逐渐解释纳什均衡的意义。纳什均衡是博弈论的一个概念,题主对其概念应该已经非常了解了,不展开说了,简单总结即:“在达到纳什均衡时,每个博弈者的选择都是从他自身的角度看,使自己期望收益得到最大值的选择(当然从第三方来看,可能这个选择并不是最优的,但是从当事人来看是最优的)”目前关于解释纳什均衡的实际意义,比较经典的是“囚徒困境”或者商业分析“价格战”、国际贸易和国际政治等心理、政治、经济领域的模型分析,偏宏观和理想,但就我个人而言,这些心理学、政治学与纳什均衡的结合,具有意义,但是不是我想给题主说的具体可以指导生产等实际问题的情况,下面我想用一些更加真正意义上借助纳什均衡量化的一些实际应用。企业管理中,纳什均衡对于管理者制定企业生产制度,优化内部管理具有很大实际意义。比如公司里面,有人干活有人不干活,在这个案例里面,对单个人来说最好就是别人合作,他不合作,他就赚便宜了。比如别人好好干活,你偷懒,你分享别人的成果,你赚了;其次是两个人都合作;再其次是两个人都不合作;最糟糕的是你合作,别人不合作,你被别人骗了。这实际上是可能存在两种纳什均衡,一个好的均衡和一个坏的均衡,好的均衡就是大家都干活。两人都不合作的纳什均衡显然是坏的均衡,从这里我们就可以体会到制度的意义。一个制度其实是某种游戏规则,实际上就是博弈规则,这就是制度的含义。它不仅在影响人的行为,还决定着什么样的纳什均衡会出现。什么叫好的制度?好的制度就是能使得合作变成纳什均衡的制度;反过来,坏的制度就是使得不合作变成纳什均衡的制度。我们可以设想这也许就是人民公社制度,大家吃大锅饭,谁好好干活谁吃亏,谁耍奸谁得到好处,最后结果是大家没饭吃。我们现在看制度改变起什么意义?假如人民公社变成包产到户,在包产到户的情况下,你赚不了别人的便宜,你只能吃自己地上打的粮食。以前,如果农民两人都合作,每人可以得到3,俩人都不合作,得到0。现在就变化了,如果第一个农民A努力,第二个人偷懒的话,农民A自家能拿到3,B只能拿到0;反过来说,如果B努力,A偷懒的话,A只能得到0,B得到3。你看,在这样的制度下,纳什均衡是大家都会合作。但我们马上遇到一个问题了,农业是由于生产落后,不需要实际上物理上的合作,每个人自己种自己的地就好。当然,互助组合作社之类的我们先不讲它。但是,任何一个工业企业不可能分成个体生产,如果你把一个大企业分成一个个个体户的话,公司的价值就没有了,我们需要这个公司本身就是因为它可以创造出单个人创造不出的东西,也就是说N个人放在一块创造的价值大于每个人创造的价值乘以N,这才是我们需要团队的原因。这里的私有产权可以这样设想,还是一个博弈,如果现在企业有一个老板,一个雇员,老板合作,雇员也合作的话,每个人得到3;如果老板合作,雇员不合作的话,老板就可以处罚雇员,雇员只能得到0,老板还能得到2;如果雇员合作,老板不合作的话,老板照样付雇员3的工资,老板就亏了。从这里可以发现,一个人干活只能创造2的价值,两个人干活可以创造6的价值,于是企业的价值就出现了。这时候,雇员和老板都会选择合作。所以,在有了私有产权的博弈当中,我们看到合作就变成一个纳什均衡了。为什么现代企业制度能够出现并且持续存在,即便它有好多诸如偷懒这些问题,就是因为有私有产权制度,简单说有老板。如果一个企业没有老板就会变成囚徒困境博弈,纳什均衡就是没人合作,这就是国有企业的问题(国企内的直属领导实际上对直属员工的KPI决定有限,也开除不了,也不能轻易扣工资,无法对员工实现能使其合作的有效处罚,只能是靠员工自身的职业追求)。如果一个企业有老板了,那就改变了制度,改变了游戏规则,合作就变成了纳什均衡。这就是前面讲的制度的意义。更多参考:张维迎:好的纳什均衡和坏的纳什均衡 - 北京大学国家发展研究院 (pku.edu.cn)上面说的意义还是在管理方面,下面介绍生产方面的意义,其中一个应用就是 电力市场。 可能题主对电力市场不是很熟悉,简单来说就是把电力市场化后,电力行业发电、输配电、售电、用电等主体构成的市场。这其中,电价是由各方的报价因素决定的。随着电力工业的市场化,价格波动风险是发电商目前需要面对的情况,所以如何制定优化竞争策略、最大化发电商的收益成为各个电力市场发电商所关注的主要问题。博弈论这一理论模型作为经济学领域中用来研究寡头垄断市场经常应用的金融工具之一,其主要用来专门研究两个及两个以上对象之间存在利益冲突且互相影响的情况下合理制定各自优化选择决策的理论。可以扩展看下这几篇文章:电力市场背景下基于主从博弈的新能源消纳模型如何解决电网购电成本最小化目标与发电商收益最 大化目标相矛盾的问题,是新能源消纳研究的重要课题。 针对寻求矛盾的均衡解问题,提出了一种在电力市场背景 下基于主从博弈的新能源消纳模型。首先根据一主多从博 弈理论,将电网作为博弈主体,并引入新能源消纳惩罚成 本,以购电总成本最低、解决弃风弃光问题为目标;然后 将各发电商作为博弈从体,以售电收益最高为目标,构建 一主多从电力市场博弈模型;最后通过改进型自适应遗传 算法与粒子群算法相结合的算法解出该模型的 Stackelberg Nash 均衡解。仿真结果表明,所提出的模型能使博弈各方 获得利益的最优分配,并能有效解决弃风弃光问题。考虑期权合约的电力市场纳什均衡分析 (hanspub.org)由远期合约和期权合约等场内交易品所组成的电力金融衍生产品市场为市场参与者利用金融衍生工具回避电力市场中的价格风险等短期市场行为提供了有效的场所。而关于期权的引入对发电商电价竞争优化策略的影响研究甚少。本文基于考虑电力期权和市场中发电商的数量,为提高市场效率和维持市场电价和收益稳定性建立了市场均衡的博弈模型,结果表明期权的存在可以在一定程度上抑制发电商的滥用市场力,提高了市场效率,所以鼓励更多的发电商进入期权市场,以维持现货电价的高波动性,有利于保持稳定的收益和较高的现货电价。基于纳什均衡的能源互联网下的电力市场研究-手机知网 (cnki.net)随着全球化石燃料的日渐枯竭,其造成的环境污染问题逐渐增加,能源问题在全球的关注度日益上升,“能源互联网”在此环境下应运而生。能源互联网构建了一个以电力系统为核心,各类可再生清洁能源相结合,交通运输系统相协调的全体范围的智能系统。能源互联网将互联网中开放、互联、对等、分享的思想带入了能源系统,也将影响其下的电力市场。相比传统电力系统的电力市场,能源互联网下的电力市场将更为开放、复杂,竞争更加激烈。随着电力市场经济行为的复杂化,其研究方法的进阶必不可少。本文将时下各界热议的能源互联网进行了总结,构建能源互联网的基础框架,总结了其特征并与其他智能网络进行了对比,就其发展趋势做出了分析。在能源互联网的基本框架下,构建了能源互联网下的电力市场结构模式,对其各环节进行了详细分析。以博弈论纳什均衡理论为分析能源互联网下电力市场的工具,构建了含电网公司、新增供电实体、用户在内的三方博弈模型,给出了博弈均衡解的一般形式。选用粒子群优化算法为求解均衡解的方法,并进行了编程实现,且根据所得结果分析了电力市场中电量、电价、均衡影响因素等方面的规律及问题。经算例分析,论证了本文研究成果在实践的可运用性,在本文主要研究成果进行总结的基础上,就今后需要继续深入研究的问题进行了分析,给出了建议。著作权归作者所有,转载请联系作者获得授权。如对文章感兴趣,欢迎点赞支持,让系统推荐给更多人。以下专栏文章供批评指正:国际工程知识专栏 - 知乎 (zhihu.com)国内外能源电力市场沉浮几多年 - 知乎 (zhihu.com)编辑于 2023-09-04 06:35​赞同 9​​添加评论​分享​收藏​喜欢收起​XP来啦-WOW​ 关注对博弈方的实际决策应该意义不大,但可以研究整个系统到达均衡态的特征。比如在交通运输领域,交通流量在道路网络上的分布一般就运用均衡分析的方法,由此可以得到路网上流量的分布情况。发布于 2022-10-31 16:08​赞同​​添加评论​分享​收藏​喜欢收起​​

纳什均衡_百度百科

_百度百科 网页新闻贴吧知道网盘图片视频地图文库资讯采购百科百度首页登录注册进入词条全站搜索帮助首页秒懂百科特色百科知识专题加入百科百科团队权威合作下载百科APP个人中心纳什均衡播报讨论上传视频博弈论中一种解的概念收藏查看我的收藏0有用+10纳什均衡是博弈论中一种解的概念,它是指满足下面性质的策略组合:任何一位玩家在此策略组合下单方面改变自己的策略(其他玩家策略不变)都不会提高自身的收益。中文名纳什均衡外文名Nash equilibrium别    名非合作博弈均衡解    释策略组合目录1简介2历史背景3分类4经典案例▪囚徒困境▪硬币正反5重要影响简介播报编辑纳什均衡(Nash equilibrium),又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果任意一位参与者在其他所有参与者的策略确定的情况下,其选择的策略是最优的,那么这个组合就被定义为纳什均衡。一个策略组合被称为纳什均衡,当每个博弈者的均衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。历史背景播报编辑关于纳什均衡的普遍意义和存在性定理的证明等奠定非合作博弈理论发展基础的重要成果,是约翰·纳什在普林斯顿大学攻读博士学位时完成的。实际上,博弈论的研究起始于1944年约翰·冯·诺依曼(Von Neumann)和奥斯卡·摩根斯特恩(Oscar Morgenstern)合著的《博弈论和经济行为》。然而却是纳什首先用严密的数学语言和简明的文字准确地定义了纳什均衡这个概念,并在包含“混合策略(mixed strategies)”的情况下,证明了纳什均衡在n人有限博弈中的普遍存在性 [1],从而开创了与诺依曼和摩根斯坦框架路线均完全不同的“非合作博弈(Non-cooperative Game)”理论,进而对“合作博弈(Cooperative Game)”和“非合作博弈”做了明确的区分和定义。阿尔伯特·塔克(Albert tucker)教授评价其论文,“这是对博弈理论的高度原创性和重要的贡献。它发展了本身很有意义的n人有限非合作博弈的概念和性质。并且它很可能开拓出许多在两人零和问题以外的,至今尚未涉及的问题。在概念和方法两方面,该论文都是作者的独立创造。”分类播报编辑纳什均衡可以分成两类:“纯策略纳什均衡”和“混合策略纳什均衡”。要说明纯策略纳什均衡和混合策略纳什均衡,要先说明纯策略和混合策略。所谓纯策略是提供给玩家要如何进行博弈的一个完整的定义。特别地是,纯策略决定在任何一种情况下要做的移动。策略集合是由玩家能够施行的纯策略所组成的集合。而混合策略是对每个纯策略分配一个概率而形成的策略。混合策略允许玩家随机选择一个纯策略。混合策略博弈均衡中要用概率计算,因为每一种策略都是随机的,达到某一概率时,可以实现收益最优。因为概率是连续的,所以即使策略集合是有限的,也会有无限多个混合策略。当然,严格来说,每个纯策略都是一个“退化”的混合策略,某一特定纯策略的概率为1,其他的则为0。故“纯策略纳什均衡”,即参与之中的所有玩家都使用纯策略;而相应的“混合策略纳什均衡”,之中至少有一位玩家使用混合策略。并不是每个博弈都会有纯策略纳什均衡,例如“钱币问题"就只有混合策略纳什均衡,而没有纯策略纳什均衡。不过,还是有许多博弈有纯策略纳什均衡(如协调博弈,囚徒困境和猎鹿博弈)。甚至,有些博弈能同时有纯策略和混合策略均衡。 [3]经典案例播报编辑囚徒困境(1950年,数学家塔克任斯坦福大学客座教授,在给一些心理学家作讲演时,讲到两个囚犯的故事。) [2]假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌疑人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。囚徒困境博弈A╲B坦白抵赖坦白-8,-80,-10抵赖-10,0-1,-1关于案例,显然最好的策略是双方都抵赖,结果是大家都只被判1年。但是由于两人处于隔离的情况,首先应该是从心理学的角度来看,当事双方都会怀疑对方会出卖自己以求自保、其次才是亚当·斯密的理论,假设每个人都是“理性的经济人”,都会从利己的目的出发进行选择。这两个人都会有这样一个盘算过程:假如他坦白,如果我抵赖,得坐10年监狱,如果我坦白最多才8年;假如他要是抵赖,如果我也抵赖,我就会被判一年,如果我坦白就可以被释放,而他会坐10年牢。综合以上几种情况考虑,不管他坦白与否,对我而言都是坦白了划算。两个人都会动这样的脑筋,最终,两个人都选择了坦白,结果都被判8年刑期。基于经济学中“理性的经济人”的前提假设,两个囚犯符合自己利益的选择是坦白招供,原本对双方都有利的策略不招供从而均被判处一年就不会出现。这样两人都选择坦白的策略以及因此被判8年的结局,纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战:按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。但是我们可以从“纳什均衡”中引出“看不见的手”原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。硬币正反你正在图书馆枯坐,一位陌生美女主动过来和你搭讪,并要求和你一起玩个数学游戏。美女提议:“让我们各自亮出硬币的一面,或正或反。如果我们都是正面,那么我给你3元,如果我们都是反面,我给你1元,剩下的情况你给我2元就可以了。”那么该不该和这位姑娘玩这个游戏呢?这基本是废话,当然该。问题是,这个游戏公平吗?每一种游戏依具其规则的不同会存在两种纳什均衡,一种是纯策略纳什均衡,也就是说玩家都能够采取固定的策略(比如一直出正面或者一直出反面),使得每人都赚得最多或亏得最少;或者是混合策略纳什均衡,而在这个游戏中,便应该采用混合策略纳什均衡。你\美女美女出正面美女出反面你出正面+3,-3-2,+2你出反面-2,+2+1,-1假设我们出正面的概率是x,反面的概率是1-x,美女出正面的概率是y,反面的概率是1-y。为了使利益最大化,应该在对手出什么的时候我们的收益都相等(不然在这个游戏中,对方可以改变正反面出现的概率让我们的期望收入减少),由此列出方程就是纳什均衡解方程得y=3/8。同样,美女的收益,列方程解得x也等于3/8,而美女每次的期望收益则是元。这告诉我们,在双方都采取最优策略的情况下,平均每次美女赢1/8元。其实只要美女采取了(3/8,5/8)这个方案,不论你再采用什么方案,都是不能改变局面的。重要影响播报编辑纳什均衡理论奠定了现代主流博弈理论和经济理论的根本基础,正如克瑞普斯(Kreps,1990)在《博弈论和经济建模》一书的引言中所说,“在过去的一二十年内,经济学在方法论以及语言、概念等方面,经历了一场温和的革命,非合作博弈理论已经成为范式的中心……在经济学或者与经济学原理相关的金融、会计、营销和政治科学等学科中,现在人们已经很难找到不懂纳什均衡能够‘消费’近期文献的领域。”纳什均衡的重要影响可以概括为以下六个方面1.改变了经济学的体系和结构。非合作博弈论的概念、内容、模型和分析工具等,均已渗透到微观经济学、宏观经济学、劳动经济学、国际经济学、环境经济学等经济学科的绝大部分学科领域,改变了这些学科领域的内容和结构,成为这些学科领域的基本研究范式和理论分析工具,从而改变了原有经济学理论体系中各分支学科的内涵。2.扩展了经济学研究经济问题的范围。原有经济学缺乏将不确定性因素、变动环境因素以及经济个体之间的交互作用模式化的有效办法,因而不能进行微观层次经济问题的解剖分析。纳什均衡及相关模型分析方法,包括扩展型博弈法、逆推归纳法、子博弈完美纳什均衡等概念方法,为经济学家们提供了深入的分析工具。3.加强了经济学研究的深度。纳什均衡理论不回避经济个体之间直接的交互作用,不满足于对经济个体之间复杂经济关系的简单化处理,分析问题时不只停留在宏观层面上而是深入分析表象背后深层次的原因和规律,强调从微观个体行为规律的角度发现问题的根源,因而可以更深刻准确地理解和解释经济问题。4.形成了基于经典博弈的研究范式体系。即可以将各种问题或经济关系,按照经典博弈的类型或特征进行分类,并根据相应的经典博弈的分析方法和模型进行研究,将一个领域所取得的经验方便地移植到另一个领域。5.扩大和加强了经济学与其他社会科学、自然科学的联系。纳什均衡之所以伟大,就因为它普通,而且普通到几乎无处不在。纳什均衡理论既适用于人类的行为规律,也适合于人类以外的其他生物的生存、运动和发展的规律。纳什均衡和博弈论的桥梁作用,使经济学与其他社会科学、自然科学的联系更加紧密,形成了经济学与其他学科相互促进的良性循环。6.改变了经济学的语言和表达方法。在进化博弈论方面相当有造诣的日本经济学家神取道宏(Kandori Michihiro,1997)对保罗·萨缪尔森(Paul Samuelson)的名言“你甚至可以使一只鹦鹉变成一个训练有素的经济学家,因为它必须学习的只有两个词,那就是‘供给’和‘需求’”,曾做过一个幽默的引申,他说,“现在这只鹦鹉需要再学两个词,那就是‘纳什均衡’”。新手上路成长任务编辑入门编辑规则本人编辑我有疑问内容质疑在线客服官方贴吧意见反馈投诉建议举报不良信息未通过词条申诉投诉侵权信息封禁查询与解封©2024 Baidu 使用百度前必读 | 百科协议 | 隐私政策 | 百度百科合作平台 | 京ICP证030173号 京公网安备110000020000

一文解读“纳什均衡”(Nash Equilibrium)理论 - 知乎

一文解读“纳什均衡”(Nash Equilibrium)理论 - 知乎切换模式写文章登录/注册一文解读“纳什均衡”(Nash Equilibrium)理论未来数字谷生活中,你是不是经常看到这样一些场景:麦当劳的隔壁总有肯德基,Starbucks的附近总有Costa,同类型的奢侈品商铺在商场中鳞次栉比,诸如此类的快餐连锁店、服饰美妆店并不会在繁华的商圈平均分布,而是采用邻近选址的方式。相似的竞争对手总会具有相同的策略默契,最后达成互相制衡的经营状态。这就是存在于经济学中的“纳什均衡”(Nash Equilibrium)理论,以世界著名的数学家、经济学家约翰·纳什(John Nash)命名,也叫作“非合作博弈均衡”,被广泛运用在经济学、计算机科学、演化生物学、人工智能、会计学、政策和军事理论等方面。6月13日,是约翰·纳什诞辰94周年。今天,我们将带大家深入解读“纳什均衡”理论,一起探讨经济运作中的利益最优解,了解约翰·纳什这位创新思维大师的传奇一生。基本概念纳什均衡(Nash Equilibrium,或称纳什均衡点)是指在包含两个或以上参与者的非合作博弈(Non-cooperative game)中,假设每个参与者都知道其他参与者的均衡策略的情况下,没有参与者可以透过改变自身策略使自身受益时的一个概念解。纳什均衡的必要条件:• 是非合作博弈,不可提前沟通。• 博弈参与者均具备理性思维。• 博弈各方的行为是同时进行。• 纳什均衡并非是博弈的唯一结果。案例分析囚徒困境(Prisoner's Dilemma):假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出以下政策:囚徒困境(Prisoner's Dilemma)是指两个被捕的囚徒之间的一种特殊博弈,说明即使合作对双方都有利的情况下,保持合作也是困难的。图源:网络情况一:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8 年。情况二:如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。情况三:如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。关于案例,显然最好的策略是双方都抵赖,结果是大家都只被判1年。但是由于两人处于隔离的情况。从心理学的角度来看,当事人双方都会怀疑对方会出卖自己以求自保,都会从利己的目的出发进行选择。这两个人都会有这样一个盘算过程:假设一:假如他坦白,如果我抵赖,得坐10年监狱,如果我坦白最多才8年;假设二:假如他要是抵赖,如果我也抵赖,我就会被判一年,如果我坦白就可以被释放,而他会坐10年牢。综合以上几种情况考虑,不管他坦白与否,对我而言都是坦白了划算。两个人都会动这样的脑筋。最终,两个人都选择了坦白,结果都被判8年刑期。知识拓展约翰·纳什,全名为约翰·福布斯·纳什(John Forbes Nash, Jr.),是前麻省理工学院助教,前马萨诸塞理工学院摩尔荣誉讲师,主要研究博弈论、微分几何学和偏微分方程,晚年为普林斯顿大学的资深研究数学家。约翰·纳什于1950年获得美国普林斯顿高等研究院的博士学位,在他仅27页的博士论文中有一个重要发现,就是后来被称为“纳什均衡”的博弈理论。1994年,他与另两位博弈论学家在非合作博弈的均衡分析理论方面,做出了开创性的贡献,对博弈论和经济学产生重大影响,共同获得了诺贝尔经济学奖。电影《美丽心灵》以约翰·纳什为原型,讲述了受精神分裂症困扰的约翰·纳什,在博弈论和微分几何学领域不懈研究,最终获得诺贝尔经济学奖的故事,该片获得第74届奥斯卡金像奖最佳导演与最佳影片奖。图源:网络参考资料Eric Maskin教授在Harvard CMSA关于《博弈论基础和经典存在性定理》的讲座视频地址:https://www.youtube.com/watch?v=Y0PQKKum4wc&t=1647s2.书籍资料《N人博弈中的均衡点》,纳什(1950)Nash (1950), “Equilibrium Points in N-Person Games”点击下方链接,了解更多关于“纳什均衡”理论的内容。编辑于 2022-06-08 10:37经济学纳什均衡与博弈论(书籍)纳什均衡 (Nash Equilibrium)​赞同 8​​添加评论​分享​喜欢​收藏​申请

博弈论笔记(一):策略式博弈及其纳什均衡 - 知乎

博弈论笔记(一):策略式博弈及其纳什均衡 - 知乎首发于博弈论笔记切换模式写文章登录/注册博弈论笔记(一):策略式博弈及其纳什均衡少侠南大AI研究生序言中介绍了博弈的要素和博弈的分类,那么,怎么“论”呢?当下最重要的,是将博弈用数学语言来描述出来,也就是形式化。博弈不同的分类:{策略式,扩展式},{完全信息,非完全信息}等等,都有不同的形式化表示,这一节介绍最简单的一种:完全信息策略式博弈。与之对应的例子有:囚徒困境(Prisoners’ Dilemma)、古诺竞争(Cournot Competition)。对了,顺便提一下,博弈不是“搏”而是“博”,哈哈,一开始学的时候写错了。一、一些概念的定义1. 策略式博弈策略式博弈也叫静态博弈,它是一次博弈:所有玩家同时做策略选择知道对手可选的策略不知道对手具体会选哪一个策略非合作典型的例子是:石头剪刀布。与策略式博弈相对应的是扩展式博弈(动态博弈)。2. 完全信息所有玩家都知道在一组策略选择下的每个人的收益。下面把完全信息策略式博弈简写为:策略式博弈二、策略式博弈形式化形式化主要是将博弈的要素用数学语言表示出来。对于一个策略式博弈,用{玩家、策略、收益}就可以完全表示。1. 基础概念的定义一个策略式博弈包括:玩家集N:玩家的有限集合每个玩家i都有策略集A_i,表示他可以选择的策略的集合每个玩家i都有收益函数u_i:A_1 \times A_2 \times \dots A_N \rightarrow R,表示在一组策略下它的收益此外,有如下定义:博弈结果:a = (a_1,a_2,\dots,a_N),是一组策略构成的元组博弈结果空间:A = A_1 \times A_2 \times \dots A_N,则a \in A对手策略:a_{-i} = (a_1,\dots,a_{i-1}, a_{i+1},\dots,a_N),则a = (a_i,a_{-i}) 在策略式博弈中,收益的具体数值并不重要,重要的是收益之间的大小关系,称作偏好关系。任何满足全序关系的集合,都可以用来表示收益。我们通常用实数来表示收益。2. 形式化集合 G = \{N, \{ A_i \}_{i=1}^N, \{ u_i \}_{i=1}^N \} \\ 称作策略式博弈G其中N,A_i,u_i就是前面定义的那样。3. 例子:囚徒困境形式化G = \{\{1,2\}, \{ A_1,A_2 \}, \{ u_1,u_2 \} \}玩家集:N = \{1,2\},表示1、2两个囚徒策略集:A_1 = A_2 = \{坦白,沉默\},为了书写简便,用c表示坦白,用d表示沉默收益函数:u_{1}(c, c)=-6, u_{1}(c, d)=0, u_{1}(d, d)=-1, u_{1}(d, c)=-12u_{2}(c, c)=-6, u_{2}(c, d)=-12, u_{2}(d, d)=-1, u_{2}(d, c)=0用收益矩阵表示如下:囚徒困境收益矩阵三、纳什均衡我们自然地会去想,在这种条件下,两个囚犯会选择怎样的策略呢?先从A的视角想一下,如果B坦白:A选择坦白,收益是(-6);A选择沉默,收益是(-12),因此A会坦白。如果B沉默:A选择坦白,收益是(0);A选择沉默,收益是(-1),因此A会坦白。同理,B也是这么想的,因此,两人都会选择坦白。1. 纳什均衡的想法从上面的思考中,可以看出这种思想:当对手策略选定的时候,我会调整自己的策略,使得自己收益在几种策略选择中是最大的,这时的策略称为“最优反应”。这个时候,如果对手不改变策略的话,我是没有动机去改变自己的策略的。如果每个人的策略都是“最优反应”,那么就会形成一种稳定的局面,这时的博弈结果就是纳什均衡2. 纳什均衡形式化定义纳什均衡(Nash equilibrium)是博弈结果a^{*}=\left(a_{1}^{*}, a_{2}^{*}, \ldots, a_{N}^{*}\right),使得对于每个玩家i都有: u_{i}\left(a_{i}^{*}, a_{-i}^{*}\right) \geq u_{i}\left(a_{i}, a_{-i}^{*}\right) \\ (对手策略选定的时候,自己最优)纳什均衡简写为:NE3. 纳什均衡求解:寻找最优反应玩家i关于对手策略a_{-i}的最优反应:B_{i}\left(a_{-i}\right)=\left\{a_{i} \in A_{i}: u_{i}\left(a_{i}, a_{-i}\right) \geq u_{i}\left(b_{i}, a_{-i}\right) \text { for all } b_{i} \in A_{i}\right\}同时满足所有人的最优反应的博弈结果,就是纳什均衡。也就是对于 \forall i ,满足a_{i}^{*} \in B_{i}\left(a_{-i}^{*}\right)的博弈结果。4. 例1:依旧是囚徒困境 \begin{array}{ll} B_{1}(c)=\{c\} & B_{1}(d)=\{c\} \\ B_{2}(c)=\{c\} & B_{2}(d)=\{c\} \end{array} \\ 在收益矩阵上标出这些最优反应:B_1(c)=\{c\}表示在囚徒2选择c的时候,囚徒1会选择c,因为囚徒1的收益(-6 > -12)。对应矩阵中左边红色的”√“。详细分析如下:B_1(d)=\{c\}表示在囚徒2选择d的时候,囚徒1会选择c,因为囚徒1的收益(0 > -1)。对应矩阵中右边红色的”√“。B_2(c)=\{c\}表示在囚徒1选择c的时候,囚徒2会选择c,因为囚徒2的收益(-6 > -12)。对应矩阵中上边绿色的”√“。B_2(d)=\{c\}表示在囚徒1选择d的时候,囚徒2会选择c,因为囚徒2的收益(0 > -1)。对应矩阵中下边绿色的”√“。因此,最终得到满足所有人最优反应的结果:(c,c),也就是两人都坦白。5. 例2:古诺竞争这个例子收益是连续的,不能用矩阵来表示。问题如下: 两个厂商{1, 2}生产和销售同一种商品,厂商i生产的数量记为q_i。 每件商品生产成本都是c,售价是:max(0,a-b(q_1+q_2)) 求纳什均衡1) 形式化G = \{\{1,2\}, \{ q_1,q_2 \}, \{ u_1,u_2 \} \}其中,收益u_i(q_1,q_2) = (max(0,a-b(q_1+q_2))-c)q_i。(售价-成本)x生产数量2) 求最优反应函数对于厂商1:如果q_{2} \geq(a-c) / b,那么对于任意的q_1 \ge 0,都有u_{1}\left(q_{1}, q_{2}\right) \leq 0,即没有正收益如果q_{2} < (a-c) / b,那么u_1(q_1,q_2) = (a-b(q_1+q_2))-c)q_1。固定q_2,q_1何时取最大呢?求导!求解:\frac{\partial u_{1}\left(q_{1}, q_{2}\right)}{\partial q_{1}}=a-c-b q_{2}-2 b q_{1}=0 ,求得q_{1}=\left(a-c-b q_{2}\right) / 2 b,这就是厂商1的最优反应函数同理,对于厂商2,最优反应函数是:q_{2}=\left(a-c-b q_{1}\right) / 2b3) 纳什均衡对于满足纳什均衡的博弈结果\left(q_{1}^{*}, q_{2}^{*}\right),有: \begin{array}{l} q_{1}^{*}=B_{1}\left(q_{2}^{*}\right)=\left(a-c-b q_{2}^{*}\right) / 2 b \\ q_{2}^{*}=B_{2}\left(q_{1}^{*}\right)=\left(a-c-b q_{1}^{*}\right) / 2 b \end{array} \\ 联立方程,解得q_{1}^{*}= q_{2}^{*}=\frac{a-c}{3b}最优反应相交之处四、小结这节学习了:策略式博弈形式化纳什均衡的定义及求解重要的是理解纳什均衡所表示的意义。纳什均衡并不一定是最优的结果,它是一种稳定的局面,在这种情况下,所有人都没有动机去改变自己的选择。下一节:博弈论笔记(二):混合策略博弈及其纳什均衡 编辑于 2021-09-09 00:02博弈论纳什均衡 (Nash Equilibrium)​赞同 290​​36 条评论​分享​喜欢​收藏​申请转载​文章被以下专栏收录博弈论笔记博弈论课

如何通俗的理解纳什均衡点 - 范仁义 - 博客园

如何通俗的理解纳什均衡点 - 范仁义 - 博客园

会员

周边

新闻

博问

AI培训

云市场

所有博客

当前博客

我的博客

我的园子

账号设置

简洁模式 ...

退出登录

注册

登录

微信扫一扫打赏支持

范仁义

资深算法工程师,在校每年国奖、专业第一,加拿大留学。

博客园

首页

新随笔

联系

管理

订阅

如何通俗的理解纳什均衡点

如何通俗的理解纳什均衡点

一、总结

一句话总结:

①、纳什均衡是博弈论中的一个规律,指的是在一个博弈过程中,博弈双方都没有改变自己策略的动力,因为单方面改变自己的策略都会造成自己收益的减少。

②、纳什均衡点可以理解为个体最优解,但并不一定是集体最有解。

③、那么,有没有办法使个人最优变成集体最优呢?方法就是共谋。两个小偷在作案之前可以说好,咱们如果进去了,一定都抗拒。如果你这一次敢反悔,那么以后道上的人再也不会有人跟你一起了。

④、在社会领域,共谋是靠法律完成的。大家约定的共谋结论就是法律,如果有人不按照约定做,就会受到法律的惩罚。通过这种方式保证最终决策从个人最优的纳什均衡点变为集体最优点。

 

 

二、如何通俗的理解纳什均衡点

转自或参考:如何通俗的理解纳什均衡点?https://baijiahao.baidu.com/s?id=1611846467821315306&wfr=spider&for=pc

 

1、市场上有2家企业A和B,都是卖纸的,纸的成本都是2元钱,A和B都卖5块钱。

有一天A降价到4块钱,于是A销量大增,B销量大减。B看到了后,降价到3块钱,于是B销量大增,A销量大减。

但如果价格战一直这样打下去,对谁也没有好处,于是A也选择降价到3块钱,和B一样。B看到了A降价到3块钱,B既不敢涨价,也不敢降价。涨价了市场就丢了,降价了,就赚不到钱甚至赔钱。所以A和B都不会再去做改变,这就是纳什均衡。

A和B怎样能够获得最大利润呢,就是A和B坐到一起商量,同时把价格提高,这就叫共谋,但法律为了保障消费者利益,禁止共谋。

所以有的企业会打出这样的横幅“我的价格一定不会比B低”,B是指竞争对手。意思是告诉对方,我会和你用同样的价格,所以你尽管定高价。显然这样的横幅也是共谋。

 

 

2、纳什均衡涉及到非合作博弈,这个事情我可以给你解释一下,大致就是用离婚这个事情来说吧。

夫妻2个人,要离婚的时候,一般情况下就是要分割财产。这时候,就是一个博弈过程。如果是合作博弈,也就是两个人好商量,那么就去协议离婚,民政局领离婚证,财产一人一半,谁也不吃亏。

但是,如果走法院起诉离婚的路线,则是非合作博弈,这个时候要请律师,而且财产分割就会有人吃亏有人占优势。

那么,我们假设夫妻财产是100万,如果女方请律师,上法院起诉离婚,那么女方要付出律师费4万,但可以赢得70万,男方如果不请律师,那么男方得到30万。这个情况下,男方其实是吃亏了。所以,这个不是纳什均衡——所谓均衡就是无法再改进了,那么男方应该怎么做?当然是要改进,那就请律师,男方付出律师费4万,这个时候双方上了法院,最后律师势均力敌,双方每人50万,除了律师费用,每人剩46万。这个每个46万就是纳什均衡。

 

 

所以,从上面的例子可以看出,两个人不请律师不是纳什均衡,因为女方如果知道男方不请律师,她肯定会请律师,最后得到70万。所以,这个状态不是一个纳什均衡——因为有一方可以通过改进策略多赢钱。最后双方非合作博弈的纳什均衡状态一定是双方都请律师,最后谁也不吃亏——律师赚了钱,所以律师在离婚官司里得到了纳什均衡的好处。

 

3、纳什均衡是博弈论中的一个规律,指的是在一个博弈过程中,博弈双方都没有改变自己策略的动力,因为单方面改变自己的策略都会造成自己收益的减少。纳什均衡点可以理解为个体最优解,但并不一定是集体最有解。

为了解释这个问题,我们举两个最典型的例子:囚徒困境和智猪博弈。

囚徒困境

囚徒困境是说:有两个小偷集体作案,然后被警察捉住。

 

 

警察对两个人分别审讯,并且告诉他们政策:

如果两个人都交代坦白,就可以定罪,两个人各判八年。

如果一个人交代另一个不交代,那么一样可以定罪。但是交代的人从宽处罚,批评教育就释放。不交代的人从严处罚,判十年。

如果两个人都不交代,没法定罪,每个人判一年意思一下。

两个人的收益情况如下所示:

 

 

首先我们考虑A的决策。A会想,我如何才能获得更大收益呢? 如果B坦白了,那么我坦白就会判8年,我抗拒就会判十年,我应该坦白;如果B抗拒了,我坦白会判0年,我抗拒会判1年,我还是应该坦白。所以最终A会选择坦白。同样,B也会这样想,因此最终纳什均衡点在两个人都坦白,各判八年这里。

显然,集体最优解在两个人都抗拒,这样一来每个人都判一年就出来了。但是,纳什均衡点却不在这里。而且,在纳什均衡点上,任何一个人都没有改变自己决策的动力。因为一旦单方面改变决策,那个人的收益就会下降。

 

 

这与我国开车夹塞的例子很像。如果大家都不夹塞,是整体的最优解,但是按照纳什均衡理论,任何一个司机都会考虑,无论别人是否夹塞,我夹塞都可以使自己的收益变大。于是最终大家都会夹塞,加剧拥堵,反而不如大家都不加塞走的快。

那么,有没有办法使个人最优变成集体最优呢?方法就是共谋。两个小偷在作案之前可以说好,咱们如果进去了,一定都抗拒。如果你这一次敢反悔,那么以后道上的人再也不会有人跟你一起了。也就是说,在多次博弈过程中,共谋是可能的。但是如果这个小偷想干完这一票就走,共谋就是不牢靠的。

在社会领域,共谋是靠法律完成的。大家约定的共谋结论就是法律,如果有人不按照约定做,就会受到法律的惩罚。通过这种方式保证最终决策从个人最优的纳什均衡点变为集体最优点。

 

 

 

我的旨在学过的东西不再忘记(主要使用艾宾浩斯遗忘曲线算法及其它智能学习复习算法)的偏公益性质的完全免费的编程视频学习网站:

【读书编程笔记】fanrenyi.com;有各种前端、后端、算法、大数据、人工智能等课程。

版权申明:欢迎转载,但请注明出处

一些博文中有一些参考内容因时间久远找不到来源了没有注明,如果侵权请联系我删除。

2023-12-12,找女朋友,非诚勿扰,vx:fan404006308

录播课资料github地址:https://github.com/fry404006308/fry_course_materials

AI交流资料群:753014672

作者相关推荐

感悟总结

其它重要感悟总结

感悟总结200813

最近心境200830

最近心境201019

201218-210205

posted @

2020-08-11 08:09 

范仁义 

阅读(4392) 

评论(0) 

编辑 

收藏 

举报

会员力量,点亮园子希望

刷新页面返回顶部

公告

Copyright © 2024 范仁义

Powered by .NET 8.0 on Kubernetes

N人博弈中的均衡点_百度百科

中的均衡点_百度百科 网页新闻贴吧知道网盘图片视频地图文库资讯采购百科百度首页登录注册进入词条全站搜索帮助首页秒懂百科特色百科知识专题加入百科百科团队权威合作下载百科APP个人中心收藏查看我的收藏0有用+10N人博弈中的均衡点播报讨论上传视频约翰·福布斯·纳什发表的论文《N人博弈中的均衡点》由约翰·福布斯·纳什(John Forbes Nash Jr)1950年发表于普林斯顿。与另外一篇题为《非合作博弈》(1951)两篇论文的发表,体现了纳什的主要学术贡献。在上述论文中,纳什介绍了合作博弈与非合作博弈的区别。他对非合作博弈的最重要贡献是阐明了包含任意人数局中人和任意偏好的一种通用解概念,也就是不限于两人零和博弈。该解概念后来被称为纳什均衡。中文名N人博弈中的均衡点外文名Equilibrium Points in n-Person Games作    者John F. NashN人博弈的均衡点约翰·F·纳什 [1]可以这样定义n人博弈(n-persongame),n个参与人(player),每个参与人的纯策略(purestrategy)集为有限集,对于每个纯策略的n元组合,n个参与人具有与之对应的明确的支付集,纯策略的n元组合中,一个策略对应一个参与人。混合策略(mixedstrategy)是纯策略上的概率分布,支付函数(pay-offfunction)是参与人的期望,因此在概率上是多元线性形式的,表示各个参与人采用各个纯策略的概率。任意的策略n元组合(n-tupleofstrategies),一个策略对应一个参与人,可以看作是由参与人的n个策略空间相乘得到的乘积空间(productspace)中的一点。一个这样的n元组合优超(counter)另一个,如果优超的n元组合中的每个参与人的策略,使得该参与人产生最高可得期望。这是因为给定的优超n元组合中任一参与人都会对抗其他参与人的n-1个策略。自我优超(self-countering)的策略n元组合称为均衡点。每个n元组合与其优超集的对应,都给出了乘积空间到其本身的一个一对多的映射(aone-to-manymapping)。从优超的定义,我们看到一点的优超点的集合是凸的(convex)。利用支付函数的连续性,我们得到该映射的图是闭的。闭性等价于:如果P1,P2,···和Q1,Q2,···,Qn,···是乘积空间中的点列,并且Qn→Q,Pn→P,Qn优超Pn,那么Q优超P。因为图是闭的,并且每个点在映射下的对应是凸的,由角谷不动点定理(Kakutani`stheorem) [2]我们得到该映射存在不动点(即该点包含在它自已的对应中)。因此,存在均衡点。在二人零和博弈中,“主要定理” [3]和均衡点的存在性是等价的。在这种情况下,任意两个均衡点对每个参与人导致相同的期望,但是一般情况下并不成立。新手上路成长任务编辑入门编辑规则本人编辑我有疑问内容质疑在线客服官方贴吧意见反馈投诉建议举报不良信息未通过词条申诉投诉侵权信息封禁查询与解封©2024 Baidu 使用百度前必读 | 百科协议 | 隐私政策 | 百度百科合作平台 | 京ICP证030173号 京公网安备110000020000

纳什均衡 - MBA智库百科

纳什均衡 - MBA智库百科

全球专业中文经管百科,由121,994位网友共同编写而成,共计435,710个条目

查看

条目讨论编辑 收藏

简体中文繁体中文

工具箱▼

链入页面

链出更改

上传文件 特殊页面 可打印版

永久链接

纳什均衡

用手机看条目

扫一扫,手机看条目

出自 MBA智库百科(https://wiki.mbalib.com/)

纳什均衡(Nash equilibrium)——完全信息静态博弈

目录

1 纳什均衡简介

2 纳什均衡的得来

3 纳什均衡例子

4 纳什均衡的重要影响[1]

5 纳什均衡案例分析

5.1 案例一:纳什均衡在货币政策效应中的应用[2]

6 相关条目

7 参考文献

[编辑] 纳什均衡简介

  纳什均衡,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什均衡。

  一个策略组合被称为纳什均衡,当每个博弈者的均衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。

[编辑]纳什均衡的得来

  关于纳什均衡的普遍意义和存在性定理的证明等奠定非合作博弈理论发展基础的重要成果,是约翰·纳什在普林斯顿大学攻读博士学位时完成的。实际上,博弈论的研究起始于1944年冯·诺依曼(Von Neumann)和奥斯卡·摩根斯坦(Oscar Morgenstern)合著的《博弈论和经济行为》。然而却是纳什首先用严密的数学语言和简明的文字准确地定义了纳什均衡这个概念,并在包含“混合策略(mixed strategies)”的情况下,证明了纳什均衡在n人有限博弈中的普遍存在性,从而开创了与诺依曼和摩根斯坦框架路线均完全不同的“非合作博弈(Non-cooperative Game)”理论,进而对“合作博弈(Cooperative Game)”和“非合作博弈”做了明确的区分和定义。阿尔伯特·塔克(Albert tucker)教授评价其论文,“这是对博弈理论的高度原创性和重要的贡献。它发展了本身很有意义的n人有限非合作博弈的概念和性质。并且它很可能开拓出许多在两人零和问题以外的,至今尚未涉及的问题。在概念和方法两方面,该论文都是作者的独立创造。”

[编辑] 纳什均衡例子

  1.囚徒困境

  博弈论中一个著名的例子就是囚徒困境。囚徒困境是一个非零和博弈,说的是两个嫌疑犯甲和乙私入民宅联手作案,被警方逮住但未获证据。警方于是将两个嫌疑犯分开审讯。警官分别告诉

两个囚犯,如果你招供,而对方不招供,则你将被判刑3个月,对方将被判刑10年;若两人都不招供则因未获证据但私入民宅将各拘留1年;如果两人均招供,每人将被判刑5年。于是,两个人同时陷入招供还是不招供的两难处境。结果是,尽管甲不知乙是否招供,但他认为自己选择“招供”最好,因而甲会选择“招供”,同样乙也会选择“招供”,两人各判5年。而两人都选择不招供,虽证据不足但因私入民宅将各拘留1年的结果是不会出现的。

博弈矩阵

囚犯甲

招供不招供

囚犯乙

招供判刑五年甲判刑十年;乙判刑三个月

不招供甲判刑三个月;乙判刑十年判刑一年

  在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什均衡。纳什均衡又称为非合作博弈均衡,是博弈论的一个重要术语,它是以美国数学家、日后成为电影《美丽心灵》主人公的纳什的名字命名的。在上述囚徒困境例子中,两个囚犯符合自己利益的选择是坦白招供。这种两人都选择坦白的策略以及因此被判刑五年的结局就是“纳什均衡”。

  2.打猎

  两个猎人出发去打猎。假设一头鹿有400公斤肉,但必须两人合作才能打到,一个人打什么都获得不了。同地区有一群兔子,一共有200公斤肉,两人合作可以全部打完,但一个人打也可以获得100公斤肉。两个猎人各自都知道对方的平衡策略,但不能通过任何方式影响对方的决策。最终的结果会怎样?

决策结果

ABAB

猎鹿猎鹿200200

猎鹿猎兔0100

猎兔猎鹿1000

猎兔猎兔100100

  这里面有两个纳什均衡。

  (1)两人都猎鹿:任何一人单方切换成猎兔子,都会让自己的收益从200跌到100。

  (2)两人都猎兔子:任何一人单方切换成猎鹿,都会让自己的收益从100跌到0。

  注意,这里面都是单方更改。要是双方同时从兔子换成鹿,都会更好——但纳什均衡不考虑这个。

  这也造成了一个问题:纳什均衡从全局看起来不见得是“理性”的,不是看起来的最优解,但是对每个人来说,它的确是在别人不可控时自己的最优解。

[编辑]纳什均衡的重要影响[1]

  纳什均衡理论奠定了现代主流博弈理论和经济理论的根本基础,正如克瑞普斯(Kreps,1990)在《博弈论和经济建模》一书的引言中所说,“在过去的一二十年内,经济学在方法论以及语言、概念等方面,经历了一场温和的革命,非合作博弈理论已经成为范式的中心……在经济学或者与经济学原理相关的金融、会计、营销和政治科学等学科中,现在人们已经很难找到不懂纳什均衡能够‘消费’近期文献的领域。”纳什均衡的重要影响可以概括为以下六个方面(谢识予,1999):

  (1)改变了经济学的体系和结构。非合作博弈论的概念、内容、模型和分析工具等,均已渗透到微观经济学、宏观经济学、劳动经济学、国际经济学、环境经济学等经济学科的绝大部分学科领域,改变了这些学科领域的内容和结构,成为这些学科领域的基本研究范式和理论分析工具,从而改变了原有经济学理论体系中各分支学科的内涵。

  (2)扩展了经济学研究经济问题的范围。原有经济学缺乏将不确定性因素、变动环境因素以及经济个体之间的交互作用模式化的有效办法,因而不能进行微观层次经济问题的解剖分析。纳什均衡及相关模型分析方法,包括扩展型博弈法、逆推归纳法、子博弈完美纳什均衡等概念方法,为经济学家们提供了深入的分析工具。

  (3)加强了经济学研究的深度。纳什均衡理论不回避经济个体之间直接的交互作用,不满足于对经济个体之间复杂经济关系的简单化处理,分析问题时不只停留在宏观层面上而是深入分析表象背后深层次的原因和规律,强调从微观个体行为规律的角度发现问题的根源,因而可以更深刻准确地理解和解释经济问题。

  (4)形成了基于经典博弈的研究范式体系。即可以将各种问题或经济关系,按照经典博弈的类型或特征进行分类,并根据相应的经典博弈的分析方法和模型进行研究,将一个领域所取得的经验方便地移植到另一个领域。

  (5)扩大和加强了经济学与其他社会科学、自然科学的联系。纳什均衡之所以伟大,就因为它普通,而且普通到几乎无处不在。纳什均衡理论既适用于人类的行为规律,也适合于人类以外的其他生物的生存、运动和发展的规律。纳什均衡和博弈论的桥梁作用,使经济学与其他社会科学、自然科学的联系更加紧密,形成了经济学与其他学科相互促进的良性循环。

  (6)改变了经济学的语言和表达方法。在进化博弈论方面相当有造诣的坎多利(Kandori,1997)对保罗·萨缪尔森(Paul Samuelson)的名言“你甚至可以使一只鹦鹉变成一个训练有素的经济学家,因为它必须学习的只有两个词,那就是‘供给’和‘需求’”,曾做过一个幽默的引申,他说,“现在这只鹦鹉需要再学两个词,那就是‘纳什均衡’”。

[编辑] 纳什均衡案例分析

[编辑] 案例一:纳什均衡在货币政策效应中的应用[2]

  一、博弈论下的货币政策博弈分析

  货币政策博弈分析 利用博弈论方法分析宏观金融博弈问题。因而,博弈论是宏观金融博弈分析的方法论基础。纳什(Nash) 在195O年和1951年发表了两篇关于非合作博弈的重要文章,从一般意义上定义了非合作博弈及其均衡解.并证明了均衡的存在.基本奠定了现代非合作博弈论的基础。因而,该均衡以后被博弈理论称为“纳什均衡”。即是指由所有的参与者的最优策略组成的策略组合。在这种策略组合中 给定其他参与者的策略,没有任何单个参与者有积极性选择其他策略 也就没有人主动去打破这种均衡。相反如果一种均衡或制度安排,如果不是一种纳什均衡.即不是所有参与者的最优策略组合 那么,这种组合就不能成立或者至少不能持续。合作博弈强调团体理性、效率和公平。而非合作博弈强调个人理性、个人最优决策。其结果可能是有效的 也可能是无效的。现实中 大量的经济博弈问题是非合作博弈。非合作博弈理论的发展为其在经济研究中的广泛应用创造了条件并推动了合作博弈的进一步发展。

  纳什均衡假定博弈参与者在选择自己的策略时,把其他参与者的策略当做给定的。而不考虑自己的选择如何影响博弈对手的选择。这个假定在静态博弈下是成立的,但在动态博弈下却不成立。

  在静态博弈中,所有参与者同时行动,不可能在自己采取行动前观察到其他人的行动 因而就无暇反应。但在动态博弈中 一方行动在先 另一方行动在后.后者自然会根据前者的选择而调整自己的选择,前者自然会理性地预期到这一点,所以不能不考虑自己的选择对其他参与者的影响,由于决策者不考虑自己的选择对他人选择的影响,纳什均衡允许了不可置信威胁的存在。1965年泽尔腾(Selten) 将纳什均衡的概念引入了动态分析定义了子博弈精练纳什均衡” 的概念。将不可置信的威胁策略从纳什均衡中剔除出去,从而解决了完全信息动态博弈均衡求解问题 将不可置信的策略变成可置信策略的行动 即经济学中的 承诺行动”。如果当事人不履行其承诺时将为之付出相应的代价 这种承诺就是可置信的,否则就是不可置信的。该概念的提出,对利用博弈论方法研究货币政策问题奠定了基础。

  二、纳什均衡在货币政策效应中的应用

  在理性预期条件下,我们考察一期的货币政策博弈均衡。假定中央银行的目标成本函数为:。

  其中:π为通货膨胀率;y为实际经济增长率;y * 为中央银行期望的经济增长率。

  根据卢卡斯供给曲线:y = yn + α(π − πe),α > 0.其中:为潜在经济增长率;为公众的预期通货膨胀率:a表示非预期通膨胀对经济的影响程度,即总供给曲线的斜率。

  假定α=1,即:y = yn + (π − πα)

  同时假定中央银行对货币增长有完全的控制能力.公众的预期完全理性 不存在真实供给冲击和货币流通速度变化的影响.通货膨胀率π等于货币供给增长率m,通货膨胀预期πα。等于货币供给增长率me,中央银行期望的经济增长率与潜在的经济增长率相等。有。

  令公众的目标函数为避免由于预期误差导致的通货膨胀之害,因此可把公众的效用函数定义为:U = − (m − me)2

  可得该货币政策博弈的支付矩阵如下:

中央银行策略(m)公众策略(me)

01

0(0,0)(0,0,5)

1(1,-1)(0,5,0)

  矩阵中m=0表示中央银行选择零的货币增长率 m=1表示中央银行选择正的货币增长率:公众策略的含义同上。由支付矩阵可知 对中央银行来说,m=1的效用严格优于m=0的效用.m=1为其最优策略。在理性预期下,公众迅速认识到中央银行会选择正的货币增长率,其必然选择m=1以使其效用最大化,该博弈模型的纳什均衡是中央银行选择正的货币增长率,公众选择正的通货膨胀率预期,效用函数为(0,5,0)。均衡结果显示货币政策只会影响通货膨胀率而真实产出不变。

  货币政策博弈具体表现为货币政策的决策和执行过程中存在动态不一致性问题。博弈主体在当前做出的关于未来的最优决策,在决策执行时对决策制定者已不再是最优决策.因而他必然要调整其决策。例如 在公众预期形成之前 对于货币政策制定者来说,零通货膨胀(或较低通货膨胀)可能是最优的选择。因而为了影响公众预期,他可能在此选择和许诺他将实行零通货膨胀(或较低通货膨胀)。但是,当公众预期形成以后零通货膨胀(或较低通货膨胀)对政策制定者来说已不是最优决策。为了获得非预期通货膨胀对经济增长和就业增加的刺激作用,政策制定者必须实行正的(或更高的)通货膨胀.在完全信息条件下公众知道政策制定者会这样做.因而他的许诺是不可置信的。具有理性和完全信息的公众不会被其愚弄.最后结果必然是被预期到的正的(或更高的)通货膨胀。相机选择货币政策的这种通货膨胀(通货紧缩)倾向是由该博弈结构内生性决定的,即该均衡(纳什均衡)允许了不可置信的威胁策略的存在,中央银行关于零通胀(或低通胀)的许诺是不可置信的。

  要消除货币政策的通货膨胀(通货紧缩)倾向 必须消除这种不可置信因素——中央银行在公众预期形成之前承诺其将毫不改变地执行单一规则的货币政策 通过承诺行动中央银行获得了影响公众预期的能力。因而,在选择其货币供给增长率时.就必须考虑它对公众预期的立即和充分的影响 就不能期望制造非预期通货膨胀(通货紧缩)来刺激经济、增加就业或为预算融资。这就是说,提高政策的稳定性和可信程度是消除通货膨胀(通货紧缩)的关键。

[编辑] 相关条目

约翰·纳什

囚徒困境

[编辑]参考文献

↑ 高红阳.纳什均衡的重要影响及其问题局限

↑ 毛莹.纳什均衡在货币政策效应中的应用[J].商场现代化,2009,(5):363.

来自"https://wiki.mbalib.com/wiki/%E7%BA%B3%E4%BB%80%E5%9D%87%E8%A1%A1"

打开MBA智库App, 阅读完整内容

打开App

本条目对我有帮助461

MBA智库APP

扫一扫,下载MBA智库APP

分享到:

温馨提示

复制该内容请前往MBA智库App

立即前往App

  如果您认为本条目还有待完善,需要补充新内容或修改错误内容,请编辑条目或投诉举报。

本条目相关文档

 估算转换成本的纳什——伯特兰均衡模型 4页 “纳什均衡”的启示 3页 进化稳定均衡与纳什均衡 20页 纳什均衡的效率及选择 4页 博弈论与纳什均衡 4页 第三节 纳什均衡 5页 纳什理想货币思想评析 3页 策略性博弈与纳什均衡 26页 效用函数与纳什均衡 8页 纳什均衡与博弈论的发展 14页 更多相关文档

本条目相关课程

本条目由以下用户参与贡献

Vulture,Angle Roh,山林,Mingshi,苦行者,Zfj3000,Leonardolee,Yixi,laogaogao,Dan,郭凯,金龙,Mis铭,赵丽娜,otf125,M id 6cbe1c39db3914adbbd5c9437b981725,LuyinT. 页面分类: 博弈论

评论(共68条)提示:评论内容为网友针对条目"纳什均衡"展开的讨论,与本站观点立场无关。

211.139.145.* 在 2008年3月13日 23:27 发表

为什么这么间单的理论会搞到人疯掉

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

116.230.89.* 在 2008年3月29日 20:41 发表

越是多数人觉得容易理解的理论或道理,越是难以用简陋的文字和图表表示清楚.所以,能解释简单道理的人,往往都疯掉了,原因最简单的就是只有一个人疯了,对大部分琐碎都麻木了,他才能有足够的时间,精力和注意力去接近和感受真相.

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

Lteco (Talk | 贡献) 在 2008年4月18日 10:27 发表

你说简单,是因为你不知道什么是纳什均衡,人疯和均衡有什么因果关系?

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

131.113.230.* 在 2008年5月21日 11:01 发表

116.230.89.* 在 2008年3月29日 20:41 发表

越是多数人觉得容易理解的理论或道理,越是难以用简陋的文字和图表表示清楚.所以,能解释简单道理的人,往往都疯掉了,原因最简单的就是只有一个人疯了,对大部分琐碎都麻木了,他才能有足够的时间,精力和注意力去接近和感受真相.

你在講什麼東西?還是先把中文讀好再來寫評論吧!

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

218.185.222.* 在 2008年7月13日 14:10 发表

这个理论不简单啊

他不过是用一个简单的例子来说明而已

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

76.66.22.* 在 2008年8月5日 10:46 发表

NASH的理论最烦的不是2个囚徒和坦白,抵赖的运算。是N个囚徒和N种方式的概率实现,那就烦了。

只有2种当然容易理解,但有N行乘N列的MATRIX运算,那头就大喽。。。

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

王学武 (Talk | 贡献) 在 2008年10月9日 09:24 发表

纳什精神出现状况并不因为这“简单的理论”,而是因为对数字超乎寻常的敏感~ 甚至用公式来计算很多随机性的事件 可以这样说吧 说不定他还能通过算法分析计算出你在闹市捡到100块之后的行为

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

117.63.102.* 在 2008年11月7日 15:42 发表

其实这就是人性,趋利避害

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

59.56.217.* 在 2008年12月6日 13:42 发表

1楼 你觉得简单 真是不知天高地厚的人啊

有空去看系动态博弈的微分博弈

等你看明白 再评价这些吧

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

59.56.217.* 在 2008年12月6日 13:44 发表

你们有没想过 如果这2个人重复进行多次博弈 而且多人多次进行这样的博弈 最后会这么样呢

你们能得到答案吗 能解出多人多次这样博弈如果你想获得最后的成功 你要用什么样的策略呢

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

129.215.205.* 在 2008年12月11日 09:16 发表

这个理论让人学得心寒,人性好可怕!

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

222.70.71.* 在 2009年5月2日 16:22 发表

有没有看过电影《美丽心灵》 一个讲述约翰纳什的美丽故事 不仅为他的数学才能折服

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

116.5.75.* 在 2009年7月5日 18:44 发表

看起来容易,用起来难

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

125.65.136.* 在 2009年11月26日 14:03 发表

有没有人能够告诉我 占优策略是否就一定是纳什均衡呢?

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

Huaua (Talk | 贡献) 在 2009年11月26日 14:41 发表

125.65.136.* 在 2009年11月26日 14:03 发表

有没有人能够告诉我 占优策略是否就一定是纳什均衡呢?

  不管其他人选择什么策略,最优选择都是某一个固定的策略,也就是“以不变应万变”。那么这个固定的策略就是占优策略。如果每个参与人都有占优策略,那么这些占优策略的组合就是占优均衡。比如囚徒困境中,“招供”就是每个参与人的占优策略,(招供,招供)就是占优均衡。

  纳什均衡也是各参与人策略的组合。它的要求没有占优均衡这么强,它只要求在这个组合中,给定其他人的选择,这个选择是最优的,而不要求“不管其他人怎么选择,我的这个选择都是最优的”。

  说白了就是:占优均衡是一种特殊的纳什均衡。

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

Kingjinggood (Talk | 贡献) 在 2009年12月20日 19:58 发表

如果是 博弈的话,那么是不是 我想怎么玩就怎么玩了

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

211.142.247.* 在 2009年12月24日 15:17 发表

囚徒困境不是纳什均衡,是占优均衡。请不要误传。

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

Angle Roh (Talk | 贡献) 在 2009年12月25日 10:22 发表

211.142.247.* 在 2009年12月24日 15:17 发表

囚徒困境不是纳什均衡,是占优均衡。请不要误传。

个人觉得,条目中的囚徒困境例子,只是想表达在囚徒困境中存在着纳什均衡

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

58.214.250.* 在 2010年3月16日 15:41 发表

如果是N人博弈的话,相信结果最终还是会达到纳什均衡,且达成的更容易。

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

123.120.164.* 在 2010年3月29日 13:36 发表

置于死地而后生,声东击西,围魏救赵

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

Kimwang (Talk | 贡献) 在 2010年4月21日 00:12 发表

例子那里有点问题.大家发现了吗.

应该是:

1,两个人都不招,那么只按盗窃罪,两个人同时最多只判一年.

2,第二方面,甲/乙招了,而对方刚好没招,那么招认一方轻判3个月,对方(不招一方)将被重判10年

3,双方都招了,一起判5年

例子那里没说清楚前提,也说错了服刑的时间.

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

220.178.4.* 在 2010年5月12日 11:31 发表

占优均衡一定是纳什均衡,反之未必成立!

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

219.131.195.* 在 2010年5月20日 22:03 发表

对方都招是自保的最佳选择!

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

125.83.115.* 在 2010年5月22日 10:21 发表

纳什均衡是博弈论,但同时也是心理学

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

222.66.202.* 在 2010年6月6日 10:58 发表

个人觉得这个例子是有问题的。如果是你,你会招供么?显然不会,你也不会担心你的同伙会招供。因为如果他招供的话他要做一年牢,如果他不招供的话只会做三个月,同理你也是。互相不担心对方会招供,谁还会招供。所以我觉得作者应该把他招你不招改成他服刑三个月你服刑10年,都不招供改成服刑1年。

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

222.66.202.* 在 2010年6月6日 11:00 发表

Kimwang (Talk | 贡献) 在 2010年4月21日 00:12 发表

例子那里有点问题.大家发现了吗.

应该是:

1,两个人都不招,那么只按盗窃罪,两个人同时最多只判一年.

2,第二方面,甲/乙招了,而对方刚好没招,那么招认一方轻判3个月,对方(不招一方)将被重判10年

3,双方都招了,一起判5年

例子那里没说清楚前提,也说错了服刑的时间.

发现了,看的时候就觉得有问题。发表了评论才发现你已经提出来了。

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

120.92.235.* 在 2010年7月19日 17:26 发表

理论的东西只有发现了、领域拥有贡献了才是理论

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

61.28.29.* 在 2010年8月31日 09:08 发表

这个数字是有问题的,都不坦白的惩罚太小,有可能会被选择。

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

222.28.92.* 在 2010年11月16日 19:35 发表

222.70.71.* 在 2009年5月2日 16:22 发表

有没有看过电影《美丽心灵》 一个讲述约翰纳什的美丽故事 不仅为他的数学才能折服

看过,很感人~真的被约翰纳什震撼了

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

219.238.206.* 在 2010年12月15日 12:41 发表

Angle Roh (Talk | 贡献) 在 2009年12月25日 10:22 发表

个人觉得,条目中的囚徒困境例子,只是想表达在囚徒困境中存在着纳什均衡

这个说法是正道。

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

Ray123852 (Talk | 贡献) 在 2011年1月5日 04:37 发表

比下棋有趣多了,甚至可以反过来通过去除组合缩减他人组合,下棋的先手依旧有效。

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

123.121.222.* 在 2011年3月30日 00:06 发表

211.139.145.* 在 2008年3月13日 23:27 发表

为什么这么间单的理论会搞到人疯掉

他不是搞這個理論然後瘋了 納什自己說對數字圖形等非常的敏感使他產生了幻覺

The idea I had about supernatural beings came to me the same way that my mathematical ideas did. So I took them seriously.----A Beautiful Mind.

覺得簡單是因為在我們之前雙贏的理論就已經被提出了,如果沒有人提出的情況下你想到并證明了,像納什這樣,那你也是一個開拓者。

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

119.92.63.* 在 2011年5月11日 07:28 发表

听到NASH 这个名字一股热情涌上来了,神秘的均衡~~

翻译的作者也无法理解NASH Equilibrium,所以他写的是自己能理解的部分加工翻译的吧。

也不要怪他,他也没办法.应该谢谢.

那位知道中文版 NASH Equilibrium 详细的书?

请推荐.

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

123.15.50.* 在 2011年6月11日 20:50 发表

强悍的理论,不敢去细想~~~敬佩!!!

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

113.104.108.* 在 2011年6月23日 23:09 发表

纳什均衡理论的例子除了这个,谁还能给我举多一个?

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

114.224.43.* 在 2011年7月16日 09:40 发表

囚徒的困境说错了,

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

61.128.247.* 在 2011年9月15日 00:01 发表

ABCD男对ABCD女,最终A女多半嫁给D男。

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

Zhanghccn (Talk | 贡献) 在 2011年9月16日 14:12 发表

例子中的数字确实有问题,不能构成纳什均衡

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

Yixi (Talk | 贡献) 在 2011年9月16日 16:02 发表

Zhanghccn (Talk | 贡献) 在 2011年9月16日 14:12 发表

例子中的数字确实有问题,不能构成纳什均衡

原文已修正,谢谢指正哦~并添加了新的案例,希望对您有帮助哦~

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

125.111.161.* 在 2012年1月2日 21:35 发表

纳什均衡总能达到PARETO效率么?

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

220.173.136.* 在 2012年5月10日 22:34 发表

222.70.71.* 在 2009年5月2日 16:22 发表

有没有看过电影《美丽心灵》 一个讲述约翰纳什的美丽故事 不仅为他的数学才能折服

我就是看了之后,才初次了解纳什均衡,一段时间内疯狂的爱数学!超赞的电影!!!!!!!!!!!

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

220.173.136.* 在 2012年5月10日 22:37 发表

222.70.71.* 在 2009年5月2日 16:22 发表

有没有看过电影《美丽心灵》 一个讲述约翰纳什的美丽故事 不仅为他的数学才能折服

超赞的电影!!

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

123.150.182.* 在 2013年3月10日 15:06 发表

不懂啊

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

222.74.129.* 在 2013年3月27日 10:41 发表

N次方

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

82.24.100.* 在 2013年11月8日 12:08 发表

211.142.247.* 在 2009年12月24日 15:17 发表

囚徒困境不是纳什均衡,是占优均衡。请不要误传。

囚徒困境就是典型的纳什博弈,我现在正在学习纳什博弈,囚徒困境时教科书中举出的例子。不懂请别装懂。

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

LIN YING (Talk | 贡献) 在 2013年11月28日 12:28 发表

有谁能告诉我这四种的关系么?

1.Static Nash equilibrium

2.Prisoner’s dilemma and Battle of the sexes

3.Cournot and Bertrand Duopoly

4.Mixed Strategy

好像是说后面三种是第一种的example?是这样么?

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

14.215.22.* 在 2014年1月26日 08:48 发表

你根本没有读懂例子,如果你不招对方招了你将是十年

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

61.142.249.* 在 2014年6月6日 17:11 发表

我想问一下以上的各位,学这个均衡有什么用呢?用他本人直接的方法,又符合现代的环境

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

113.234.69.* 在 2015年1月22日 12:52 发表

211.139.145.* 在 2008年3月13日 23:27 发表

为什么这么间单的理论会搞到人疯掉

这是个平凡而又伟大的理论,平凡因为普通,伟大是因为可以说这么复杂。

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

134.154.55.* 在 2015年1月28日 11:56 发表

211.139.145.* 在 2008年3月13日 23:27 发表

为什么这么间单的理论会搞到人疯掉

那就问问自己为什么1+1=2有人论证了几十年

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

108.54.71.* 在 2015年5月25日 08:17 发表

这个理论厉害在把复杂的写的很简单, 并把这个理论用数字给表达出来了。 说简单的估计你看不懂那个公式吧。 不要轻看任何被大部分世界科学家都赞同的理论。

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

61.142.75.* 在 2015年5月26日 10:12 发表

数学不好的就别逼逼了,你能看得懂例子不代表这个理论简单。人家只是用一个通俗的例子来说明一个数学问题,说到底,这还是个数学问题。

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

110.184.150.* 在 2015年5月27日 15:53 发表

困徒那个应该不是吧。

求解?

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

36.100.66.* 在 2016年1月27日 23:11 发表

貌似懂得自重一点,不说话没人把你当哑巴,知之为知之,不知为不知。是做人最起码的道德底线。

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

少年你渴望力量吗 (Talk | 贡献) 在 2016年11月10日 05:15 发表

囚徒的例子实际是论人与人之间信任的重要性

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

42.120.75.* 在 2017年8月18日 15:06 发表

211.142.247.* 在 2009年12月24日 15:17 发表

囚徒困境不是纳什均衡,是占优均衡。请不要误传。

占优均衡就是强纳什均衡

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

117.136.3.* 在 2018年2月26日 16:04 发表

116.230.89.* 在 2008年3月29日 20:41 发表

越是多数人觉得容易理解的理论或道理,越是难以用简陋的文字和图表表示清楚.所以,能解释简单道理的人,往往都疯掉了,原因最简单的就是只有一个人疯了,对大部分琐碎都麻木了,他才能有足够的时间,精力和注意力去接近和感受真相.

越简单越不容易用平常的眼光去看待

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

123.158.160.* 在 2018年5月27日 10:57 发表

能用数学语言描述并归纳出事物的发展规律,这才是作者价值之处。跟疯不疯无关。

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

沙柏 (Talk | 贡献) 在 2018年6月19日 17:15 发表

42.120.75.*:

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

210.223.241.* 在 2019年4月12日 13:25 发表

211.139.145.* 在 2008年3月13日 23:27 发表

为什么这么间单的理论会搞到人疯掉

简单源于无知

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

39.130.33.* 在 2019年5月11日 12:03 发表

211.139.145.* 在 2008年3月13日 23:27 发表

为什么这么间单的理论会搞到人疯掉

读读纳什的博士论文,可能疯掉都搞不懂。或者买本梯若尔的教材、博弈论文集再了解一下。

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

14.154.178.* 在 2019年7月18日 13:49 发表

这本质上属于跌级收益

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

129.104.223.* 在 2019年9月27日 04:33 发表

这第一句话定义就错了。纳什均衡并不需要构成支配性策略,只需要任何一方不能单方面改变自己策略而获益就够了。

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

221.7.131.* 在 2019年12月5日 17:35 发表

131.113.230.* 在 2008年5月21日 11:01 发表

你在講什麼東西?還是先把中文讀好再來寫評論吧!

你写的是什么东西?还是先把汉语和中文都学好再来评论吧!

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

218.2.216.* 在 2019年12月17日 14:26 发表

131.113.230.* 在 2008年5月21日 11:01 发表

你在講什麼東西?還是先把中文讀好再來寫評論吧!

你写的什么东西,学好中文再来评论吧,这么简单的一句话都读不懂,还指责别人

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

M id 17b487c65f12e78249134aec49f29b71 (Talk | 贡献) 在 2021年6月21日 23:20 发表

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

1.192.171.* 在 2021年11月3日 11:06 发表

// 纳什均衡从全局看起来不见得是“理性”的,不是看起来的最优解,但是对每个人来说,它的确是在别人不可控时自己的最优解。

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

113.89.33.* 在 2021年11月5日 17:24 发表

211.139.145.* 在 2008年3月13日 23:27 发表

为什么这么间单的理论会搞到人疯掉

你看美丽心灵电影就知道了,纳什精神状况出现问题不是因为这个理论,而是当时的时代背景。

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

发表评论请文明上网,理性发言并遵守有关规定。

首页

文档

百科

课堂

商学院

资讯

知识点

国际MBA

商城

企业服务

问答

首页

专题

管理

营销

经济

金融

人力资源

咨询

财务

品牌

证券

物流

贸易

商学院

法律

人物

分类索引

 

百科VIP

百科VIP会员权益

无广告阅读

免验证复制

开通/续费百科VIP

登录

消息

昵称未设置

百科VIP

未开通

收藏夹

账号安全中心

我的页面

我的贡献

我的讨论页

我的设置

退出登录

打开APP

导航

最新资讯

最新评论

最新推荐

热门推荐

编辑实验

使用帮助

创建条目

随便看看

本周推荐

最多推荐

生产线包装印刷宗庆后消费经济纪梵希第一性原理智能卡批发食品软预算约束

奶头乐理论蘑菇管理定律猴子管理法则情绪ABC理论垃圾人定律100个最流行的管理词汇破窗效应INFPSWOT分析模型21天效应

以上内容根据网友推荐自动排序生成

下载APP

此页面最后修订:10:04,2019年6月13日.

智库首页 -

百科首页 -

关于百科 -

客户端 -

人才招聘 -

广告合作 -

权利通知 -

联系我们 -

免责声明

- 友情链接

©2023 MBAlib.com, All rights reserved.

闽公网安备 35020302032707号

意见反馈

问题分类

类型

反馈内容

添加图片(选填)0/9

联系方式

取消

提交

提交成功

反馈结果请前往 MBA智库App 查看 (我的 > 帮助与反馈 > 我的反馈)

知道了

求解纳什均衡点 - 知乎

求解纳什均衡点 - 知乎切换模式写文章登录/注册求解纳什均衡点江枫渔火基本知识回顾两个人的双矩阵博弈可以这样描述:两个玩家 M 和 N 各有 m,n 个纯策略,当 M 使用纯策略 i 而 N 使用纯策略 j 时,M 的收益是 a_{ij}, N 的收益是 b_{ij}. 用 A 和 B 表示由 a_{ij} 和 b_{ij} 构成的矩阵.M 的混合策略 x = (x_1,x_2,\cdots,x_m)^T是指玩家 M 以概率 x_i 使用第 i 个策略,其中 x_1 + x_2 + \cdots + x_m = 1, 同理 N 的混合策略是 y = (y_1,y_2,\cdots,y_n)^T.用矩阵的形式,一个混合策略 (x,y) 如下定义:e^T x = e^T y = 1,\text{ and } x \ge 0, y\ge 0 \tag{2}(策略是单纯形? 这个回头学习一下回来补上)对应的收益是x^T A y \text{ and } x^T B y \tag{3}一个游戏的均衡点 (x_0,y_0) 需要满足对于任意满足 (2) 的策略 (x,y), 有x_0^T A y0 \ge x^T A y_0, \text{ and } x_0^T B y_0 \ge x_0^T B Y \tag{4}纳什证明了平凡的结论:对于 n 个人的有限博弈一定存在均衡点。均衡的等价表述(4) 是说一个策略如果是纳什均衡,则对每个人来说在别人不改变策略的情况下,自己的收益不比采取任何一个策略带来的收益低。另一种等价的表述是:一个策略如果是纳什均衡,则对每个人来说在别人不改变策略的情况下,自己的收益不比采取任何一个自己的纯策略带来的收益低。这一点用期望效用的公式很容易证明。对应的矩阵形式是B^T x_0 \le (x_0^T B y_0)e \text{ and } Ay_0 \le (x_0^T A y_0)e \tag{5}也就是说, (2)(4) 和 (2)(5) 是等价的。现在令 E = ee^T 是全部元素都是 1 的矩阵, 则满足 (2) 的 (x,y) 满足 Ey = e, x^TEy = x^Te = 1.现在令 k 是一个固定的且足够大的数使得 kE - B^T > 0, kE - A >0, 考虑以下方程的解 (x,y) (不需要满足条件(2))\begin{equation*}

\left\{

\begin{array}{ll}

(kE-B^T)x \ge e, x\ge 0, \\

(kE - A)y \ge e, y\ge 0,

\end{array}

\right. \text{ and }

\left\{

\begin{array}{ll}

y^T[(kE - B^T)x - e] = 0, \\

x^T[(kE - A)y - e] = 0.

\end{array}

\right.

\end{equation*} \tag{6}这样的解可以与均衡点 (x_0,y_0) 一一对应. 其实只要把这个方程的解标准化到 \Sigma x_i = 1, \Sigma y_i = 1 即可.将 k 也看作参数, 约束 (6) 的解其实可以看作对 \Sigma x_i, \Sigma y_i 无约束的 (5) 的解, 而固定下了 k 二者就构成了一一对应.展开 (6) 的左边两个不等式约束, 得到\begin{equation*}

\left\{

\begin{array}{ll}

B^T x \le k E x - e, \\

Ay \le k E y - e.

\end{array}

\right.

\end{equation*}y 和 (kE - B^T)x - e 都是大于等于 0 的向量, 它们的内积为零说明在任意一个维度上至多只能有一个向量为正, 且两个向量都存在一些维度为零.k E x - e 是所有元素都为 k\Sigma x_i - 1 的列向量, (kE - B^T)x - e \ge 0 且有些元素严格取等说明 k\Sigma x_i - 1 = \max B^Tx, y 只能在 B^T x 中等于 \max B^Tx 的维度上大于零, 这其实对应于均衡时每个人策略的支撑集应当包含于对其他人策略的最优反应(\text{supp}(\sigma_i) \subset BR_i(\sigma_{-i})). 这里已经给出了均衡时各个策略之间分布的比例关系, 将 (x,y) 标准化到 \Sigma x_i = 1, \Sigma y_i = 1 即可得到一个均衡点.展开 (6) 的右边两个等式约束, 得到\begin{equation*}

\left\{

\begin{array}{ll}

k y^TE x - y^Te = y^TB^Tx, \\

k x^T E y - x^Te = x^TAy.

\end{array}

\right.

\end{equation*}注意到 y^TE x = x^T E y = (\Sigma x_i)(\Sigma y_j), 想从 (x_0,y_0) 映射到 (x,y), 其实也是要确定缩放的比例 r_1,r_2, 记均衡收益为 (p_1,p_2), 求解方程组\begin{equation*}

\left\{

\begin{array}{ll}

k r_1 r_2 - r_2 = r_1 r_2 p_2, \\

k r_1 r_2 - r_1 = r_1 r_2 p_1.

\end{array}

\right.

\end{equation*}对应的(x,y) = (r_1 x_0, r_2 y_0).非退化问题上一节已经证明了 (2)(5) 与 (2)(6) 的等价性, 接下来只要考虑以下问题的解: A 和 B 的矩阵元素都为正数, 求解 (x,y) 满足\begin{equation*}

\left\{

\begin{array}{ll}

B^Tx \ge e, x\ge 0, \\

Ay \ge e, y\ge 0,

\end{array}

\right. \text{ and }

\left\{

\begin{array}{ll}

y^T(B^Tx - e) = 0, \\

x^T(Ay - e) = 0.

\end{array}

\right.

\end{equation*} \tag{7}这里的 A,B 对应于上一节中的 kE - B^T 和 kE - A.令X = \{x:x \ge 0, B^Tx - e \ge 0\}记B = (b_1,b_2,\cdots,b_n), I = (e_1,e_2,\cdots,e_m)X 是满足 m+n 个不等式约束的 x 的集合\begin{align*}

&e_i^T x \ge 0, & i = 1,2,\cdots,m,\\

&b_j^T x - 1 \ge 0, & j = 1,2,\cdots,n.

\end{align*}

\tag{10}X 边界上的点是 X 中满足以下至少一个线性关系的x\begin{align*}

&e_i^T x = 0, & i = 1,2,\cdots,m,\\

&b_j^T x - 1 = 0, & j = 1,2,\cdots,n.

\end{align*}

\tag{10}对于任意的 x, 对应了一个由(B,I) 的若干列向量构成的矩阵M(x): b_j(或者e_i)是 M 中的列向量当且仅当 b_j^T x - 1 = 0(或者e_i^Tx = 0). M(x) 中列向量的顺序并不重要.若 \bar B = (B,I) 的秩为 m, 至多存在一个 x 使得 \bar B = M(x). 如果更进一步, x\in X, 这就是 X 的一个极端点(extreme\ point). 即使不是计算上的需要,也是非常方便的,在下面的内容中要确保对于一个极端点x,M(x)正好有m列。接下来我们假设 X 满足非退化假设:\bar B = (B,I) 是 m 行 r 列的矩阵.如果存在 x 使得 \bar B = M(x), 则 rank(B) = r.

扰动定义一个给定的凸多面体(如X)的数据,从而使扰动的数据定义一个非退化多面体的方法,是众所周知的。对于给定的凸多面体 X,可以通过多种方式扰动定义该多面体的数据,使得扰动后的数据定义一个非退化的多面体这种扰动并不会影响存在性的证明,而是简化了均衡点的计算.这里指出一些这种假设的相关影响.

令 x_0 是 X 中的一个点, M(x_0) 是 m\times r 的矩阵. 由非退化假设, rank(M(x_0)) = r, 所以 M(x_0) 的列向量线性无关. 把 M(x_0) 写作 (d_1, d_2, \cdots, d_r), 可以扩充成m个线性无关的向量 C = (d_1, d_2, \cdots, d_m), 记 C 的逆矩阵的转置为 C^{-T} = (d^1, d^2, \cdots, d^m), 则有性质d_i^Td^j = \delta_i^j\delta_i^j 是克罗内克尔符号(Kronecker symbol), 当 i = j 时, \delta_i^j=1, 当 i \neq j 时, \delta_i^j=0.考虑从 x_0 变化得到的点x = x_0 + \Sigma_{i = 1}^m t_i d^i, \tag{12}其中 t_i 是标量.则有以下引理:存在 k 使得 \Sigma t_i^2 \le k 且 t_i \ge 0 时, (12) 给出的点都在 X 中.考虑直接把 x 代入约束条件记得到证明.这个引理主要是由于非退化性假设, 由此可得:(i) 如果 x_0 是 X 的一个极限点, 所以 M(x_0) (此处论文好像有typo) 是非奇异的. t_i 非负且很小的情形下 x = x_0 + t_i d^i 得到的 x 都在 X 中, M(x) = M_i 是从 M(x_0) 中删除第 i 列得到的矩阵. 这些点构成的集合叫做 X 的端点为 x_0 的一条开边(open edge).(ii) 如果 x_0 是 X 中满足 rank(M(x_0)) = m - 1 的点, 由 (12) 可得, x = x_0 + t_m d^m \quad (|t_m \le k|) 对一些 k 满足 M(x) = M(x_0). 这些点构成的集合被定义为 X 的一条开边(open edge). 所以对于任意的 x, x 附近的点仅能满足和 x 一样的线性约束条件(约束 (11)). 因此, 恰好有 m 条开边其中一个端点是极端点.(iii) X 恰好有 m 条无限边(unbounded edges), 每条边只有一个端点. 这些边上的点有性质 x = ke_i, 其中 k 是足够大的正数. 这是由于 B 只有正的元素, 其他 X 的开边都有两个端点, 即连接两个极端点. 因此, 两个极端点是相邻的当且仅当他们对应的矩阵有且仅有一列不相同(列的顺序并不重要).类似地, 令Y = \{y:y \ge 0, Ay - e \ge 0\}. \tag{14}Y 的边界定义为 Y 中满足至少一条以下条件的点:\begin{align*}

&a_i^T y - 1 = 0, & i = 1,2,\cdots,m,\\

&e_j^T y = 0, & j = 1,2,\cdots,n.

\end{align*}

\tag{10}其中 A^T = (a_1, a_2, \cdots, a_m).和 X 一样, 假设 Y 满足非退化条件, 所有的定义和引理都类似, 只是 m 和 n 互换了, (B,I) 换成了 (I, A^T), N(y) 表示对应的矩阵.令 Z = (X,Y) 是 X 和 Y 的笛卡尔积. z = (x,y) 是 Z 的极端点当且仅当 x 是 X 的极端点且 y 是 Y 的极端点. z 在 Z 的一条开边上当且仅当 x 和 y 其中一个是极端点, 另一个在开边上.由 (7), 均衡点 z = (x,y) 的均衡条件是 Z 中的点 z 满足非退化假设\begin{align*}

&(e_i^T x)(a_i^T y - 1), & i = 1,2,\cdots,m,\\

&(e_j^T y)(b_j^T x -1), & j = 1,2,\cdots,n.

\end{align*}

\tag{10}引理: 非退化问题的均衡点是 Z 的极端点.对于给定的 r, 定义 S_r 是 Z 中满足所有 m+n 个约束中除了可能违背 (e_r^T y)(b_r^T x - 1) = 0, 其他都满足的点的集合.引理: S_r 中的点要么是 Z 的极端点, 要么在 Z 的开边上.引理: 恰有一个 Z 的无限边由 S_r 的点构成.引理: z 是 Z 的一个极端点, 也是 S_r 中的点. 存在 Z 的一到两条开边构成了所有 S_r 中的点, 且一个端点是 z. z 是一个均衡点当且仅当存在一条这样的边.引理: S_r 是非空的. 且 S_r 是有限个不相交的 r-路径的并集。每个 r-路径要么是闭合的r-路径(不含均衡点),要么包含一个或两个均衡点。现在令 P_0 是包含无限边 E_0 的r-路径.定理: P_0 包含恰好一个均衡点. 这个点的计算可以通过从无限边 E_0 开始遍历 P_0 得到. 均衡点的数量一定是有限的且为奇数.一般情形(解决退化问题)(i) 原始的数据可以通过类似线性规划理论的扰动得到非退化问题, 且通过上一节的结论依然有效;(ii) 扰动方案确保扰动后的多面体的任何极端点都定义了原始多面体的一个明确的极端点.特别地,扰动问题的均衡点定义了原始问题的均衡点。特定的扰动方案不是唯一的。使用扰动数据计算极点路径的计算方案是众所周知的,本文不再讨论。本文使用 Zhihu On VSCode 创作并发布发布于 2023-05-27 13:52・IP 属地北京​赞同 1​​添加评论​分享​喜欢​收藏​申请