莫瑞斯：纳什均衡点是什么，怎么求？

2020-8-11 16:39| 发布者: admin| 查看: 141| 评论: 0

摘要: 彬宇的回答：纳什均衡的定义：在博弈G=｛S1,…,Sn：u1,…,un｝中，如果由各个博弈方的各一个策略组成的某个策论组合（s1*,…,sn*）中，任一博弈方i的策论si*，都是对其余博弈方策略的组合（s1*,…s*i-1,s*i+1,…,sn ...

彬宇的回答：

纳什均衡的定义：在博弈G=｛S1,…,Sn：u1,…,un｝中，如果由各个博弈方的各一个策略组成的某个策论组合（s1*,…,sn*）中，任一博弈方i的策论si*，都是对其余博弈方策略的组合（s1*,…s*i-1,s*i+1,…,sn*）的最佳对策，也即ui（s1*,…s*i-1, si*,s*i+1,…,sn*）≥ui（s1*,…s*i-1, sij*,s*i+1,…,sn*）对任意sij∈Si都成立，则称（s1*,…,sn*）为G的一个纳什均衡。假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯，对每一个犯罪嫌疑人，警方给出的政策是：如果一个犯罪嫌疑人坦白了罪行，交出了赃物，于是证据确凿，两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白，则两人各被判刑8年；如果另一个犯罪嫌人没有坦白而是抵赖，则以妨碍公务罪（因已有证据表明其有罪）再加刑2年，而坦白者有功被减刑8年，立即释放。如果两人都抵赖，则警方因证据不足不能判两人的偷窃罪，但可以私入民宅的罪名将两人各判入狱1年.关于案例，显然最好的策略是双方都抵赖，结果是大家都只被判1年。但是由于两人处于隔离的情况，首先应该是从心理学的角度来看，当事双方都会怀疑对方会出卖自己以求自保、其次才是亚当·斯密的理论，假设每个人都是“理性的经济人”，都会从利己的目的出发进行选择。这两个人都会有这样一个盘算过程：假如他坦白，我抵赖，得坐10年监狱，坦白最多才8年；他要是抵赖，我就可以被释放，而他会坐10年牢。综合以上几种情况考虑，不管他坦白与否，对我而言都是坦白了划算。两个人都会动这样的脑筋，最终，两个人都选择了坦白，结果都被判8年刑期。纳什均衡达成时，并不意味着博弈双方都处于不动的状态，在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。

韩彬彬的回答：

爱她i的回答：

纳什均衡又称为非合作博弈均衡，是博弈论的一个重要术语，以约翰·纳什命名。纳什均衡是一种策略组合，使得每个参与人的策略是对其他参与人策略的最优反应。假设有n个局中人参与博弈，如果某情况下无一参与者可以独自行动而增加收益（即为了自身利益的最大化，没有任何单独的一方愿意改变其策略），则此策略组合被称为纳什均衡。所有局中人策略构成一个策略组合（strategyprofile）。纳什均衡达成时，并不意味着博弈双方都处于不动的状态，在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。纳什均衡也不意味着博弈双方达到了一个整体的最优状态，只有最优策略才可以达成纳什均衡，严格劣势策略不可能成为最佳对策，而弱优势和弱劣势策略是有可能达成纳什均衡的。在一个博弈中可能有一个以上的纳什均衡，而囚徒困境中有且只有一个纳什均衡。上策均衡是指不管你选择什么策略，我所选择的是最好的；不管我选择什么策略，你所选择的是最好的。由博弈各参与人的上策所组成的均衡，称为上策均衡。一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策，那么这个策略组合肯定是所有博弈方都愿意选择的，必然是该博弈比较稳定的结果。这就是上策均衡。