根据博弈论的分析,“囚徒困境”中的两个囚徒的优势战略是()

题目

根据博弈论的分析,“囚徒困境”中的两个囚徒的优势战略是()

  • A、一方交代,另一方不交代
  • B、双方都不交代
  • C、双方都交代
  • D、双方沟通
参考答案和解析
正确答案:C
如果没有搜索结果或未解决您的问题,请直接 联系老师 获取答案。
相似问题和答案

第1题:

囚徒困境中,对两个囚徒单独同时审问,囚徒A的占优策略是()。

A、不坦白

B、坦白

C、不能确定,要看囚徒B如何选择

D、伺机逃跑


参考答案:B

第2题:

博弈论中“囚徒困境”的纳什均衡为()

A. (坦白,坦白)

B. (抵赖,抵赖)

C. (坦白,抵赖)

D. (抵赖,坦白)


答案:A

第3题:

城市管理中存在的哪些问题是囚徒博弈的结果和囚徒困境的表现?


参考答案:(1)城市公共产品供给不足;(2)城市公共组织效率缺失;(3)城市、区域之间竞争恶化。

第4题:

根据博弈论,囚徒困境下的囚犯最终会选择()。

  • A、坦白
  • B、认罪
  • C、沉默
  • D、包庇

正确答案:A

第5题:

用囚徒困境说明什么是占优策略均衡?


答案:
解析:
(1)囚徒困境是指两个被捕获的囚徒之间的一种特殊“博弈”,说明为什么在合作对双方都有利时,保持合作也是困难的。囚徒困境反映了个人理性和集体理性的矛盾,出于个人理性的考虑并不能实现集体理性,个人理性并不是实现集体理性的充分条件。 (2)在博弈中,无论其他参与人采取什么策略,该参与人的最优策略是唯一的,这样的策略称为占优策略,此时达到的博弈均衡称为占优策略均衡。 (3)囚徒困境如表1-1中的例子:

显然,对张三和李四两个人来说,最好的结果是两个人都不坦白,因为两个人都不坦白,每个人都只坐1年牢,总共坐牢时间是2年。但是,对于张三来说,无论李四选择坦白还是不坦白,张三的最优决策总是坦白。同理,对于李四来说,无论张三选择坦白还是不坦白,李四的最优决策也总是坦白。此时,(坦白,坦白)就是一个占优策略均衡。

第6题:

“囚徒困境”发生的原因是什么?


参考答案:个人追求自身利益最大化,最终导致了集体利益恶化。

第7题:

请论述“囚徒困境”的经济学意义。


正确答案:

回答此问题,可以参考教材以及以下资料【囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。单次发生的囚徒困境,和多次重复的囚徒困境结果不会一样。

  在重复的囚徒困境中,博弈被反复地进行。因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时,合作可能会作为均衡的结果出现。欺骗的动机这时可能被受到惩罚的威胁所克服,从而可能导向一个较好的、合作的结果。作为反复接近无限的数量,纳什均衡趋向于帕累托最优。

 囚徒困境的主旨为,囚徒们虽然彼此合作,坚不吐实,可为全体带来最佳利益(无罪开释),但在资讯不明的情况下,因为出卖同伙可为自己带来利益(缩短刑期),也因为同伙把自己招出来可为他带来利益,因此彼此出卖虽违反最佳共同利益,反而是自己最大利益所在。但实际上,执法机构不可能设立如此情境来诱使所有囚徒招供,因为囚徒们必须考虑刑期以外之因素(出卖同伙会受到报复等),而无法完全以执法者所设立之利益(刑期)作考量。

经典的囚徒困境

  1950年,由就职于兰德公司的梅里尔•弗勒德(Merrill Flood)和梅尔文•德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问艾伯特•塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:

  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:

  若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。

  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。

  若二人都互相检举(互相“背叛”),则二人同样判监2年。

  用表格概述如下:

  甲沉默(合作) 甲认罪(背叛)

  乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年

  乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年

  解说

  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。

  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:

  若对方沉默、背叛会让我获释,所以会选择背叛。

  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。

  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。

  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。

现实的例子

  上述例子可能显得不甚自然,但现实中,无论是人类社会或大自然都可以找到类似囚徒困境的例子,将结果划成同样的支付矩阵。社会科学中的经济学、政治学和社会学,以及自然科学的动物行动学、进化生物学等学科,都可以用囚徒困境分析,模拟生物面对无止境的囚徒困境博弈。囚徒困境可以广为使用,说明这种博弈的重要性。以下为各界例子:

  政治学例子:军备竞赛

  在政治学中,两国之间的军备竞赛可以用囚徒困境来描述。两国都可以声称有两种选择:增加军备(背叛)、或是达成削减武器协议(合作)。两国都无法肯定对方会遵守协议,因此两国最终会倾向增加军备。似乎自相矛盾的是,虽然增加军备会是两国的“理性”行为,但结果却显得“非理性”(例如会对经济造成都有损坏等)。这可视作遏制理论的推论,就是以强大的军事力量来遏制对方的进攻,以达到和平。

  经济学例子:关税战

  两个国家,在关税上可以有以两个选择:

  提高关税,以保护自己的商品。(背叛)

  与对方达成关税协定,降低关税以利各自商品流通。(合作)

  当一国因某些因素不遵守关税协定,独自提高关税(背叛),另一国也会作出同样反应(亦背叛),这就引发了关税战,两国的商品失去了对方的市场,对本身经济也造成损害(共同背叛的结果)。然后二国又重新达成关税协定。(重复博弈的结果是将发现共同合作利益最大。)

  商业例子:广告战

  商业活动中亦会出现各种囚徒困境例子。以广告竞争为例。

  两个公司互相竞争,二公司的广告互相影响,即一公司的广告较被顾客接受则会夺取对方的部分收入。但若二者同时期发出质量类似的广告,收入增加很少但成本增加。但若不提高广告质量,生意又会被对方夺走。

  此二公司可以有二选择:

  互相达成协议,减少广告的开支。(合作)

  增加广告开支,设法提升广告的质量,压倒对方。(背叛)

  若二公司不信任对方,无法合作,背叛成为支配性策略时,二公司将陷入广告战,而广告成本的增加损害了二公司的收益,这就是陷入囚徒困境。在现实中,要二互相竞争的公司达成合作协议是较为困难的,多数都会陷入囚徒困境中。

  自行车赛例子

  自行车赛事的比赛策略也是一种博弈,而其结果可用囚徒困境的研究成果解释。例如每年都举办的环法自由车赛中有以下情况:选手们在到终点前的路程常以大队伍(英文:Peloton)方式前进,他们采取这策略是为了令自己不至于太落后,又出力适中。而最前方的选手在迎风时是最费力的,所以选择在前方是最差的策略。通常会发生这样的情况,大家起先都不愿意向前(共同背叛),这使得全体速度很慢,而后通常会有二或多位选手骑到前面,然后一段时间内互相交换最前方位置,以分担风的阻力(共同合作),使得全体的速度有所提升,而这时如果前方的其中一人试图一直保持前方位置(背叛),其他选手以及大队伍就会赶上(共同背叛)。而通常的情况是,在最前面次数最多的选手(合作)通常会到最后被落后的选手赶上(背叛),因为后面的选手骑在前面选手的冲流之中,比较不费力。

第8题:

囚徒困境反映了:()与()。


参考答案:个人理性;集体非理性冲突

第9题:

在一次囚徒困境中,两个囚徒不会合作,但如果博弈重复100次,则他们之间可能合作。( )


答案:错
解析:
如果对一次博弈,只有唯一的纳什均衡,那么对于有限次重复博弈而言,这一结果不会改变。采用逆向归纳法:当博弈到第100次,博弈者不合作的收益大于合作的收益,所以最优策略是不合作。当博弈到99次时,理性博弈者知道第100次博弈不会合作,所以第99次博弈也不合作。依此类推,最优策略都是不合作。

第10题:

在具有占优战略均衡的囚徒困境博弈中()。

  • A、只有一个囚徒会坦白
  • B、两个囚徒都没有坦白
  • C、两个囚徒都会坦白
  • D、任何坦白都被法庭否决了

正确答案:C