论述“囚徒困境”模型对商务谈判的启示。

题目

论述“囚徒困境”模型对商务谈判的启示。

参考答案和解析
正确答案: 从合作博弈角度来讲,交易双方都能从合作行为中得到利益,合作性结果的出现需要谈判双方拥有充分的交流和信息,一旦谈判双方不能进行信息交流,就难以实现一个有利于每个当事人的合作利益,这种谈判就叫“囚徒困境”是一种非合作性的博弈状况,纳什的强谈判理论给出了谈判的唯一可行解是这一理论中的重要成就。
如果没有搜索结果或未解决您的问题,请直接 联系老师 获取答案。
相似问题和答案

第1题:

论述IS-LM曲线的政策含义,该模型对我国当前宏观经济的运行有何启示?


参考答案:

(1)IS-LM曲线的政策含义IS-LM模型是一个二元方程组,它通过产品市场和货币市场的同时均衡来确定以收入y和利率r为变量的宏观经济空间中的均衡点。IS曲线代表产品市场处于均衡状态的收和利率的所有组合;LM曲线代表货币市场处于均衡状态的收入和利率的所有组合;IS曲线和LM曲线的交点代表两市场同时处于均衡状态的y与r的唯一组合。IS曲线的斜率主要取决于投资对利率的敏感程度d(因为β,t都比较稳定)。d越小,IS曲线的斜率越大,也越陡峭,d越大,斜率越小,则IS越平坦,d=0,IS成一条垂线;LM曲线的斜率主要取决于货币需求的利率弹性h,h越小,斜率越大,则LM越陡;h越大,斜率越小,则LM越平坦,当h→∞时,LM近乎一条平行线。(并说明IS,LM曲线在各种形状时,货币政策与财政效果的大小。)IS-LM模型为执行与选择货币政策与财政政策提供了理论依据,当均衡产出水平低于充分就业的产出水平时,政府便利用财政政策和货币政策,来改变IS曲线与LM曲线的位置,从而提高产出水平。(相反情况的论述略)
(2)IS-LM模型与中国宏观经济形势从我国实践来看,自1996年底,国民经济成功实现“软着陆”后,由于亚洲金融危机的蔓延,我国出口受到严重影响。加上国内深层次、结构性、体制性等原因的影响经济增长率持续走低,物价水平连续下降。为了遏制经济增长持续下滑的势头,扩大内需,抑制通缩,国家自1998年以来采取了积极的财政稳健的货币政策。财政政策包括,增发巨额国债用于基础设施建设和补充国有独资商业银行准备金,加大出口退税力度,降低关税水平,取消29项收费项目以减轻企业负担等一系列措施与时同时,中央银行采取适度扩张的货币政策与之相配合,如连续七次下调利率降低再贴现、再贷款利率,改革存款准备金制度等一系列措施。在IS-LM模型中,扩张性的财政政策使IS曲线向右移动,同时,扩张性的货币政策又使LM曲线向右移动,以保持真实利率水平不变,防止可能出现的财政政策挤出效应。显然,在实施扩张性的财政政策的前提下,采用适度扩张性货币政策相配合是拉动内需的最好方式,我国实施这种政策已取得了明显的效果。根据IS-LM模型中财政政策与货币政策效果的分析以及我国当前的经济形势,2005年前后我国仍有必要性继续推行积极的财政政策和稳健适度的扩张性货币政策;并使二者相互协调配合。
(3)对IS-LM模型的理论评价:第一、积极方面:①这个模型不仅实现了收入决定论和货币论的结合,完成了财政政策和货币政策的配合,而且还可以把凯恩斯主义与货币主义结合起来。②这一模型不仅能说明r与Y的确定,而且还有明显的政策含义,具有很强的适用性,为凯恩斯国家干预经济的主张提供了理论说明。③可以用来解释衰退、高涨和充分就业状态,并选择相应的宏观经济政策。第二、缺陷:①能否消除失业和通胀,此模型并未提出彻底的解决办法。②IS曲线和LM曲线不是相互独立的,而是相互依存的。一条曲线移动的同时另一条曲线也可能发生移动,这样,IS-LM模型就失去了它的理论和政策意义。因为,它不能决定国民收入的均衡值,从而也就不能预测经济前景和政策效果。③此模型把社会总资本再生产中的矛盾和冲突仅仅归结为社会资本流通中商品的供求和货币供求的一种暂时的不均衡,掩盖了社会总资本再生产过程中所包含的本质矛盾和冲突。④它不可能按照劳动二重性原理研究社会总资本的价值形式和物质形式的补偿问题。⑤此模型不能解释滞胀,不能说明价格的决定,所以其作为分析工具的影响在减弱。


第2题:

“囚徒困境”发生的原因是什么?


参考答案:个人追求自身利益最大化,最终导致了集体利益恶化。

第3题:

在商务谈判中,采取何种谈判策略有时类似于囚徒两难模型中囚徒的选择。谈判双方都有欺骗和反欺骗两种策略。()

此题为判断题(对,错)。


正确答案:×

第4题:

在囚徒两难困境中,合作性反应是不坦白。

A

B



第5题:

用囚徒困境说明什么是占优策略均衡?


答案:
解析:
(1)囚徒困境是指两个被捕获的囚徒之间的一种特殊“博弈”,说明为什么在合作对双方都有利时,保持合作也是困难的。囚徒困境反映了个人理性和集体理性的矛盾,出于个人理性的考虑并不能实现集体理性,个人理性并不是实现集体理性的充分条件。 (2)在博弈中,无论其他参与人采取什么策略,该参与人的最优策略是唯一的,这样的策略称为占优策略,此时达到的博弈均衡称为占优策略均衡。 (3)囚徒困境如表1-1中的例子:

显然,对张三和李四两个人来说,最好的结果是两个人都不坦白,因为两个人都不坦白,每个人都只坐1年牢,总共坐牢时间是2年。但是,对于张三来说,无论李四选择坦白还是不坦白,张三的最优决策总是坦白。同理,对于李四来说,无论张三选择坦白还是不坦白,李四的最优决策也总是坦白。此时,(坦白,坦白)就是一个占优策略均衡。

第6题:

囚徒困境中,对两个囚徒单独同时审问,囚徒A的占优策略是()。

A、不坦白

B、坦白

C、不能确定,要看囚徒B如何选择

D、伺机逃跑


参考答案:B

第7题:

请论述“囚徒困境”的经济学意义。


正确答案:

回答此问题,可以参考教材以及以下资料【囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。单次发生的囚徒困境,和多次重复的囚徒困境结果不会一样。

  在重复的囚徒困境中,博弈被反复地进行。因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时,合作可能会作为均衡的结果出现。欺骗的动机这时可能被受到惩罚的威胁所克服,从而可能导向一个较好的、合作的结果。作为反复接近无限的数量,纳什均衡趋向于帕累托最优。

 囚徒困境的主旨为,囚徒们虽然彼此合作,坚不吐实,可为全体带来最佳利益(无罪开释),但在资讯不明的情况下,因为出卖同伙可为自己带来利益(缩短刑期),也因为同伙把自己招出来可为他带来利益,因此彼此出卖虽违反最佳共同利益,反而是自己最大利益所在。但实际上,执法机构不可能设立如此情境来诱使所有囚徒招供,因为囚徒们必须考虑刑期以外之因素(出卖同伙会受到报复等),而无法完全以执法者所设立之利益(刑期)作考量。

经典的囚徒困境

  1950年,由就职于兰德公司的梅里尔•弗勒德(Merrill Flood)和梅尔文•德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问艾伯特•塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:

  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:

  若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。

  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。

  若二人都互相检举(互相“背叛”),则二人同样判监2年。

  用表格概述如下:

  甲沉默(合作) 甲认罪(背叛)

  乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年

  乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年

  解说

  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。

  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:

  若对方沉默、背叛会让我获释,所以会选择背叛。

  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。

  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。

  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。

现实的例子

  上述例子可能显得不甚自然,但现实中,无论是人类社会或大自然都可以找到类似囚徒困境的例子,将结果划成同样的支付矩阵。社会科学中的经济学、政治学和社会学,以及自然科学的动物行动学、进化生物学等学科,都可以用囚徒困境分析,模拟生物面对无止境的囚徒困境博弈。囚徒困境可以广为使用,说明这种博弈的重要性。以下为各界例子:

  政治学例子:军备竞赛

  在政治学中,两国之间的军备竞赛可以用囚徒困境来描述。两国都可以声称有两种选择:增加军备(背叛)、或是达成削减武器协议(合作)。两国都无法肯定对方会遵守协议,因此两国最终会倾向增加军备。似乎自相矛盾的是,虽然增加军备会是两国的“理性”行为,但结果却显得“非理性”(例如会对经济造成都有损坏等)。这可视作遏制理论的推论,就是以强大的军事力量来遏制对方的进攻,以达到和平。

  经济学例子:关税战

  两个国家,在关税上可以有以两个选择:

  提高关税,以保护自己的商品。(背叛)

  与对方达成关税协定,降低关税以利各自商品流通。(合作)

  当一国因某些因素不遵守关税协定,独自提高关税(背叛),另一国也会作出同样反应(亦背叛),这就引发了关税战,两国的商品失去了对方的市场,对本身经济也造成损害(共同背叛的结果)。然后二国又重新达成关税协定。(重复博弈的结果是将发现共同合作利益最大。)

  商业例子:广告战

  商业活动中亦会出现各种囚徒困境例子。以广告竞争为例。

  两个公司互相竞争,二公司的广告互相影响,即一公司的广告较被顾客接受则会夺取对方的部分收入。但若二者同时期发出质量类似的广告,收入增加很少但成本增加。但若不提高广告质量,生意又会被对方夺走。

  此二公司可以有二选择:

  互相达成协议,减少广告的开支。(合作)

  增加广告开支,设法提升广告的质量,压倒对方。(背叛)

  若二公司不信任对方,无法合作,背叛成为支配性策略时,二公司将陷入广告战,而广告成本的增加损害了二公司的收益,这就是陷入囚徒困境。在现实中,要二互相竞争的公司达成合作协议是较为困难的,多数都会陷入囚徒困境中。

  自行车赛例子

  自行车赛事的比赛策略也是一种博弈,而其结果可用囚徒困境的研究成果解释。例如每年都举办的环法自由车赛中有以下情况:选手们在到终点前的路程常以大队伍(英文:Peloton)方式前进,他们采取这策略是为了令自己不至于太落后,又出力适中。而最前方的选手在迎风时是最费力的,所以选择在前方是最差的策略。通常会发生这样的情况,大家起先都不愿意向前(共同背叛),这使得全体速度很慢,而后通常会有二或多位选手骑到前面,然后一段时间内互相交换最前方位置,以分担风的阻力(共同合作),使得全体的速度有所提升,而这时如果前方的其中一人试图一直保持前方位置(背叛),其他选手以及大队伍就会赶上(共同背叛)。而通常的情况是,在最前面次数最多的选手(合作)通常会到最后被落后的选手赶上(背叛),因为后面的选手骑在前面选手的冲流之中,比较不费力。

第8题:

囚徒困境反映了:()与()。


参考答案:个人理性;集体非理性冲突

第9题:

试论述囚徒困境对于经济学的意义.


答案:
解析:
“囚徒困境”是博弈论的一个经典案例。它是著名经济学家塔克最早修改而提出来的一个例子。囚徒困境讲述的是这样一个故事:警察抓住两个偷窃的嫌疑犯,并分别把他们隔离在两个审讯室中进行审问。警察知道这两个人除此次人赃俱获的偷窃外,还犯有其他罪行,但缺乏足够的证据定罪。于是,警察想就此机会,让嫌疑犯彻底坦白其罪行,其方法是分别私下告诉每一个嫌疑犯如下的出路:如果只有他一人坦白而对方抵赖,那么,坦白者被释放,抵赖者被判9年徒刑;如果两人都坦白,各判5年;如果两人都抵赖,当然就只能以现有证据,各判2年。在这种情况下,每个嫌疑犯都只有“坦白”或“抵赖”两种策略选择,并面临着四种可能的结局,表10-2刻画了这两个嫌疑犯面对的博弈。 其中,每格前一个数字代表A的支付(即被判的刑期),后一个数字代表B的支付。这种博弈的结果将是:如果每个嫌疑犯都只是想使自己的利益最大化(即被判的刑期最短),而且无法影响对方的行为,那么,唯一可能的答案就是:两人都坦白交代,各自被判5年徒刑。因为在此案例中,当参与者力图使其损失最小化时,他就只能遵循“最小最大”的决策标准,即“最大损失中求取最小损失”的决策,参与者将选择那种能使可能的最大损失最小化的策略。对于囚犯A来说,最大损失中求取最小损失的策略是“坦白”,对B来说,同等的策略也是“坦白”,从而建立起一种策略均衡。在这种均衡中,“坦白”是他们每个人的超优策略。{图0} 其实在“囚徒困境”中,最好的结局是都“抵赖”,各判2年徒刑,但这是不可能的。因为不论是嫌疑犯A还是B,只要单独改取“坦白”的策略,就会由2年的徒刑改为释放,因而存在着偷换策略的诱感,处于不稳定的状态。在右上角如果B改取“坦白”的策略,刑期就可以从9年减为5年,因而也存在着偷换策略的诱惑,处于不稳定状态。同样的道理,左下角也处于不稳定状态。简言之,“抵赖”是一种劣策略。理性的参与者当然不会选择这种策略。 如果嫌疑犯在决定是否坦白之前可以交流信息,结果不会有差异。假设他们认识到警察已经发现他们的隐瞒之事,但他们在被抓之前有几分钟时间进行理性的讨论。嫌疑犯A-开始就指出,虽然每个人都有一个超优策略,但“坦白”会导致一个帕累托无效率的结果,所以,为什么不一致否认罪行呢?嫌疑犯B也有此思想,并同意这样做。但是两个小时后,他们最终会背叛同盟,坦白认罪,形成各判5年的结果。因为虽然有口头协议,但它却不具有约束力。每个囚徒都希望对方抵赖,自己坦白而释放。当他们都这样想并这么做时,就形成(坦白,坦白)的策略组合,(坦白,坦白)的策略组合是一个纳什均衡。 可以从上述讨论中得出一个重要的结论:超优策略均衡虽然是唯一可以预见到的结果,但这种策略组合却不一定是帕累托有效率的策略。在“囚徒困境”中,(坦白,坦白)是帕累托无效率的策略,因为每个人都被判5年徒刑,并不是博弈者共同的最优结果。他们共同的最优结果应该是各判2年,但却是无法实现的。于是,“囚徒困境”常常被经济学家作为一个经典案例来说明:自利的个人理性行为并没有导致一个社会的最佳结果,即个人理性与集体理性之间存在着深刻的冲突。 当然,在重复博弈中,囚徒困境可能会出现非合作性的共谋。尽管每个囚犯冒着被其他囚犯出卖的风险,但如果他选择不合作,就会失去获得长期合作收益的可能性,如果博弈重复的次数足够多,未来收益的损失就会超过短期被出卖的损失,因此,可能会出现参与者彼此合作的情况,采取帕累托有效的策略。

第10题:

囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。


正确答案:错误