人的一生总要面对很多选择,而且在很多时候你都会面临那种让你进退两难的的抉择。到底何去何从,囚徒困境的博弈虽不能给你带来一个明确的答复,但是却能使你通过这种两难的抉择,引发一种种深深的思考。因为,背叛与合作并不只是道德与良知的核心,更是利益的化身。
如果你对博弈论有所了解就会知道,“囚徒困境”是其中最为著名的案例模型之一。甚至可以说,“囚徒困境”是博弈论中必须谈及的一个题目。
这个经典的模型是由美国数学家塔克最先提出的。1950年,原本出任普林斯顿大学教授的塔克应邀来到斯坦福大学数学系担任客座教授,其间一些心理学家对于塔克研究的博弈论很感兴趣,并要求他以此为主题作一次演讲。塔克教授用了2个囚犯的故事,将博弈论的问题作了形象化的解释,从此以后类似的博弈问题也便有了一个专门的名称——囚徒困境。下面就让我们来看看“囚徒困境”的故事。
有2个惯犯A和B,他们在一次作案中双双被捕,并且被分别关押在2个独立的房间里进行审讯,客观条件使得他们之间不可能互通信息。警方了解到,此二人为惯犯,但是没有足够的证据对他们的犯罪过程进行指正,于是就向他们宣布了“坦白从宽,抗拒从严”的政策:如果A和B对过去的罪行都坦白交待,二人将被各判10年刑期;如果其中一人坦白而另一人抵赖,那么坦白的人将被无罪释放,而抵赖的人将被判罚15年徒刑;如果2人都抵赖,2人将被判罚服刑1年。
AB
抵赖
坦白
抵赖
1年1年
15年无罪释放
坦白
无罪释放15年
10年10年
从表面上看,A和B应该互相合作,共同保持沉默,因为这样他们就都能获得最好的结果——被判1年徒刑。但事实却并非如此,因为他们不得不考虑对方可能采取的选择。问题就这样出现了。
以A为例,他知道如果自己拒绝与警方合作,而B主动向警方坦白他们过去的罪行,结果就是B会全身而退,而A自己将承担所有罪责,自己留在监狱15年;而如果B不招供,A自己招供,结果就是A自己可以马上获得自由;即使是B与A同时招供,结果也要比15年要好很多。所以,对于A来说,招供就是最佳选择。
同样的逻辑也适用于B。结果,整个博弈的结果就是,2人都从利于自身的角度出发,选择了招供,最终2人都被判罚10年徒刑。
从旁观者的角度,我们可以发现2人都坦白的这个结果并非最好。如果A和B都选择隐瞒真相,则结果就是2人被判入狱1年,显然这个结果要比各自判刑10年好得多。其实,也就是为什么将这个现场称之为“囚徒困境”的原因。所谓的困境就在于,A和B都从各自的角度出发,考虑自身利益的最大化,因而采取各自的最优策略,但这个基于个人理性选择的结果往往适得其反,也就是说,个体利益最优的总和未必就是整体利益的最优。
在囚徒困境中存在唯一的纳什均衡点,即两个囚犯均选择“招认”,这是唯一稳定的结果。需要强调的是:均衡不一定是博弈的最优结果。在“囚徒困境”中,唯一的均衡是一起招认,站在群体的角度,这是最坏的结果。均衡只是博弈的最“稳定”结果,或者说是最可能出现的结果。那么,这就需要我们思考一个问题:如果这个“稳定”的效果不佳,我们能否找到合理的策略打破这个“均衡”?
合作还是背叛
“囚徒困境”是一个具有普遍意义而有趣的博弈论,可以说是理性的人类社会活动最形象的比喻。它准确地抓住了人性的不信任和需要相互防范这种真实的一面。从个体的角度来说,背叛是最好的选择,但双方背叛会导致不甚理想的结果。
与囚徒困境相似的经典博弈案例是哈佛大学巴罗教授提出的“旅行者困境”:
两个旅行者从一个以出产细瓷花瓶著称的地方旅行回来,他们都买了花瓶。提取行李的时候,发现花瓶被摔坏了,于是他们向航空公司索赔。航空公司知道花瓶的价格大概在80~90元的价位浮动,但是不知道两位旅客买的时候的确切价格是多少。于是,航空公司请两位旅客在100元以内自己写下花瓶的价格。如果两人写的一样,航空公司将认为他们讲真话,就按照他们写的数额赔偿;如果两人写的不一样,航空公司就认定写得低的旅客讲的是真话,并且原则上照这个低的价格赔偿,同时,航空公司对讲真话的旅客奖励2元钱,对讲假话的旅客罚款2元。
就为了获取最大赔偿而言,本来甲乙双方最好的策略,就是都写100元,这样两人都能够获赔100元。可是甲很聪明,他想:如果我少写1元,变成99元,而乙会写100元,这样我将得到101元。何乐而不为?所以他准备写99元。可是乙更加聪明,他猜测到甲要算计自己,写99元,于是自己便准备写98元。而甲也预料到了乙将采取的措施,估计到乙要准备写98元来坑他,于是他准备写97元……大家知道,下象棋的时候,不是说要多“看”几步吗,“看”得越远,胜算越大。你多看两步,我比你更强多看三步,你多看四步,我比你更老谋深算多看五步。在花瓶索赔的例子中,如果两个人都“彻底理性”,都能看透十几步甚至几十步上百步,那么上面那样“精明比赛”的结果,最后落到每个人都只写一两元的地步。事实上,在彻底理性的假设之下,这个博弈唯一的纳什均衡,是两人都写0元。巴罗教授提出这个案例旨在警世:一方面,它启示人们在为私利考虑的时候不要太“精明”,告诫人们精明不等于高明,太精明往往会坏事;另一方面,它对于理性行为假设的适用性提出了警告。
有了这个假设,我们就可以按照这个明确的比较取舍标准来推理,但是推断出来的结论是否符合实际,依赖于应用“理性行为”假设的程度。如果你的论证像“旅行者困境”那样,假设当事人彻底理性,能够算计到十几步甚至几十步,那么你推论出的结果,未必符合现实。大家知道,理性行为假设是基本假设。所以在理性行为假设之下得到的结论是否符合实际,还要进行另外的分析。在这个意义上,“旅行者困境”是所有研究博弈论的人所共同面对的困境。
这个事例比囚徒困境更深刻地揭示了人类自私自利的本性。处于这种困境下,各方都不知道别人的选择,因而只能猜测每个人都是理性的人,从自己的利益出发去作出选择。他们与困境的博弈,是一种不可逆转的关系,即他们无法通过自己的力量去左右局势,只能在困境的局势下想办法尽可能让自己的损失最小,获益最大。
2008年,国内某款免费网游暴出玩家因发现自己的账号被人买赃而引发的纠纷案件。玩家在网吧中因为账号被盗而懊恼不已,正准备离开时,无意中发现自己丢失的账号正在和邻座的一个玩家交易,而且价格极低,由于无法查清是谁偷盗了自己的账号,两人便发生了纠纷冲突,事后,该玩家便以买赃为由,委托律师给此人发了一张律师函,意欲取回自己的装备。
网络游戏不同于现实生活,更缺乏约束机制,网游买赃就如同现实生活中的自行车赃车一样,我们周围相当多的自行车都属于没有牌照、来历不明的赃车,这种知赃买赃的做法,助长了网游盗号的蔓延。
其实,买赃的玩家所面临的就是一个“囚徒困境”。面对是否买赃,玩家十分类似面对是否坦白的囚徒。“买一次来历不明的游戏装备”尽管比“正规途径炼造的装备”成本低,但如果大家都买赃,却提供了庞大的买赃需求,刺激了盗号现象的增多,游戏装备又很快丢失。结果,“反复买装备”的成本很快超过了“正规途径炼造的装备”的成本。但是你又无法拒绝买赃,因为在别人都买赃的情况下,你拒绝买赃将会使你的损失最大化:你不得不付出“反复买赃”的成本。
由此可以看出,如果缺乏约束机制,每个人都将试图通过违规来获利,并且希望最好是别人都不买赃而只有自己买,这样自己就可通过最低的成本在游戏中傲视群雄。但大家博弈的结果是人人都买赃,人人都付出了较高的成本。而如果大家合作,都拒绝买赃,则都可以用较低的成本纵横网游之间。
这不由使我们想起“囚徒困境”中有一对发人深省的矛盾体,合作与背叛。俗话说:“旁观者清”,当你站在旁观者的角度,你可以清楚地看到合作所带来的收益,可是如果你身处“囚徒困境”之中,你又是如何选择的呢?
曾有一位教授组织他们班里的27个同学进行了一场别开生面的博弈游戏,这个博弈游戏就给这些同学们带入到了“囚徒困境”之中。
教授假设每一个同学都有一家属于自己的企业,现在每个同学在面对企业的发展过程之中都必须面临选择:⑴生产高质量的商品来帮助维持现在较高的价格;⑵生产假货来通过别人的所失换取自己的所得。选择可以根据自己的意愿执行,但是选择⑴的同学必须将自己的收入分给每个同学。
事实上,这是一个早已经设计好的博弈之局。每一个选择⑵的同学都会比选择⑴的学生多得到额外地一部分钱,很显然,对于个体而言,选择⑵就是一个最优选择。但是对于整体而言选择⑵会使得整体的收益降低。
游戏的结果十分糟糕,大部分人都选择了⑵。在这个博弈的过程之中,起初是不允许进行集体讨论的,可是之后条件放宽,可以集思广益。每个人都希望能有更多的人去选择⑴,而自己选择⑵,这样就会使自己的收益达到最大。讨论之后,愿意合作而选择⑴的学生数目有所增加,可是整体收益仍然是惨不忍睹。最后一次,全班同学经过协议后继续博弈,结果选择⑴的学生人数仅为4人。一位负责与大家协商的同学抱怨:“我这辈子再也不相信任何人了!”可是事实上,他虽然组织了协商的这个过程,号召大家都选⑴,可是最后他的选择却是⑵。
如果我们把“囚徒困境”的模型引入到生活之中,最能够说明问题的就是合作与背叛。囚徒困境准确地抓住了人性中的猜疑以及互相防范的真实一面,上述的例子可以说明对你而言最好的结果就是别人所采取的策略是合作,而你的最优选择是背叛,但这种选择出现的可能性几乎不存在。
如果有2个博弈,它们都属于囚徒困境的博弈。在这2个博弈中,假设双方都选择背叛可以各得5分,都选择合作可以各得10分。那么,双方所最希望看到的结局就是彼此都选择合作,而非背叛。当一方背叛了对手的时候,背叛与合作的差异就会显现出来,假设你选择背叛而对方选择合作之时,背叛的结果会对你更加的有利,因此这也就是为什么上述例子中,那位同学想要说服别人选择合作,却自己选择背叛的原因。如果你确信有人不久之后将会背叛你,那么你所应该做的就不会改变他的态度,因为他随时可以基于自己的利益而对你做出背叛的行为,与其这样,不如你先背叛他们。这也就是为什么上述例子中,那位同学最终遭到别人背叛的原因。
在现实生活中,我们可以遇到很多囚徒困境的例子,比如说,报纸上经常会报道的某会计师因为做假账被捕入狱。
会计师的职责就是担任公司和股东之间的仲裁者,理论上讲,这些会计师应该保证公司诚实地公开其商业活动,这样,股东才能在投资方面作出明智的决定。可是,会计师都是受雇于一个公司。所以他们一定会左右为难。会计师在道德上有义务确保公布的报表内容准确无误,但又希望对他们所审计的公司伸出援手,以取得它们的信任。
一旦有少数会计师不诚实,囚徒困境就可能使诚实的会计人员丢掉工作。假设在某个世界里,所有的会计师都很诚实,你是其中一员并且正在争取一笔审计的业务。如果你答应稍微帮助一下某家潜在客户,这样做是不是不好呢?毕竟会计准则本来就有一些不明确,因此,如果你能获得这一业务,你何不保证利用这些不明确为客户谋利?