《博弈生存》

下载本书

添加书签

博弈生存- 第2部分


按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
战争一触即发。

博弈案例(2)
面对美国的反应,苏联面临着是将导弹撤回国还是坚持部署在古巴的选择?而对于美国,则面临着是挑起战争还是容忍苏联的挑衅行为的选择?也就是说,这两只“大公鸡”均在考虑采取进的策略还是退的策略?

战争的结果当然是两败俱伤,而任何一方退下来(而对方不退)则是不光彩的事。结果是苏联将导弹从古巴撤了下来,做了丢面子的“撤退的鸡”。美国坚持了自己的策略,做了  
“不退的鸡”。当然,为了给苏联一点面子,同时也担心苏联坚持不退而发生美苏战争——这是美国不愿意看到的,美国象征性地从土耳其撤离了一些导弹。古巴导弹危机是冷战期间美苏两霸之间发生的最严重的一次危机。

这就是美国与苏联在古巴导弹上的博弈结果。对于苏联来说,退下来的结果是丢了面子,但总比战争要好;对美国而言,既保全了面子,又没有发生战争。这就是这两只“大公鸡”博弈的结果。3.骑虎难下博弈与美苏武器竞赛

我们经常碰到的一类博弈是,行动者进也不是,退也不是。笔者将这样的博弈称为骑虎难下博弈。

有一个拍卖,其规则是:轮流出价,谁出得最高,谁就将得到该物品,但是出价少的人不仅得不到该物品,并且要按他所叫的价付给拍卖方。

假定有两人竞价争夺价值100元的物品,只要双方开始叫价,在这个博弈中双方就进入了骑虎难下的状态。因为,每个人都这样想,如果我退出,我将失去我出的钱,若不退出,我将有可能得到这价值100元的物品,但是,随着出价的增加,他的损失也可能越大。每个人面临着两难:是继续叫价还是退出?

你会说,这个拍卖的规则不合理,在实际中这样的拍卖不会出现。当然这只是一个模型,但我们经常会看到此类型的博弈案例。这个博弈有一个纳付均衡:第一个出价人叫出100元的竞标价,另外一个人不出价(因为在对方叫出100元的价格后,他继续叫价将是不理性的),出价100元的参与人得到该物品。

在冷战期间,美苏为争夺霸权拼命发展武器,无论是原子弹、氢弹等核武器的研制,还是如隐形战斗机这样的常规武器的研制,双方均不甘落后。20世纪80年代,里根在位时准备启动“星球大战”计划,此举意味着两个超级大国的武器竞赛将进一步升级。美苏之间的武器竞赛就相当于拍卖中轮番出价,双方均不断出更高的价,如果一方没有出最高的价钱,退了下来,即没有继续竞赛下去,那么意味着它在军备上的投入没有效果,而对方将赢得整个局面。但如果继续竞赛下去,一旦支撑不住,损失也就越大。

1991年苏联的垮台在一定程度上是军备竞赛的结果。苏联将整个力量放在军备竞赛上,而民用建设无法跟上,国力不济,最终退下阵来。里根的“星球大战”计划其目的就是要拖垮苏联。

一旦进入骑虎难下的博弈,及早退出是明智之举,然而当局者往往做不到,这就是所谓当局者迷。这种骑虎难下的博弈经常出现在国家之间,也出现在企业或组织之间,当然个人之间也经常碰到。20世纪60年代,美国介入越南就是一个骑虎难下博弈。赌红了眼的赌徒输了钱还要继续赌下去以希望返本,也是骑虎难下博弈,其实,赌徒进入赌场开始赌博时,他已经进入了骑虎难下的状态,因为,赌场从概率上讲是肯定赢的。从理论上讲,赌徒与赌场之间的博弈如果是多次的,那么赌徒肯定输的,因为赌徒的“资源”与赌场的“资源”相比实在太小了。如果你的资源与赌场的资源相比很大,那么赌场有可能输的;如果你的资源无限大,只要赌徒有非0的赢的可能性,那么赌徒肯定会赢的。因此,像葡京这样的赌场要设定赌博数额的限制。

博弈论专家将这里的骑虎难下博弈称为协和谬误。20世纪60年代,英国和法国政府联合投资开发大型超音速客机,即协和飞机。该种飞机机身大、设计豪华并且速度快。但是,英法政府发现:继续投资开发这样的机型,花费会急剧增加,但是这样的设计定位能否适应市场还不知道;而停止研制将使以前的投资付诸东流。随着研制工作的深入,他们更是无法作出停止研制工作的决定。协和飞机最终研制成功,但因飞机的缺陷(如耗油大、噪音大、污染严重等等),它不适合市场,最终被市场淘汰,英法政府为此蒙受很大的损失。在这个研制过程中,如果英法政府能及早放弃飞机的开发工作,会使损失减少,但他们没能做到。

4.警察与小偷的故事——混合策略问题

纳什在《n人博弈的均衡点》这篇论文中,给出了均衡存在的简单证明,纳什说,在n个人的博弈中至少存在着一个均衡,在这点上双方均不愿意先改变策略。这里的均衡点有可能是混合策略点。人们称它为纳什定理。

什么是混合策略?

警察部门负责一城市中某一区的治安。警察要对该区的A、B两地进行巡逻。假定该区有一群小偷,要实施偷盗。警察要防止小偷的偷盗,但因为设备有限,只有一部警车,因此,警察只能一次在一个地方巡逻。而对于小偷而言,他们也只能去一个地方。假定A地需要保护的财产价值为2万元,B地的财产价值为1万元。若警察在某地进行巡逻,而小偷也选择了去该地,因警察在场,小偷无法偷盗该地的财物;若警察没有去某地巡逻而小偷选择了去该地,则小偷偷盗成功。警察怎么巡逻才能使效果最好?

博弈案例(3)
一个明显的做法是,警察对A地进行巡逻,小偷去B地,这样,警察可以保住2万元的财产不被偷窃,小偷的收益为1万元。但是这种做法是警察的最好做法吗?有没有对这种策略改进的措施?

我们可以将警察与小偷之间的这个支付写成如下的支付矩阵。警察巡逻某地,偷盗者在该地无法实施偷盗,假定此时小偷的得益为0(没有收益),此时警察的得益为3(保住3万元)。  

这个博弈也是常和博弈,它没有纯策略纳什均衡点,而有混合策略均衡点。这个混合策略均衡点下的策略选择是每个参与者的最优(混合)策略选择。

由此可见:纯策略是参与者一次性选取的,并且坚持他选取的策略;而混合策略是参与者在各种备选策略中采取随机选取的。在博弈中,参与者可以改变他的策略,而使得他的策略选取满足一定的概率。

当博弈是零和博弈与常和博弈时,即一方所得是另外一方的所失时,此时只有混合策略均衡。对于任何一方来说,此时不可能有纯策略的占优策略。

5《三国演义》中的空城计与信息不对称的博弈

如果我们用博弈论的眼光看《三国演义》,三国演义完全是一部记载着许多博弈案例的著作。当然,罗贯中不可能用“博弈”一词。如果我们用一词来概括《三国演义》,这个词就是“计”。计,即计策或策略也。用计,即用策略赢对方。用计算敌,不仅要自己选择恰当的计策,而且要算准对方用什么计策,这不就是博弈?现在让我们看《三国演义》中著名的空城计博弈。

诸葛亮误用马谡,致使街亭失守。司马懿引大军十五万蜂拥而来。当时孔明身边别无大将,只有一班文官,五千军士,已分一半先运粮草去了,只剩二千五百军士在城中。众官听得这个消息,尽皆失色。孔明登城望之,果然尘土冲天,魏兵分两路杀来。孔明传令众将旌旗尽皆藏匿,诸军各收城铺。打开城门,每一门用二十军士,扮作百姓,洒扫街道。而孔明乃披鹤氅,戴纶巾,引二小童携琴一张,于城上敌楼前凭栏而坐,焚香操琴。司马懿自飞马上远远望之,见诸葛亮焚香操琴,笑容可掬。司马懿顿然怀疑其中有诈,立即叫后军作前军,前军作后军,急速退去。司马懿之子司马昭问:“莫非诸葛亮无军,故作此态,父亲何故便退兵?”司马懿说:“亮平生谨慎,不曾弄险。今大开城门,必有埋伏。我兵若进,中其计也。”孔明见魏军退去,抚掌而笑,众官无不骇然。诸葛亮说,司马懿“料吾生平谨慎,必不弄险;见如此模样,疑有伏兵,所以退去。吾非行险,盖因不得已而用之”,我兵只有二千五百,若弃城而去,必为之所擒。

这就是为后人广为传颂的空城计。这是一个信息不对称的博弈。

这里,司马懿不知道自己和对方在不同行动策略下的支付,而诸葛亮是知道的,他们对博弈结构的了解是不对称的,诸葛亮拥有比司马懿更多的信息,当然有。这种信息的不对称完全是诸葛亮“制造出来的”。因此这是一个信息不对称的博弈。

在这里,孔明可以选择的策略是“弃城”或“守城”。无论是“弃”还是“守”,只要司马懿明确知道他自己的支付,那么孔明均要被其所擒。孔明惟一的办法就是不让司马懿知道他自己的策略结果。他的空城计是降低司马懿进攻的可能收益,使得司马懿认为,后退比进攻要好。

司马懿孔明进攻后退守城(被擒,大胜)(逃脱,不胜不败)弃城(被擒,大胜)(逃脱,不胜不败)

在信息不充分的情况下,博弈参与者不是使自己的支付或效用最大,而是使自己的“期望支付(或效用)”最大。比如:如果让你在“有50%的可能获得100元”与“有10%的可能获得200元”两者之间进行选择,你当然选前者,因为前者的“期望所得”为:50%×10050元,而后者为:10%×200元20元。理性的人是选择前者的。

在孔明—司马懿的博弈中,孔明了解双方的局势,制造空城假象的目的就是让司马懿感到进攻有较大的失败的可能。如果我们用概率论的术语来说,诸葛亮的做法是加大司马懿对进攻失败的主观概率。此时,在司马懿看来,进攻失败的可能性较大,而退兵的期望效用大于进攻的期望效用。即:司马懿认为进攻的期望效用低于退兵的效用。诸葛亮惟有通过这个办法,才能让司马懿退兵。

司马懿想,诸葛亮一生谨慎,不做险事,只有设定埋伏才可能如此镇定自若,焚香操琴。此时,司马懿觉得“退”比“进攻”更合理,或者说期望效用更大。于是后军变前军,前军变后军,后退而去。结果是诸葛亮得以逃脱。

司马懿对局势的判断不是没有道理的,他对诸葛亮的判断是基于以前的认识,这就是“归纳法”,我们会在第六章中讨论归纳法在博弈中的作用及其局限。

空城计博弈是不完全信息博弈,我们说过《三国演义》是一本博弈实战教材,在该书中有完全信息博弈实例吗?当然,曹操与诸葛亮的华容道博弈就是一个完全信息博弈。

曹操亲领八十万大军进攻东吴,孙权和刘备联合破曹,曹军大败。曹操引兵而逃。经过一路厮杀,来到一处,军士报:前方有两条道路,请问丞相走哪条路?曹操问:哪条路近?军士说:大路稍平,却远五十余里。小路投华容道,却近五十多里。曹操令人上山观望,回报:小路山边有数处狼烟,大路并无动静。曹操叫走华容道。诸将问:烽烟起处必有军马,何故反走这条路?曹操说:岂不闻兵书有云:“实则虚之,虚则实之”。诸葛亮多谋,故使人于山僻放烟,使我军不敢从这条路走,他却伏兵于大路等着。吾已料定,偏不教中他计。诸将皆曰:丞相妙算,人不可及。遂曹兵走华容道。但关羽依着诸葛亮的妙计在华容道等着曹操,于是关羽上演了一场“只为当初恩义重,放开金锁走蛟龙”的捉放曹的义举。逃过华容道大难,曹操只剩二十七骑!

博弈案例(4)
在曹操与诸葛亮之间的这一华容道博弈中,曹操的策略是在走华容道还是走大路之间进行选择,而诸葛亮派关羽埋伏时,要在埋伏在大路还是埋伏在通往华容道的小路之间进行选择。

华容道博弈曹操诸葛亮华容道大路——0。1华容道(捉住曹操,被捉)(白等,逃脱)大路(白等,逃脱)(捉住曹操,被捉)

 
这个博弈如同猜硬币的游戏一样,是一“零和博弈”所谓“零和博弈”是指双方的得益之和为一常数零,一方所得增加,另一方所得便减少。而“变和博弈”是指博弈双方的所得之和为一变数。,它没有纳什均衡点。双方对博弈有完全的信息,各种策略下的博弈支付是公共知识——我们下一章将说明什么是公共知识。但双方无法知道对方的策略选择,而只能进行猜测。曹操要选择走诸葛亮的军队不在的路,这是他的最优的结果。而诸葛亮的最优结果是埋伏在曹操要走的路上。

诸葛亮制造埋伏在大路的假象,其实则派关羽埋伏在小路。这里关键是谁能真正猜到对方的策略,谁就是赢家。诸葛亮胜曹操一筹。这个博弈不存在纯策略纳什均衡点,博弈结果是:曹操选择了走华容道,结果被抓;关羽在华容道守候,抓住了曹操。

公共知识与博弈
博弈专家们发现在博弈中存在着公共知识的问题。让我们来看一下什么是公共知识。

要弄清什么是公共知识,首先要弄清什么是知识。

所谓知识是人对真的信念。知识是人们对自然中某个事实的认识,我们说某人拥有某种知识,意指某人知道某个事实。“地球绕着太阳转”是个事实,但哥白尼之前的人们并不知  
道这个事实,而今天这个事实已几乎被所有人熟知,并且人们相信这个事实,于是“地球绕着太阳转”构成人们的知识。因此知识涉及三个因素:

第一,人们了解的事实对象要是真的,假的事实不能成为知识。人们可能相信虚假的东西,但它们不能构成相信它们的人的知识。在偏僻的乡村,人们相信,人的病是由鬼怪引起的,巫婆通过某些迷信活动能够驱除鬼怪从而达到治病的目的,这当然只是错误的信念,而不是知识。再比如:在古代,中国人认为雷电是由掌管雷电的雷公行云布雨的结果,这当然也不是真的事实。假的信念有时对信念拥有者有一定的效果,但不构成相信者的知识。

第二,某个人要知道这个真的事实。许多存在着的真的事实我们并不知道,它们并不能构成我们(人类)的知识。我们常说知识如大海一样,我们知道的只是知识海洋中的一滴水。我们不知道的东西太多了。

第三,人们要相信他所知道的事实。如果他不相信某些事实,尽管他知道,也不构成他的知识。哥白尼提出地球围绕太阳转的日心说观点,那时许多人知道了这个事实,但并不相信,因此“日心说”就不能构成他们的知识。

逻辑学家研究人的“知道”的结构,他们发现,当某人知道某个事实时,这意味着:他知道他知道该事实,他知道他知道他知道该事实……这是一个无穷的过程。将这个结构推广到某一人群就构成公共知识的概念。

公共知识这个概念最初由逻辑学家刘易斯提出,之后由经济学家阿曼等用于博弈分析。公共知识是一个群体人们之间的对某个事实“知道”的关系。

假定一个人群由A、B两个人构成,A、B均知道一件事实f,f是A、B的知识,但此时f还不是他们的公共知识。当A、B双方均知道对方知道f,并且他们各自都知道对方知道自己知道f……此时我们说,f成了A、B间的公共知识。

这个人群是由两个人组成,如果由多人组成,这不仅指任意两个人这样一个双方“知道”的过程,而且指,其中任何一个人知道其他人知道其他人知道……事实f。

因此,公共知识涉及一群体的对某
小提示:按 回车 [Enter] 键 返回书目,按 ← 键 返回上一页, 按 → 键 进入下一页。 赞一下 添加书签加入书架