本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
, Y2 @/ P! B3 T/ g- [4 r1 l; J* e' W, v$ }
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);4 L; L! Q$ z+ O5 h& P) k
以下三个定义:9 f) F9 y' N9 o
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 $ O/ f) Y. `; f, C2 N
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ! \# K) X% m2 d
所谓的双方优势策略则是指双方利益总和最大的策略。 3 e; i! |1 p, O4 x
[编辑本段]严格优势策略举例分析8 e3 `4 M& Q! M }5 a- A4 D4 W
一、经典的囚徒困境 2 L; W7 }! ~8 R0 T# n8 \4 O9 ~
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
( u! l' ?: I! C 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
7 N. e0 ?4 X& }, r! c& o( {- F 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 6 g0 d. D6 t8 m+ u0 ]; H1 Y+ Z% \% y
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
q. B# D5 z0 J* \ L 若二人都互相检举(互相“背叛”),则二人同样判监2年。 K. w6 z1 G& B8 u
9 A2 x' _4 Q% h" e- Z2 A+ U* Y
用表格概述如下: ]4 F. ^, Y- _: v; [
- a1 C$ \0 V8 ~$ Q* g
甲沉默(合作) 甲认罪(背叛)
. I! d$ v+ S) V1 n乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 b/ f( y, M) Y. d* T% o. A
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 4 ~& }" {! p7 _) [0 M! ^. z! p
x/ z% @7 N! j9 |8 j }& s* |/ f0 L 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
. M d4 p u6 F* W: u( @) j3 n 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 0 l/ ^, G( u- \- Y/ c8 [
若对方沉默、背叛会让我获释,所以会选择背叛。 $ t2 z! p8 P/ F+ M" ?# B9 Z8 t
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
/ w+ A4 W! T8 x* J0 i 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ( e" u7 y8 q! q
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
: A) {: }% D- Y 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。+ M7 a2 ^* Q8 ^/ Q3 I, s! H
[编辑本段]二、智猪博弈理论0 A- \5 c7 A9 x: h
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 " k U/ E# ]! n
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ; l; z! ?- N$ K' N+ o
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 " S7 Z7 }- W& s6 E2 s. ^4 D
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 7 \$ n, a' U$ i4 a1 `% U
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ) k8 p+ ~' A; J& a5 O# [
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
$ R% `0 B% g0 F+ X% C8 y 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
" t7 V) I: }- Z1 r5 U
( g0 I, H! F! i# G& q. E6 X* Y三、关于企业价格策略4 S- m% d* m0 S3 U2 \
0 C4 A& k5 c" k5 G1 s
) Z& q" N, T; L+ g 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 0 w8 q: _- V( \
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
3 O+ n8 a' [* b8 C q0 g" E 以下三个定义:. x0 g& D6 D' f v' i
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
: i5 i4 a8 \% y 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
% E }0 ~3 C, ?! [7 C. p 所谓的双方优势策略则是指双方利益总和最大的策略。
3 j8 b4 _5 G+ j: `! w7 ^7 G/ e7 H[编辑本段]严格优势策略举例分析
+ m' R1 T; I7 p' ~" D" o9 H6 J 一、经典的囚徒困境
) K$ ~" Q5 S5 ~ 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
: `5 n! ~9 I }, v9 f* D* G! J 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 9 R- A/ o( `& ^, S. x0 l3 w
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 : h# e- q+ j- \7 F! E2 l. @ B
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ( Q! l4 y& D6 \* A
若二人都互相检举(互相“背叛”),则二人同样判监2年。
, K, {, I Z5 ]/ @8 \ ' `' E/ L& t/ m. @6 y; x7 d
用表格概述如下:
, |7 s, c5 \; i$ z8 N7 p
1 ]* J" P9 a( M4 E1 k7 B. ?; Z 甲沉默(合作) 甲认罪(背叛)
" D1 ~9 k) a2 l; B# l0 F# K乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
' f9 X1 F) I* z8 v2 n乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
7 {5 Y" ~3 M& Y2 C2 D: j; R. O
2 F% \( S; ~* I* R! l 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
. W6 t1 p$ r" z& k2 s0 S+ [ 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
h# P# j& J! R& _7 L. c. } 若对方沉默、背叛会让我获释,所以会选择背叛。 f3 ?' }3 i o/ b* W) ]: r
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
$ y" @( T: l- M$ D- l 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 3 p* P. a- O" a& l1 K. Y
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 9 l$ M/ @6 w2 H' U
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
5 s" H) Y8 \! |* w0 Z3 { {& ^) X C# ^[编辑本段]二、智猪博弈理论8 v# \/ v; ~1 W0 k
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 5 L- v$ n, O) ]# u/ |
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
2 P$ x: M" t B5 {, J5 B' ? 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 : o: Y1 M0 X s* P/ j3 {: j
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
' V$ \7 z' U3 J2 j “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
4 s7 U/ k$ k3 M 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 / W, x4 n* P3 i& G' F
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
: i6 e! @9 ~: u) ^
& x+ \# x# N# b5 a z三、关于企业价格策略1 h* R [0 e3 u) G$ O
7 J; }, A8 f0 T3 \% U0 Q; r . s0 L/ V2 K0 |( ~6 V3 _8 K0 k
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
6 A9 B0 n! j' ]0 e9 b 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
! S6 h9 {% g$ @ 以下三个定义:5 i+ a" r. `: |+ S, k) E' {; q
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
- X' z: ~/ ?/ V6 R& a: L 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
4 b6 w2 u! y; y/ [( r3 C 所谓的双方优势策略则是指双方利益总和最大的策略。 ( M* U" g- u& ]; l! I: L/ c
[编辑本段]严格优势策略举例分析 ~9 H8 V9 E% u* R! _. c& C
一、经典的囚徒困境 " g" Q$ Y3 p, n7 o- @
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 2 O3 J2 y0 a5 ?6 W* i: X' h
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
_8 H& }' a! w5 r" i! ^9 k9 k 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 6 ]5 u& _# _2 Y1 j- U$ \
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 , A8 e. H! R" K/ B) ]
若二人都互相检举(互相“背叛”),则二人同样判监2年。
1 H. s* E3 c9 [4 z* o 7 M6 R2 z, A. a4 i
用表格概述如下:8 a+ ^& D2 J7 I4 }2 d% n* }
0 s4 \/ Y1 u @ _/ {
甲沉默(合作) 甲认罪(背叛) 8 k9 ]& k R: E( E! S
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 6 X' r8 i; U; }7 G' B; Q0 ?, D( q! }
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 ! \ _" j1 G2 m; C% Y
; M+ M, `: `2 |
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
9 ^) R' [4 [6 h 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
; e( t1 p2 e, P9 n$ m" a& f+ e 若对方沉默、背叛会让我获释,所以会选择背叛。
1 c2 b! ~- G# ?' @7 v 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
% W! o3 H* x7 S+ O 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ! N" N2 p$ z* N4 v8 b
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
! F% L& y @$ {7 U" \ 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。5 n! [8 I, W$ J8 c" r
[编辑本段]二、智猪博弈理论! p# p. w ?0 V6 o
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
' M1 v! P$ r9 R4 l# [ 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
& M" i: \2 G9 k9 U8 v6 W1 N7 u( O7 k 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 ( l0 b" ]9 q2 u' Z7 L
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
2 K# [# _0 g* X/ e; b. w9 X& m& y$ S “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 % s2 X5 n. U: t9 Y, E# {2 Y
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
9 H& p9 J: ?& p5 S# J 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。0 h7 P0 K; z% F' y' m9 {$ _: i
7 V) j6 k9 m9 J% ~9 D三、关于企业价格策略$ Y/ K; g! W6 p+ R+ j# ]
& J) J9 K) e/ J& T, j. P% {. J
- x& _$ T" J+ n) m' \! q$ J% |
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
9 L, Q. U: B6 v- R 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);! ?4 u+ Q5 @$ x7 x3 b2 i# n
以下三个定义:
7 v M1 G8 f" o5 } p 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 " E: O: ?9 e) |1 X( m0 q. p
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
, J- G4 I+ _( E7 D 所谓的双方优势策略则是指双方利益总和最大的策略。 ( Q* X- e6 u$ F3 n- W
[编辑本段]严格优势策略举例分析. a9 ?: E$ Q& F, L- V: Y
一、经典的囚徒困境
4 B3 r; i' Y% C3 ^' {* b( S* D 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
% e% G( v- ?+ ~7 v1 X* F3 @ 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
6 z/ U# A4 B5 O& W 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 * [ y+ A% g# w) j9 c# e' w
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
+ u6 C+ b5 G! T/ @8 t, J5 {# \, F 若二人都互相检举(互相“背叛”),则二人同样判监2年。$ y* h; x- n* D2 V- v
: N5 L* q8 |0 b" a- N6 }4 s用表格概述如下:
4 ~3 {* _& B. ~3 }4 q+ `; I8 i q. B# \& N
甲沉默(合作) 甲认罪(背叛) + G( R k4 g# P% x
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
' w g Y0 \0 @4 {* C乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 ) x# N4 I a. q& E+ \4 G1 _4 i* s# i1 h
& i6 c% ]: f' Z$ b a 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
8 p$ L# j7 R$ V: f0 f& j& F 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: & T! p$ K/ L5 C9 n+ A; t+ R6 j, P
若对方沉默、背叛会让我获释,所以会选择背叛。
4 z I$ d) F5 R; | 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
7 N2 x+ i- w5 w3 B4 Y# f7 Z 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
9 B! l4 Q# ?, I4 b9 C3 y 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
) V2 B; W& h* G0 ~+ F# Y5 u 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
' e1 S) p' {$ O8 v( \5 \5 `[编辑本段]二、智猪博弈理论; |6 C" e8 c3 I$ u
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 " R# Y2 ^- x7 o! b6 c$ ?
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 % q# ]$ U6 ]# M( [& h9 {, `0 g
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 2 n; a8 ` d4 v' u% ]& z
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ! b- U3 u/ D8 q8 {: T% q
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ; ~0 p( z0 l5 m" ~8 Q- {4 C
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
& c+ G) w Q5 |: _) }3 G4 H3 o0 R6 ^ 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。3 P& h' w/ K1 o+ {& e) o
. c- m( Q( F; R- O* p8 C8 }7 {8 E
三、关于企业价格策略* p! K" ]; k" s. a6 F% N8 g
. B# V, @! T% |. h+ a7 U ' _/ t3 N# z% |- @
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
. H* K& W: n- p4 O% V 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |