本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 # C7 H: ~" v% c8 Z- c) t
+ p: [9 v; N) z/ a严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
# h; h' J9 t' D6 u 以下三个定义:
# q/ R3 b3 c$ m& o- F 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
' w& u+ j4 d* R 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
# R1 y: j* P- P- `# K; a" h& P4 c' a 所谓的双方优势策略则是指双方利益总和最大的策略。 4 n& O; T3 `: [4 J s+ b" b1 o
[编辑本段]严格优势策略举例分析! l2 c/ w8 E, o$ V6 Y3 s5 ]' t
一、经典的囚徒困境 / Y+ G5 \# ]% Z, N. A9 V6 v
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: , |6 ~0 A; L: n" P0 H, { s
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
6 i/ J. J; n% J/ ^; h( J r* D 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
p' t! H' B* e' f3 j 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
/ @# a. O- S3 w+ g" R 若二人都互相检举(互相“背叛”),则二人同样判监2年。
2 n8 ~5 ]& b: z' g$ n. Q$ G& l$ Z3 c K
+ I* d& f7 U4 s7 m: Y用表格概述如下:: I) E @% m3 p n I! b, t; T
$ K0 Q4 O) [, Z6 o' s 甲沉默(合作) 甲认罪(背叛)
9 ?' c8 Z/ ?( D: B ~乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
' s2 m, b4 | F1 k8 G( H! f乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 - A/ |0 S3 _) P( Y/ Z* d2 b
/ L( F4 V. F; n, s8 t/ B2 ~
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ) F$ T2 W- O0 s- c+ S3 i9 B
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: / P! b' f0 j/ ^2 k5 c* a4 B0 o
若对方沉默、背叛会让我获释,所以会选择背叛。
4 F9 ?1 Y- \% C4 ]0 }# J) ?$ R 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
$ ~% b1 p. S: S4 Q1 c7 G$ U 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 : G2 `, P* K3 p% ^7 N
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
7 l. P; h1 ~! D 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
& i/ q5 z/ w9 V( \; N1 o[编辑本段]二、智猪博弈理论
" p" p1 ~+ ^$ J4 q& c$ w5 l7 ` 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
0 ]: C; ~: g! F, H! [& ^: _) D& I 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
* N7 i8 A. e% f 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 , }3 k$ c$ z( j2 N
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
' z1 u3 z: N: g( g( V “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
7 R4 q% H5 R$ C7 [8 h5 a 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 2 A5 R; @- x6 h5 S( \$ w1 Y
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
* s) q. t+ Q. a) o 2 \5 B, T2 [/ Z4 Z/ g) P
三、关于企业价格策略: l/ Z7 B; }8 O6 k
% h5 P' Q! r) e9 s+ e. x% o
1 l6 @6 y3 G# V" P 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ! e. N5 q1 C1 ~" H
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
- _* j0 t7 }' m 以下三个定义:) \7 Q$ `- O h; r* u$ z
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 1 N1 x% q& k; J& r7 L: B' V
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
- @& {! ]! C" i$ i; x8 _2 h 所谓的双方优势策略则是指双方利益总和最大的策略。 - K' P% R% O' x, g0 d$ u* S9 H
[编辑本段]严格优势策略举例分析: x$ Y9 N z2 u( l6 W+ Z
一、经典的囚徒困境
# j9 Y. M" v, O( }9 M7 @0 W# f 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
C9 P$ u0 @3 I% b9 J# q& Z 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 4 n) X% ~1 G7 I+ P6 p1 Y( o
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
$ S8 R( _+ @, }# P 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
- D6 @( t4 _" s8 G& j& r* R 若二人都互相检举(互相“背叛”),则二人同样判监2年。3 @2 N* _! q* Q7 y" L
% ]7 T6 v( S& K) E5 c% Y3 m/ h用表格概述如下:* S* Z( c5 X3 y g# g
4 ]# q% p9 h( h1 ]- a+ L5 X
甲沉默(合作) 甲认罪(背叛)
, n+ h1 A6 f! _: d% z& B( l乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
, n$ P6 r) ^1 y+ e8 y. i) i( a乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 ) b! y/ w- T/ i8 P( {, U; I
_9 T* U0 T5 g 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ! C) }* V6 y' H3 L3 ~9 H
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
, t4 [; f5 @! p 若对方沉默、背叛会让我获释,所以会选择背叛。 ; A( f# L( f9 {& p8 \ ~& f
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
9 ?, J: J; g0 }- ] 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 & \- Z9 j/ H& T' R( o/ t3 o* d; v, R. {
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
4 ` T; x% J! S# z1 Q 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。) g4 p& r2 B& g( t
[编辑本段]二、智猪博弈理论
' M% l7 e [6 U/ m J 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 9 E' Q0 g" @2 n% m) n( N
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
, @- a! \" z' u$ K: M 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 1 ?9 Q0 P6 E/ u8 v. b
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 " \- G9 f7 J0 O/ E* V
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ! f+ R2 e% _: ?8 Y% C% j4 T
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
& K9 x S% v6 X7 E3 L, ^% i 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
% ]' O6 }, g* t2 x7 y
7 T4 _3 A7 J e% |6 n三、关于企业价格策略
/ M+ k3 m5 L" N$ ~7 F# ?2 u, y; g% w) a
" t" u$ T$ R6 N' M
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
1 m/ a# f* z/ N* d6 M 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
+ ~ ^+ t* `* S, K0 @2 a) D( I" L 以下三个定义:
( N2 w& V4 p% M0 G6 L 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 8 O- \( x. G# Z- w4 O; E3 @( L
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 2 y+ n% l4 T6 C! `3 K
所谓的双方优势策略则是指双方利益总和最大的策略。
5 z* d1 Y* K4 `- H! ~2 | q[编辑本段]严格优势策略举例分析- _5 f; w+ \5 v
一、经典的囚徒困境
/ N8 Y& ~! A& k; @8 R9 D3 ^ 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 8 [2 `: \. c) M/ G7 d
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ( a( N+ {( Y d, t
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
" r \$ {8 X4 ^2 i: E+ w/ d" i 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ( K5 p. o9 }& L0 k
若二人都互相检举(互相“背叛”),则二人同样判监2年。
, A2 A; ]2 g7 x* _9 S* P # U2 |( E" D- U P4 @
用表格概述如下:4 Y2 n( Z6 B! \2 T7 i/ w: G
9 S& ^, Y5 ^& ?9 z
甲沉默(合作) 甲认罪(背叛)
2 q2 N7 t; Y+ x: v# O8 s乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
U0 B- M3 o; L* T4 C( n. g乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
! K# \6 C* h% R& x# z; B) K3 F; y9 d$ m8 m& e. a
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 , m) g- T! H1 Q( N9 T+ ]) q
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 3 h3 q3 O# _' e) J. d5 S
若对方沉默、背叛会让我获释,所以会选择背叛。
1 o1 x7 z9 K' }4 `5 a. d/ E4 M 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
3 j* S G: i7 f2 {3 } 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
! ^& O4 ]+ G( {2 k- {+ Q5 x. r 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
( @* x' K3 |+ _' x4 ?# K! |- L 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。" W; }& j/ f% ~3 a3 J# M. A T
[编辑本段]二、智猪博弈理论
+ r0 C5 K0 }, K- J# r 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 - }% f& ^/ i- O. `, h4 }
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 7 Y$ _6 ~% I/ J) q& ^0 j
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
4 ^) j5 O9 q7 i0 `3 p+ \! b; v 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 & u7 t6 Y/ X8 @9 R
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
, r" s0 J, i7 w2 @5 v4 d 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 K8 O( g: \) _) v1 Z
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。8 F, Q4 t T4 O- j, V0 t
: E- |$ V5 v& s f- T2 }+ U2 ]8 C三、关于企业价格策略
' R! l* @% x; |4 D1 B3 v# L/ i
2 W& P7 g+ l8 ^0 v+ P* O, T" G* ^
: [9 V* t' ^8 {. }/ J) p, o7 q 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
+ n) A t/ t9 U# i; s Y 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
5 v! R5 o- j- J, B5 L8 J 以下三个定义:
1 V A ]+ k b2 m 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
; c+ X; t' F/ t/ i4 U 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
9 H2 Z$ P* A3 { 所谓的双方优势策略则是指双方利益总和最大的策略。 . R4 `) b9 O, J
[编辑本段]严格优势策略举例分析- Q' m/ m$ f9 d5 b1 Q1 m
一、经典的囚徒困境
@7 d$ D: {5 V4 o: E 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
$ G+ z! F+ {1 Q1 m$ O 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
; F) o! h( A; |8 s5 y& x( P 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
) b3 |3 I4 Q/ l 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
8 l8 e3 O) j! c8 z 若二人都互相检举(互相“背叛”),则二人同样判监2年。7 f1 I' H) h: }0 l" E) L
' u5 q6 Q- R: w5 }% w用表格概述如下:! u6 a1 @( U s
4 B( `9 X5 H# N& x 甲沉默(合作) 甲认罪(背叛) 2 G/ ~- t$ G. u1 D( a: ^+ S, P' |' U
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 # ? ~" K# H! L. l' K
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 6 _+ s; R% A; X% n
0 `; M# [ V! I4 \3 C
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
3 \6 A7 x; A+ T9 | 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: * x8 R. ]" m6 H' }( v
若对方沉默、背叛会让我获释,所以会选择背叛。 3 s7 P" V% b* c- b
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ( t+ I+ m4 I* {4 k
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
2 ~, B. w; Z+ c9 |/ J# W/ W 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 : |2 `7 g }, W) ^$ ~9 a F
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。, C- h* l# M5 U3 x2 M! s" k( L
[编辑本段]二、智猪博弈理论$ m2 {9 `+ _1 U3 g# t6 a i6 ~. i
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 i7 k& ?1 F6 g# k+ s0 q. |5 j
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
4 m2 U) n" t6 V2 x( } 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
$ G0 J& P' b& t1 L9 V! h 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 0 V/ U' X; H- H6 D2 A
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 " ?: f; Q' D2 a$ W- _; [
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
( F: V5 E* `3 U 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
; \7 t0 ~' F, \
7 V5 |! w" c( m# ` b: F% c- [三、关于企业价格策略 {! l; p! n, {7 Z# A& A
7 i. W% F- R/ g( t5 Q* ?
1 \) E+ v# z1 [# a7 Q% O 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
9 s) Q% d7 {7 s 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |