关灯
《文稿,还能这样写》作者雄文《笔杆子碎语》作者王一端《机关文稿写作入门》作者杨新宇《机关文字工作五十讲》作者何新国
最新《公文写作培训课程》直播间《公文写作百法例讲》作者房立洲老秘网站长、《老秘笔记》作者老猫《公文高手的自我修养》作者胡森林
开启左侧

人生有许多无耐

[复制链接]
lzqggg 发表于 2015-12-31 11:31:17 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
公文写作培训班
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 # C7 H: ~" v% c8 Z- c) t

+ p: [9 v; N) z/ a严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
# h; h' J9 t' D6 u  以下三个定义:
# q/ R3 b3 c$ m& o- F  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
' w& u+ j4 d* R  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
# R1 y: j* P- P- `# K; a" h& P4 c' a  所谓的双方优势策略则是指双方利益总和最大的策略。  4 n& O; T3 `: [4 J  s+ b" b1 o
[编辑本段]严格优势策略举例分析! l2 c/ w8 E, o$ V6 Y3 s5 ]' t
  一、经典的囚徒困境 / Y+ G5 \# ]% Z, N. A9 V6 v
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: , |6 ~0 A; L: n" P0 H, {  s
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
6 i/ J. J; n% J/ ^; h( J  r* D  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
  p' t! H' B* e' f3 j  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
/ @# a. O- S3 w+ g" R  若二人都互相检举(互相“背叛”),则二人同样判监2年。
2 n8 ~5 ]& b: z' g$ n. Q$ G& l$ Z3 c  K  
+ I* d& f7 U4 s7 m: Y用表格概述如下:: I) E  @% m3 p  n  I! b, t; T

$ K0 Q4 O) [, Z6 o' s    甲沉默(合作)  甲认罪(背叛)  
9 ?' c8 Z/ ?( D: B  ~乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
' s2 m, b4 |  F1 k8 G( H! f乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  - A/ |0 S3 _) P( Y/ Z* d2 b
/ L( F4 V. F; n, s8 t/ B2 ~
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ) F$ T2 W- O0 s- c+ S3 i9 B
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: / P! b' f0 j/ ^2 k5 c* a4 B0 o
  若对方沉默、背叛会让我获释,所以会选择背叛。
4 F9 ?1 Y- \% C4 ]0 }# J) ?$ R  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
$ ~% b1 p. S: S4 Q1 c7 G$ U  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 : G2 `, P* K3 p% ^7 N
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
7 l. P; h1 ~! D  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
& i/ q5 z/ w9 V( \; N1 o[编辑本段]二、智猪博弈理论
" p" p1 ~+ ^$ J4 q& c$ w5 l7 `  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
0 ]: C; ~: g! F, H! [& ^: _) D& I  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
* N7 i8 A. e% f  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 , }3 k$ c$ z( j2 N
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
' z1 u3 z: N: g( g( V  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
7 R4 q% H5 R$ C7 [8 h5 a  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 2 A5 R; @- x6 h5 S( \$ w1 Y
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
* s) q. t+ Q. a) o  2 \5 B, T2 [/ Z4 Z/ g) P
三、关于企业价格策略: l/ Z7 B; }8 O6 k

% h5 P' Q! r) e9 s+ e. x% o  
1 l6 @6 y3 G# V" P  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ! e. N5 q1 C1 ~" H
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
- _* j0 t7 }' m  以下三个定义:) \7 Q$ `- O  h; r* u$ z
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 1 N1 x% q& k; J& r7 L: B' V
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
- @& {! ]! C" i$ i; x8 _2 h  所谓的双方优势策略则是指双方利益总和最大的策略。  - K' P% R% O' x, g0 d$ u* S9 H
[编辑本段]严格优势策略举例分析: x$ Y9 N  z2 u( l6 W+ Z
  一、经典的囚徒困境
# j9 Y. M" v, O( }9 M7 @0 W# f  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
  C9 P$ u0 @3 I% b9 J# q& Z  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 4 n) X% ~1 G7 I+ P6 p1 Y( o
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
$ S8 R( _+ @, }# P  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
- D6 @( t4 _" s8 G& j& r* R  若二人都互相检举(互相“背叛”),则二人同样判监2年。3 @2 N* _! q* Q7 y" L
  
% ]7 T6 v( S& K) E5 c% Y3 m/ h用表格概述如下:* S* Z( c5 X3 y  g# g
4 ]# q% p9 h( h1 ]- a+ L5 X
    甲沉默(合作)  甲认罪(背叛)  
, n+ h1 A6 f! _: d% z& B( l乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
, n$ P6 r) ^1 y+ e8 y. i) i( a乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  ) b! y/ w- T/ i8 P( {, U; I

  _9 T* U0 T5 g  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ! C) }* V6 y' H3 L3 ~9 H
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
, t4 [; f5 @! p  若对方沉默、背叛会让我获释,所以会选择背叛。 ; A( f# L( f9 {& p8 \  ~& f
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
9 ?, J: J; g0 }- ]  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 & \- Z9 j/ H& T' R( o/ t3 o* d; v, R. {
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
4 `  T; x% J! S# z1 Q  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。) g4 p& r2 B& g( t
[编辑本段]二、智猪博弈理论
' M% l7 e  [6 U/ m  J  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 9 E' Q0 g" @2 n% m) n( N
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
, @- a! \" z' u$ K: M  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 1 ?9 Q0 P6 E/ u8 v. b
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 " \- G9 f7 J0 O/ E* V
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ! f+ R2 e% _: ?8 Y% C% j4 T
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
& K9 x  S% v6 X7 E3 L, ^% i  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
% ]' O6 }, g* t2 x7 y  
7 T4 _3 A7 J  e% |6 n三、关于企业价格策略
/ M+ k3 m5 L" N$ ~7 F# ?2 u, y; g% w) a
  " t" u$ T$ R6 N' M
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
1 m/ a# f* z/ N* d6 M  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
+ ~  ^+ t* `* S, K0 @2 a) D( I" L  以下三个定义:
( N2 w& V4 p% M0 G6 L  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 8 O- \( x. G# Z- w4 O; E3 @( L
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 2 y+ n% l4 T6 C! `3 K
  所谓的双方优势策略则是指双方利益总和最大的策略。  
5 z* d1 Y* K4 `- H! ~2 |  q[编辑本段]严格优势策略举例分析- _5 f; w+ \5 v
  一、经典的囚徒困境
/ N8 Y& ~! A& k; @8 R9 D3 ^  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 8 [2 `: \. c) M/ G7 d
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ( a( N+ {( Y  d, t
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
" r  \$ {8 X4 ^2 i: E+ w/ d" i  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ( K5 p. o9 }& L0 k
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
, A2 A; ]2 g7 x* _9 S* P  # U2 |( E" D- U  P4 @
用表格概述如下:4 Y2 n( Z6 B! \2 T7 i/ w: G
9 S& ^, Y5 ^& ?9 z
    甲沉默(合作)  甲认罪(背叛)  
2 q2 N7 t; Y+ x: v# O8 s乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
  U0 B- M3 o; L* T4 C( n. g乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
! K# \6 C* h% R& x# z; B) K3 F; y9 d$ m8 m& e. a
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 , m) g- T! H1 Q( N9 T+ ]) q
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 3 h3 q3 O# _' e) J. d5 S
  若对方沉默、背叛会让我获释,所以会选择背叛。
1 o1 x7 z9 K' }4 `5 a. d/ E4 M  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
3 j* S  G: i7 f2 {3 }  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
! ^& O4 ]+ G( {2 k- {+ Q5 x. r  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
( @* x' K3 |+ _' x4 ?# K! |- L  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。" W; }& j/ f% ~3 a3 J# M. A  T
[编辑本段]二、智猪博弈理论
+ r0 C5 K0 }, K- J# r  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 - }% f& ^/ i- O. `, h4 }
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 7 Y$ _6 ~% I/ J) q& ^0 j
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
4 ^) j5 O9 q7 i0 `3 p+ \! b; v  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 & u7 t6 Y/ X8 @9 R
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
, r" s0 J, i7 w2 @5 v4 d  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。   K8 O( g: \) _) v1 Z
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。8 F, Q4 t  T4 O- j, V0 t
  
: E- |$ V5 v& s  f- T2 }+ U2 ]8 C三、关于企业价格策略
' R! l* @% x; |4 D1 B3 v# L/ i
2 W& P7 g+ l8 ^0 v+ P* O, T" G* ^  
: [9 V* t' ^8 {. }/ J) p, o7 q  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
+ n) A  t/ t9 U# i; s  Y  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
5 v! R5 o- j- J, B5 L8 J  以下三个定义:
1 V  A  ]+ k  b2 m  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
; c+ X; t' F/ t/ i4 U  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
9 H2 Z$ P* A3 {  所谓的双方优势策略则是指双方利益总和最大的策略。  . R4 `) b9 O, J
[编辑本段]严格优势策略举例分析- Q' m/ m$ f9 d5 b1 Q1 m
  一、经典的囚徒困境
  @7 d$ D: {5 V4 o: E  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
$ G+ z! F+ {1 Q1 m$ O  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
; F) o! h( A; |8 s5 y& x( P  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
) b3 |3 I4 Q/ l  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
8 l8 e3 O) j! c8 z  若二人都互相检举(互相“背叛”),则二人同样判监2年。7 f1 I' H) h: }0 l" E) L
  
' u5 q6 Q- R: w5 }% w用表格概述如下:! u6 a1 @( U  s

4 B( `9 X5 H# N& x    甲沉默(合作)  甲认罪(背叛)  2 G/ ~- t$ G. u1 D( a: ^+ S, P' |' U
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  # ?  ~" K# H! L. l' K
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  6 _+ s; R% A; X% n
0 `; M# [  V! I4 \3 C
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
3 \6 A7 x; A+ T9 |  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: * x8 R. ]" m6 H' }( v
  若对方沉默、背叛会让我获释,所以会选择背叛。 3 s7 P" V% b* c- b
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ( t+ I+ m4 I* {4 k
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
2 ~, B. w; Z+ c9 |/ J# W/ W  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 : |2 `7 g  }, W) ^$ ~9 a  F
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。, C- h* l# M5 U3 x2 M! s" k( L
[编辑本段]二、智猪博弈理论$ m2 {9 `+ _1 U3 g# t6 a  i6 ~. i
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。   i7 k& ?1 F6 g# k+ s0 q. |5 j
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
4 m2 U) n" t6 V2 x( }  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
$ G0 J& P' b& t1 L9 V! h  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 0 V/ U' X; H- H6 D2 A
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 " ?: f; Q' D2 a$ W- _; [
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
( F: V5 E* `3 U  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
; \7 t0 ~' F, \  
7 V5 |! w" c( m# `  b: F% c- [三、关于企业价格策略  {! l; p! n, {7 Z# A& A

7 i. W% F- R/ g( t5 Q* ?  
1 \) E+ v# z1 [# a7 Q% O  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
9 s) Q% d7 {7 s  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

14粉丝

9帖子

排行榜
作者专栏

关注我们:微信订阅号

官方微信公众号

客服个人微信号

全国服务热线:

0595-22880819

公司地址:泉州秘途文化传媒有限公司

运营中心:福建省泉州市

Email:506070961#qq.com

Copyright   ©2015-2025  老秘网 责任编辑:释然Powered by©Discuz!技术支持:秘途文化  备案号   ( 闽ICP备19022590号-1 闽公网安备35050302000919号 )