本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
. N8 S( |# O. J+ s1 S
( c1 _ b* ~+ p严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
& g6 }9 i- G( ^* [ 以下三个定义:
' |0 T6 {* A8 G* ~; @% } 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 1 W3 K U; Y1 B( H7 W+ G& t
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
. `; a! {3 N6 J6 I- v3 m; w! Z# v 所谓的双方优势策略则是指双方利益总和最大的策略。 & @8 M( a3 A' c$ \! E& r
[编辑本段]严格优势策略举例分析
7 K7 ], e. [/ d2 A 一、经典的囚徒困境 - m% B. L' ~3 R0 ]
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
* [! f+ e% y! ?& d( e/ _9 H 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
& R I* W* C' j r 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
- ^7 {: t' ~4 R8 s3 \ 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 * r% n. S6 S) p# T
若二人都互相检举(互相“背叛”),则二人同样判监2年。
/ y+ P, S" b0 f' O( i( U! e$ d
+ H2 y3 I5 V& }0 F: u1 J用表格概述如下:
# o. e7 t. H9 K1 D: {4 I2 F( `0 c: G( k& N# K# H" a
甲沉默(合作) 甲认罪(背叛) . r5 G; v2 d- O
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 * ^2 z. t v5 n5 |$ E( T+ `) I
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
& l9 Y9 Z L7 v. c9 c# j# `( B) M. z: p1 Z
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
2 R7 K# [4 G% i) B1 m 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
* e. Z0 l0 F3 C+ u 若对方沉默、背叛会让我获释,所以会选择背叛。 , U6 o/ O$ o/ R! o8 a/ ?; E P
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 : R' s6 C( |2 B6 g5 W; B
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 z0 F! m( y! A0 g: q- r- `
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
3 p2 Q0 a4 g0 |* F5 V3 K1 n. Y 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
5 ]; k& o6 h" }7 r[编辑本段]二、智猪博弈理论/ q6 W3 b! q+ y" _2 E8 j
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 1 B& A7 g6 K% R* a" j \
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
8 G, P1 {/ k* O! o d2 p3 x8 J/ A 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 , T1 G, @( N5 E" y O5 q2 D% D
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 - S1 n/ ~: j8 G7 S
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ) t. @8 j" C( ^. [: C: H
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ) S6 a# G$ ^( q* X# Z7 r- I5 C3 h
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
" x* J7 a8 S8 p8 A {6 D 4 @4 ~# l9 G& p2 T' {7 {
三、关于企业价格策略
: v: N8 Q |2 L. ~, k$ ]* D* u2 L E$ K7 u
- D5 o, _' Z2 U s* e( G! J
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
( k6 d. C: A0 V7 }$ I 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);* `& d0 p' J( I
以下三个定义:
8 Q2 t$ j) U9 v; O: } 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
6 b' L0 B" Z( U; U 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
& Q: C* l b: r" H 所谓的双方优势策略则是指双方利益总和最大的策略。 + ~) H }7 i4 o* y' B. b! d
[编辑本段]严格优势策略举例分析
0 z5 {3 F1 p4 D0 B 一、经典的囚徒困境
: b" Z5 q5 z. G6 } 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: - k! U6 b0 S( U: k; n# X4 h
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ' p$ Z9 R0 D+ P a6 b0 l& D$ ^$ r
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
1 ^/ L5 k4 k1 {/ c& l 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
/ i- i! T, q& E6 o; s+ R2 \7 ? 若二人都互相检举(互相“背叛”),则二人同样判监2年。# B6 x. }, a' e$ N3 F6 l, e' F/ y) c
# k7 u) o$ v8 Q用表格概述如下:
& i' t+ D% Z$ M3 r0 }7 X$ T" o, c
甲沉默(合作) 甲认罪(背叛) * g% E3 O" d1 D* s
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
4 Q9 U6 Q Q1 e乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
. K/ H; |2 k1 a0 _
9 c5 t: O; b0 ]9 u$ Y/ |: a 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 . Y. M' R4 J! p6 F
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
9 _: J* V- b) t* L8 @ V7 i% ~+ l 若对方沉默、背叛会让我获释,所以会选择背叛。
. ?, X- V* f! J% Z0 Z% W 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
1 @! `0 q& z! K7 a 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
7 B; ~3 D. l f5 @/ \2 X; K 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ' `; F) X2 _( t; h' {, \' \
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。5 A& w, n: c" |* u) I: _
[编辑本段]二、智猪博弈理论
$ w+ s H6 v' `" a 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ) |- z) g1 [9 t/ @4 c& ?
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
% {9 U( \2 C9 L' [& b 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 $ m& n' E2 Q5 R: L; p# q3 ~
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
) o$ e& f$ _$ C, v a; @' l$ X4 t “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
: \: E0 O" F# y) }5 ? 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
& j- S3 m. T# S- h2 w$ p/ G 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
5 A7 q7 U3 ]# [3 f6 L ) A4 N. Z a" W4 p. ~2 W
三、关于企业价格策略& p. q" `, @& a; y2 ~ n( o
7 g3 x# {/ `3 v9 T1 p6 d
/ F: N8 M7 o1 q/ K; q
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
. z: r# Z0 n) Q# H3 c- W 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);% L+ |* ~2 C3 T) i, K3 b' S4 m1 i
以下三个定义:2 M* d+ A" {8 K2 l+ C
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 * O% N# d0 |/ J- I) J& w
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 " u1 \1 P2 N# j1 x" D7 B6 n
所谓的双方优势策略则是指双方利益总和最大的策略。 - R+ i7 r( j, ^! _: N# v! e
[编辑本段]严格优势策略举例分析! d" [$ u2 j2 T1 v) s
一、经典的囚徒困境 x7 K% L1 r! n. E. y$ S e
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: : ` i4 R3 o" n7 \! T- v
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
* P8 [; I/ B7 v8 c 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 5 W) n0 ?! \3 Y- D% K! N7 f
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 6 ]& w3 T: L' @7 `* \
若二人都互相检举(互相“背叛”),则二人同样判监2年。. Z5 Z; \* i8 n; Q; R3 q3 R
6 ?5 {# t- a3 y8 A3 W用表格概述如下:
* W/ t* F3 T/ {/ z' \+ i L6 R! {
- f* r. Y9 S+ v. a5 q+ ?7 r2 k$ H 甲沉默(合作) 甲认罪(背叛) 4 x, M+ H! B& D4 s" M% L
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 5 f8 @+ a9 b% x1 }7 j& F
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 " s% M+ a& @' S* v
7 V6 G% d+ C$ ]0 r1 c( O0 m* P 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 , ~% H) i+ C9 V, y! C. g
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
# Y/ p8 i( p T+ J9 w6 { 若对方沉默、背叛会让我获释,所以会选择背叛。 2 W5 e; j0 {6 w, O) A7 |9 o0 j
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 8 Y" V& K6 b# r" W6 M1 n4 M
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 5 O! X; C5 E7 `8 f& O, G* z
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 3 ]+ e* c- X, y8 [8 u
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。8 u3 E2 f& x- c1 B
[编辑本段]二、智猪博弈理论
( [/ W6 u: Y! m5 e& q& e' R7 } 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
( I5 q; }% a1 [ 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 , X/ x) u/ @, B! W& ]+ b2 k
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 ! [! M: Z* G/ r. E( t c; t# G4 U
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ; h2 j$ |. e) W/ w) e5 O, C
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
; q! A' u2 F5 Y+ n* A& d+ g% W9 C 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 6 V/ {& e# s+ _) B5 A$ y
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。7 `) ]5 h2 n$ ]7 d' Y) ~8 G
+ H# W; S1 Q2 ~5 D三、关于企业价格策略
" t3 Z+ }7 U9 q% | s [ h/ o4 U/ o) U. z
5 u: p# s7 T1 y3 ^/ V 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
0 a/ p* f0 v& p8 A9 {0 Z 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
- }, `7 ?# ]& @. @" P 以下三个定义:8 x: v- G. u0 e5 a' L n
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 " b+ l9 W4 [+ J- U* w! o+ V/ x b
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
1 ~0 Y9 j. r/ y1 m$ a( k' f% s 所谓的双方优势策略则是指双方利益总和最大的策略。 # i+ E9 c- M$ I7 b1 }
[编辑本段]严格优势策略举例分析6 m! b# N" s6 t3 @
一、经典的囚徒困境 / f* I, r/ I% p$ ]' z, Z, u& g3 a- x
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: + a- h* s" Q0 y3 _$ n
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ; ^5 V# j3 C& @( r& E
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
1 ?& j' K; m' W! W 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 . _5 }, N0 @% a' U
若二人都互相检举(互相“背叛”),则二人同样判监2年。2 x& z6 ]' u3 y- C3 X. F
( k+ C2 I% @6 |6 C. S+ R; N1 e
用表格概述如下:
3 m! Z5 Q8 ^9 e1 w" \& F9 s
; q* X. u0 Z& x& R 甲沉默(合作) 甲认罪(背叛)
& p$ \( e8 {3 Y& w4 a乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
! G: @ [* _/ U6 J2 M3 z乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
4 t+ s! n+ y! _: I7 O8 u& s& V) l- k2 b- Q7 D
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
1 K, G" M3 `0 k* J 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: . e1 l# K: \2 w' N% J! I
若对方沉默、背叛会让我获释,所以会选择背叛。
) j/ {9 n! q: a; j6 B% z8 q+ I$ ?" S 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ! ]+ v' K% [+ D- Y% O- U1 @
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
0 f9 @* y8 g3 s, o# U, } 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 7 G2 [7 M Q4 P' L; F
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。3 d7 s) [1 d* C
[编辑本段]二、智猪博弈理论
4 }% \. L- A1 {: |; | 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 1 F$ t, o; ~6 Y3 q+ s, E. r" D
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
/ `1 O; e/ | L8 T, C5 f 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 4 P5 Y4 W: N. M6 Y. q/ @3 @( C7 u
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
; c3 O) u# T, g; j" ?; z “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 4 s( C# Z8 ^: D: w3 `% Y7 h& `
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 9 I$ V" W( B3 [; g# S
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。1 b+ b- W- _ V/ [: o6 f5 v
6 _" j J2 i( K+ l5 B' L4 s& o三、关于企业价格策略' V8 Q" h* `7 ]4 V: P
: O$ Q9 _. `; Z' {8 b0 n/ r
: _" h0 h$ k+ l$ ^ 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
) B( Q& S& z$ E" L W* N 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |