...

ゲーム理論 (game theory)

by user

on
Category: Documents
14

views

Report

Comments

Transcript

ゲーム理論 (game theory)
ゲーム理論 (game theory)
互いに競争状態にある場面での意思決定問題
最適な戦略(strategy)およびそのときの結果を考える。
相手:個人、企業、国家など意思を持っている
【用語】
競争者(player) :互いに独自の戦略を選択し、勝負する
n人ゲーム :n人のプレヤー(player)がいるゲーム
利得表(pay-off matrix) :各プレヤーの結果(利益)
ゼロ和ゲーム (zero-sum game):各プレヤーの利得
の合計がゼロとなっているゲーム
©ATSUTO NISHIO
戦略(strategy)
• 純粋戦略(pure strategy) − 閉じた戦略
各プレヤーは、自分の戦略からただ1つの戦略
を選び、勝負する。
ゲームの結果(最適解) ー 鞍点(saddle point)
mini-max法 :自分はマキシミン原理で行動し、
相手はミニマックス原理で行動する。一致した点がゲーム解。
• 混合戦略(mixed strategy) − 開いた戦略
最適解が存在しない
→ 確率、行列、グラフなどを利用する
©ATSUTO NISHIO
cf. p.15
純粋戦略
2人ゼロ和ゲーム
プレハブ・ハウスの生産・販売をしている i社、j社
i
j
別 荘
店 舗
新婚住宅
勉強部屋
0.5
1
2
事 務 所 −4.5
4
−6
©ATSUTO NISHIO
純粋戦略の考え方
両社は悪い状態の中でより高い利益が期待できる戦略を選ぶ。
即ち
• i社は各戦略の最悪の場合(最小値)のうち、
最高値の戦略を選ぶ。 → Maxmin原理
• J社は各戦略の最悪の場合(最大値)のうち、
最小値の戦略を選ぶ。 → Minimax原理
両社の戦略が交差した値がゲームの解
→ サドル点
©ATSUTO NISHIO
サドル点のグラフ表示
サドル点
i社
j社
©ATSUTO NISHIO
純粋戦略 (cont)
別荘 店舗 新婚住宅 (最小値)
勉強部屋
1
2
0.5
0.5 max min
事 務 所 ー4.5
4
ー6
ー6
(最大値)
4
2
0.5
min max
i社は勉強部屋、j社は別荘を生産・販売したと
き、ゲームの解は0.5
サドル点=ゲームの解
©ATSUTO NISHIO
cf. p.18
混合戦略
サドル点が
A、Bでじゃんけん − 2人ゲーム
A
B
ぐう
ちょき
ぱあ
(最大値)
存在しない
ちょき
ぱあ
0
1
−1
−1
−1
0
1
−1
ぐう
1
−1
0
1
1
1
©ATSUTO NISHIO
(最小値)
−1
cf. p.19
混合戦略 (行列を利用)
行列を利用する場合 : 2×2の行列で有効
a b
G= c d
p=(p1,p2)=(A,B) q=(q1,q2)=(C,D)
このとき、期待値v=|G|/s
ただし、
A=(d - c)/s
B=(a - b)/s
C=(d - b)/s
D=(a - c)/s
|G|=a・d − b・c
s=a+d−b−c
©ATSUTO NISHIO
cf. p.20
混合戦略 (例題)
行列を利用する場合 : 2×2の行列で有効
2 -1
G = -1 2
s=2+2-(-1)-(-1)=6
p=({2-(-1)}/6,{2-(-1)}/6)=(1/2,1/2)
q=({2-(-1)}/6,{2-(-1)}/6)=(1/2,1/2)
このとき、
期待値v=|G|/s = {2×2-(-1)(-1)}/6 = 1/2
©ATSUTO NISHIO
混合戦略 (確率を利用)
じゃんけんの場合:3×3なので行列による解法は利用できない。確率を利用
利得行列に負の値があるので、一定数を加え正の値にする。
-1 0 1
1 2 3
1 -1 0
→(2を加える)→ 3 1 2
(Ⅰ)
0 1 -1
2 3 1
Aの最適戦略を X = (x1,x2,x3)
x1 + 3x2 + 2x3 ≧ v0
2x1 + x2 + 3x3 ≧ v0
3x1 + 2x2 + x3 ≧ v0
,ゲームの解を v0 とすると、(Ⅰ)より、
©ATSUTO NISHIO
混合戦略 (確率を利用)
Aの最適戦略を X = (x1,x2,x3) ,ゲームの解を v0 とすると、(Ⅰ)より、
x1 + 3x2 + 2x3 ≧ v0
2x1 + x2 + 3x3 ≧ v0
3x1 + 2x2 + x3 ≧ v0
v0 は正の値だから、上の各式を v0 で割り、xi / v0 = θi と置く。
また、Aは v0 を最大にするように X を選ぶから、1 / v0 を最小にすればよい。
従って、
θ1 + 3θ2 + 2θ3 ≧ 1
2θ1 + θ2 + 3θ3 ≧ 1
3θ1 + 2θ2 + θ3 ≧ 1
θ1 + θ2 + θ3 = 1 / v0 =最小
θ1 , θ2 ,θ3 ≧ 0
【Ⅱ】
©ATSUTO NISHIO
混合戦略 (確率を利用)
θ1 + 3θ2 + 2θ3 ≧ 1
2θ1 + θ2 + 3θ3 ≧ 1
3θ1 + 2θ2 + θ3 ≧ 1
θ1 + θ2 + θ3 = 1 / v0 =最小
θ1 , θ2 ,θ3 ≧ 0
【Ⅱ】
【Ⅱ】は明らかに線形計画の問題。
変数の数がθ1 とθ2 の2つならば、図式解法で、
変数の数が3個以上のときは、シンプレックス法で解ける。
シンプレックス法より、 θ1=1/6 , θ2=1/6 , θ3=1/6
これより、1 / v0 =θ1 + θ2 + θ3 = 1/2 ∴ v0 =2
xi / v0 = θi だから x1 = 1/3 . x2 = 1/3 , xx3= 1/3
利得行列には 2 を加えたので、v0 から 2 を引いてゲームの解は 0 となる。
©ATSUTO NISHIO
ジレンマ・ゲーム(dilemma game)
非ゼロ和ゲームの一種
表のようにマクシミン戦略を選択するとa2,b2となり、
ゲームの解は2となる。しかし表からも分かるように 戦略
a1,b1を選択した方は得策である。
a1
そのためには、A,B両者の協力が必要となる。
しかし、Aが裏切って戦略をa2に変えると、Bの
利益は1に減少し、Aの利益は4に増大する。
Bが裏切った場合も同様である。A,Bが共に
a2
裏切ると戦略a2,b2が選択され、両者の利益は
共に2となり、報復を受けることになる。
b2
b1
3
1
3
4
4
2
1
2
左上はA,右下はBの利益
©ATSUTO NISHIO
弱虫ゲーム
このゲームは、危険をおかして勇者となるか、
安全を取って。弱虫となるかのジレンマ・ゲーム。
マクシミン戦略はa1,b1でゲームの解は共に3となる。
しかし、Aが勇気をだして積極策を選び、
利益が1減少する危険を冒して、戦略a2を選択 戦略
すると、利益は4に増大する。
a1
これに対して、Bが相変わらず安全第一主義を
取るとすれば、Bの利益は2に減少する。
a2
4
2
4
1
2
©ATSUTO NISHIO
b2
b1
3
3
1
指導者ゲーム
このゲームは、先手をとって指導者となり、大きな利益を獲得するか、追従者
となっても指導者の指示に従順に従って、次善の策をあてがわれるかというよう
な場合のジレンマ・ゲーム。
マクシミン戦略はa1,b1でゲームの解は共に2である。
ここで、Aは戦略をa2に変更すると、利益は4で最高
となり、Bの利益も3に増大する。しかし、同じことはB
にもいえる。ところが、A,B共にマクシミン戦略を選択
すると、利益は最悪の1となってしまう。そこで、Aは
リーダーシップを発揮し、共に有利であることを理由に、
Bにb1を選択させ、自分はa2を選択する。
弱虫ゲームとの相違は、BはAの言うことを聞いても、
利益が2から3に増大し次善の策となることである。
©ATSUTO NISHIO
戦略
a1
b1
2
2
a2
4
b2
3
4
1
3
1
英雄ゲーム
このゲームは、自己の利益より相手の利益が多くても、自ら次善の策を選ぶこ
とによって自己の利益も増大するような場合のジレンマ・ゲームであり、指導者
ゲームの反対の心理状態を表すモデルである。
マクシミン戦略はa1,b1でゲームの解は共に2である。
ここで、Bが戦略をb2に変更すると、Aは最高の利益4
となる。また、Aがa1を選べば、Bの利益が最高となる。
そこで互いに相手が譲歩し、自分に花を持たせてくれる
ように期待している。
このときAは英雄心を発揮してBに花を持たせるため
自分はa1を選び3の利益に甘んじ、Bに4の利益を実
現させることを提案する。これでもAの利益は2から3
に増大するから、その英雄的行為はある程度報われ
ることになる。同じことはBについてもいえる。
しかし、A,B両者が犠牲的精神を発揮しa2,b2を選
ぶと最悪の利益1となる。
©ATSUTO NISHIO
戦略
a1
b1
2
2
a2
3
b2
4
3
1
4
1
囚人ゲーム
このゲームは、お互いに相手に対して疑心暗鬼を生じている場合のジレンマ・ゲームである。
A,Bは共犯である。検事がA,Bを別々に呼んで、
両者の犯した罪は共に4年の刑に相当する。
もしも、いずれか一方が自白すれば十分後悔した
ものと認め、自白した者の刑を1年に減刑するが、
もう一方の否認し続けた者は一層重い6年の刑を
科すると宣言した。
一方、弁護士は両者とも否認し続けた場合には、
証拠不十分で、共に2年の刑で済むと薦めた。
この場合、一番良いのは、弁護士の薦めに従って
両者とも否認することである。しかしA,Bは別々に
隔離されているため、相手がもしかすると減刑のために
自白するのではないかと疑心暗鬼に陥り、両者共に
共犯の事実を認めてしまい、結局最悪のケースに陥ってしまう。
©ATSUTO NISHIO
B
否認
否認
A
自白
自白
-2 -6
-2 -1
-1 -4
-6 -4
Fly UP