Comments
Description
Transcript
ゲーム理論 (game theory)
ゲーム理論 (game theory) 互いに競争状態にある場面での意思決定問題 最適な戦略(strategy)およびそのときの結果を考える。 相手:個人、企業、国家など意思を持っている 【用語】 競争者(player) :互いに独自の戦略を選択し、勝負する n人ゲーム :n人のプレヤー(player)がいるゲーム 利得表(pay-off matrix) :各プレヤーの結果(利益) ゼロ和ゲーム (zero-sum game):各プレヤーの利得 の合計がゼロとなっているゲーム ©ATSUTO NISHIO 戦略(strategy) • 純粋戦略(pure strategy) − 閉じた戦略 各プレヤーは、自分の戦略からただ1つの戦略 を選び、勝負する。 ゲームの結果(最適解) ー 鞍点(saddle point) mini-max法 :自分はマキシミン原理で行動し、 相手はミニマックス原理で行動する。一致した点がゲーム解。 • 混合戦略(mixed strategy) − 開いた戦略 最適解が存在しない → 確率、行列、グラフなどを利用する ©ATSUTO NISHIO cf. p.15 純粋戦略 2人ゼロ和ゲーム プレハブ・ハウスの生産・販売をしている i社、j社 i j 別 荘 店 舗 新婚住宅 勉強部屋 0.5 1 2 事 務 所 −4.5 4 −6 ©ATSUTO NISHIO 純粋戦略の考え方 両社は悪い状態の中でより高い利益が期待できる戦略を選ぶ。 即ち • i社は各戦略の最悪の場合(最小値)のうち、 最高値の戦略を選ぶ。 → Maxmin原理 • J社は各戦略の最悪の場合(最大値)のうち、 最小値の戦略を選ぶ。 → Minimax原理 両社の戦略が交差した値がゲームの解 → サドル点 ©ATSUTO NISHIO サドル点のグラフ表示 サドル点 i社 j社 ©ATSUTO NISHIO 純粋戦略 (cont) 別荘 店舗 新婚住宅 (最小値) 勉強部屋 1 2 0.5 0.5 max min 事 務 所 ー4.5 4 ー6 ー6 (最大値) 4 2 0.5 min max i社は勉強部屋、j社は別荘を生産・販売したと き、ゲームの解は0.5 サドル点=ゲームの解 ©ATSUTO NISHIO cf. p.18 混合戦略 サドル点が A、Bでじゃんけん − 2人ゲーム A B ぐう ちょき ぱあ (最大値) 存在しない ちょき ぱあ 0 1 −1 −1 −1 0 1 −1 ぐう 1 −1 0 1 1 1 ©ATSUTO NISHIO (最小値) −1 cf. p.19 混合戦略 (行列を利用) 行列を利用する場合 : 2×2の行列で有効 a b G= c d p=(p1,p2)=(A,B) q=(q1,q2)=(C,D) このとき、期待値v=|G|/s ただし、 A=(d - c)/s B=(a - b)/s C=(d - b)/s D=(a - c)/s |G|=a・d − b・c s=a+d−b−c ©ATSUTO NISHIO cf. p.20 混合戦略 (例題) 行列を利用する場合 : 2×2の行列で有効 2 -1 G = -1 2 s=2+2-(-1)-(-1)=6 p=({2-(-1)}/6,{2-(-1)}/6)=(1/2,1/2) q=({2-(-1)}/6,{2-(-1)}/6)=(1/2,1/2) このとき、 期待値v=|G|/s = {2×2-(-1)(-1)}/6 = 1/2 ©ATSUTO NISHIO 混合戦略 (確率を利用) じゃんけんの場合:3×3なので行列による解法は利用できない。確率を利用 利得行列に負の値があるので、一定数を加え正の値にする。 -1 0 1 1 2 3 1 -1 0 →(2を加える)→ 3 1 2 (Ⅰ) 0 1 -1 2 3 1 Aの最適戦略を X = (x1,x2,x3) x1 + 3x2 + 2x3 ≧ v0 2x1 + x2 + 3x3 ≧ v0 3x1 + 2x2 + x3 ≧ v0 ,ゲームの解を v0 とすると、(Ⅰ)より、 ©ATSUTO NISHIO 混合戦略 (確率を利用) Aの最適戦略を X = (x1,x2,x3) ,ゲームの解を v0 とすると、(Ⅰ)より、 x1 + 3x2 + 2x3 ≧ v0 2x1 + x2 + 3x3 ≧ v0 3x1 + 2x2 + x3 ≧ v0 v0 は正の値だから、上の各式を v0 で割り、xi / v0 = θi と置く。 また、Aは v0 を最大にするように X を選ぶから、1 / v0 を最小にすればよい。 従って、 θ1 + 3θ2 + 2θ3 ≧ 1 2θ1 + θ2 + 3θ3 ≧ 1 3θ1 + 2θ2 + θ3 ≧ 1 θ1 + θ2 + θ3 = 1 / v0 =最小 θ1 , θ2 ,θ3 ≧ 0 【Ⅱ】 ©ATSUTO NISHIO 混合戦略 (確率を利用) θ1 + 3θ2 + 2θ3 ≧ 1 2θ1 + θ2 + 3θ3 ≧ 1 3θ1 + 2θ2 + θ3 ≧ 1 θ1 + θ2 + θ3 = 1 / v0 =最小 θ1 , θ2 ,θ3 ≧ 0 【Ⅱ】 【Ⅱ】は明らかに線形計画の問題。 変数の数がθ1 とθ2 の2つならば、図式解法で、 変数の数が3個以上のときは、シンプレックス法で解ける。 シンプレックス法より、 θ1=1/6 , θ2=1/6 , θ3=1/6 これより、1 / v0 =θ1 + θ2 + θ3 = 1/2 ∴ v0 =2 xi / v0 = θi だから x1 = 1/3 . x2 = 1/3 , xx3= 1/3 利得行列には 2 を加えたので、v0 から 2 を引いてゲームの解は 0 となる。 ©ATSUTO NISHIO ジレンマ・ゲーム(dilemma game) 非ゼロ和ゲームの一種 表のようにマクシミン戦略を選択するとa2,b2となり、 ゲームの解は2となる。しかし表からも分かるように 戦略 a1,b1を選択した方は得策である。 a1 そのためには、A,B両者の協力が必要となる。 しかし、Aが裏切って戦略をa2に変えると、Bの 利益は1に減少し、Aの利益は4に増大する。 Bが裏切った場合も同様である。A,Bが共に a2 裏切ると戦略a2,b2が選択され、両者の利益は 共に2となり、報復を受けることになる。 b2 b1 3 1 3 4 4 2 1 2 左上はA,右下はBの利益 ©ATSUTO NISHIO 弱虫ゲーム このゲームは、危険をおかして勇者となるか、 安全を取って。弱虫となるかのジレンマ・ゲーム。 マクシミン戦略はa1,b1でゲームの解は共に3となる。 しかし、Aが勇気をだして積極策を選び、 利益が1減少する危険を冒して、戦略a2を選択 戦略 すると、利益は4に増大する。 a1 これに対して、Bが相変わらず安全第一主義を 取るとすれば、Bの利益は2に減少する。 a2 4 2 4 1 2 ©ATSUTO NISHIO b2 b1 3 3 1 指導者ゲーム このゲームは、先手をとって指導者となり、大きな利益を獲得するか、追従者 となっても指導者の指示に従順に従って、次善の策をあてがわれるかというよう な場合のジレンマ・ゲーム。 マクシミン戦略はa1,b1でゲームの解は共に2である。 ここで、Aは戦略をa2に変更すると、利益は4で最高 となり、Bの利益も3に増大する。しかし、同じことはB にもいえる。ところが、A,B共にマクシミン戦略を選択 すると、利益は最悪の1となってしまう。そこで、Aは リーダーシップを発揮し、共に有利であることを理由に、 Bにb1を選択させ、自分はa2を選択する。 弱虫ゲームとの相違は、BはAの言うことを聞いても、 利益が2から3に増大し次善の策となることである。 ©ATSUTO NISHIO 戦略 a1 b1 2 2 a2 4 b2 3 4 1 3 1 英雄ゲーム このゲームは、自己の利益より相手の利益が多くても、自ら次善の策を選ぶこ とによって自己の利益も増大するような場合のジレンマ・ゲームであり、指導者 ゲームの反対の心理状態を表すモデルである。 マクシミン戦略はa1,b1でゲームの解は共に2である。 ここで、Bが戦略をb2に変更すると、Aは最高の利益4 となる。また、Aがa1を選べば、Bの利益が最高となる。 そこで互いに相手が譲歩し、自分に花を持たせてくれる ように期待している。 このときAは英雄心を発揮してBに花を持たせるため 自分はa1を選び3の利益に甘んじ、Bに4の利益を実 現させることを提案する。これでもAの利益は2から3 に増大するから、その英雄的行為はある程度報われ ることになる。同じことはBについてもいえる。 しかし、A,B両者が犠牲的精神を発揮しa2,b2を選 ぶと最悪の利益1となる。 ©ATSUTO NISHIO 戦略 a1 b1 2 2 a2 3 b2 4 3 1 4 1 囚人ゲーム このゲームは、お互いに相手に対して疑心暗鬼を生じている場合のジレンマ・ゲームである。 A,Bは共犯である。検事がA,Bを別々に呼んで、 両者の犯した罪は共に4年の刑に相当する。 もしも、いずれか一方が自白すれば十分後悔した ものと認め、自白した者の刑を1年に減刑するが、 もう一方の否認し続けた者は一層重い6年の刑を 科すると宣言した。 一方、弁護士は両者とも否認し続けた場合には、 証拠不十分で、共に2年の刑で済むと薦めた。 この場合、一番良いのは、弁護士の薦めに従って 両者とも否認することである。しかしA,Bは別々に 隔離されているため、相手がもしかすると減刑のために 自白するのではないかと疑心暗鬼に陥り、両者共に 共犯の事実を認めてしまい、結局最悪のケースに陥ってしまう。 ©ATSUTO NISHIO B 否認 否認 A 自白 自白 -2 -6 -2 -1 -1 -4 -6 -4