Comments
Description
Transcript
ゲーム理論(¾¼¼ 年夏学期) 第七回講義(改訂版)
ゲーム理論( 年夏学期) 第七回講義(改訂版) 奥野(藤原)正寛 年 月 日 展開型ゲーム ¯ ゲームの構造を始点から終点群まで詳細に記述 誰(どのプレイヤー、偶然を決める自然)の手番なのか その手番では、どんな行動が選択可能か どの行動をとると次に誰のどの手番に行くか (自然を含めて)皆がどの手番でどの行動とるかをきめれば、 パス(経路)が決まり、終点と利得の組が決定 自分の手番が、具体的にどの手番にいるかわからないとき (情報集合)には行動選択に一定の制約 同時手番に対する逐次手番ゲーム ¯ 同時手番ゲーム 相手の行動が分からないままに 自分の行動を選択 戦略的優位性は対称的 ¯ 逐次手番ゲームにおける先行者 追随者・後発者より時間的に先に動ける 追随者・後発者は先導者の行動を所与として行動 情報集合の問題(追随者・後発者に自分の行動が知られる) ¯ 逐次手番における後発者 先導者に先手をとられる! 後発者の行動選択の後で起こる不確実性を把握可能 同時手番 戦略形と展開型 S 1 S 2 S (2,1) L (0.0) S 1 (0,0) L (0,0) S (0,0) 2 L L (2,1) (1,2) L (1,2)) ¯ どちらのプレイヤーを先にしても同じゲームの展開形をかける ¯ 同じ情報集合内(点線部分)では、各ノード で同じ行動 逐次手番 戦略形と展開型 2 1 S L SL SS SL SL SL LS SL LL (2,1) (2,1) (0,0) (0,0) 2 S S (2,1) L (0,0) S (0,0) 1 L (0,0) (1,2) (0,0) (1,2) 2 L (1,2)) ¯ 戦略 ¸ ゲーム開始前に各情報集合での選択行動を予 め決めておくこと ¯ 上の例なら、 が それぞれそ選択した場合に、 は のど ちらを選ぶかを決めておく必要 µ つの可能性 µ つの均衡 チェーンストア・ゲーム:ナッシュ均衡 (-5,-5) FIGHT 1 F A 2 E N 1 ENTER (-5,-5) (1,1) (10.0) ACCOMMODATE (1,1) 2 NOT ENTER (10,0) (10,0) ¯ (新規参入者)は が受け入れる( )と予想し参 入 ¯ (既存企業)は が参入 するので、諦めて協調 チェーンストア・ゲーム:ナッシュ均衡 (-5,-5) F 1 2 E N 1 E F (-5,-5) (10.0) A (1,1) 2 N A ¯ (1,1) (10,0) (10,0) は、参入すると が価格戦争するという脅し に屈する) ¯ は、 が参入したら、損をしても価格戦争を行うと脅す ¯ 戦略ペアがつなぐ始点から終点間の経路が ¯ それ以外のノードは (特に図の紫の点)µ は実現しない µ パスに直接影響しない µ もっともらしい? 均衡選択:均衡 の問題点 ¯ 展開形からの視点 紫のノードは だから実現するはずがないという予想 µ だから自分も損をする を選んでしまったのではないか? ひょっとして誰かが間違えたり、偶然が作用して紫のノードに行くつ いたときにも、 は を選ぶだろうか? 要は、紫のノードで を選ぶという の主張は、カラ脅し ではないか? だとしたら、 はそんな脅しは無視すべきではないか? ¯ 戦略形からの疑問 にとって、 は弱い意味でではあるが によって支配されてい る戦略ではないか? そんな戦略を合理的な が使うだろうか? 展開形ゲームと部分ゲーム ¯ 展開形ゲームと部分ゲーム(チェーンストア・ゲームを例として) 問題の紫のノードから先を考えれば、それは一つの小さな展 開形ゲーム(部分ゲーム ) 元のゲームの二つの戦略それぞれについて、その戦略のうち 部分ゲーム上だけに制限した部分戦略を考える それらの部分戦略が部分ゲームのナッシュ均衡になっている µ 元の戦略はその部分ゲームをプレイする戦略として適切 ¯ 部分ゲームとは? 単独ノードからなる情報集合から始まり、その先がひとつの 小さな展開形ゲームとみなせる場合 µ 当該ノードから始まる部分ゲーム と呼ぶ 部分ゲーム完全均衡 ¯ 次の性質を満たすナッシュ均衡を、部分ゲーム完全均衡 と呼ぶ 本来の展開形ゲームとそのナッシュ均衡戦略の組を考える 個々の部分ゲームを考え、本来の均衡戦略の組のうち、当該部分 ゲーム上に制限した戦略の組を考える 与えられた展開形ゲームの全ての部分ゲーム(本来の展開型ゲーム 全体を含む)において、当該ゲーム上に制限された戦略の組がナッ シュ均衡になっている ¯ チェーンストア・ゲームでは、 均衡 の部分ゲームはナッシュµ 均衡 は である 均衡 の部分ゲームは非ナッシュµ 均衡 は でない 継続利得と逆向き推論法 ¯ 紫色のノードから始まる部分ゲームの均衡は µ 利得の組は ¯ µ 部分ゲームを、利得の組 で置き換えることが出来る 部分ゲームで両者が得るのは継続利得 ¯ 後ろの部分ゲームのナッシュを順次継続利得に置き換えれば µ 逆向き推論法 後ろ向き推論法 ! (-5,-5) F 1 E (1,1) A (1,1) 2 E 2 N N (10,0) (10,0) 展開形ゲームの定義: プレイヤー集合は 、各プレイヤーは ただし、 は自然 で、偶然を決める母なる自然 ゲームの樹は、ノード 点 の集合 で構成される、各ノードは 上の二点の関係を表す枝 が定義されることがある なら と の間に枝 があり、 で を選ぶと に行くことを示す なら で を選ぶと に行くことを示す と 間に枝がないこともある ¼ ¼ ¼ ¼ ¼ 始点、終点、手番 上に始点 がある 上に、これ以上先に進めない終点 の集合 がある 各終点 と始点 を結ぶ枝の列をパス と呼ぶ 終点以外の点 は手番 の集合 から次の へのすべての枝の集合を で表す は ¼ ½ とプレイヤー分割される。 なら はプレイヤー の手番、¼ は偶然手番の集合 展開形ゲームの定義: 情報分割 され、各 各 について分割された集合 はさらに再分割 ½ を の一つの情報集合 と呼ぶ 同一の情報集合内の点 からない にいる場合、 はどちらの点にいるかがわ ¼ は同一の行動 あるいは で表す。 したがって、同一の情報集合 内では、 は同一の行動 を選択 当然、同一の情報集合 に属する点 ¼ 枝の集合 を持つ。これを ¼ しなければならない 確率分布 ¼ も ¼½ ¼¼ と再分割される 各偶然手番の枝 には、 ´¼ ¼ を満たす確率 偶然手番の集合 ¼¾ ¼ が予め定義されている 利得関数 各終末点 に対応して、各プレイヤーの利得 が与えられる。 純戦略、混合戦略、行動戦略 ¯ 純戦略 ゲームが始まる前に自分の情報集合 すべてでどの行動 ¾ を選ぶかを予め決めておくことを純戦略 と呼ぶ。 純戦略の組が決まれば、ゲームのパスが決まり、最終的に到達する 最終点とそこでの各プレイヤーの利得の組が決まる ¯ 混合戦略 各プレイヤーの純粋戦略の確率混合を、混合戦略と呼ぶ ¯ 行動戦略 各プレイヤーが自分の情報集合それぞれでどの様に行動するかを予 め決めておくことが、行動戦略 " # である。 ¯ 各プレイヤーがゲームをどうプレイしたかについて完全な記憶を持って いる場合( と呼ぶ)、純戦略(または混合戦略)と行動戦 略は同値であることが知られている コミットメント:自分の手を縛る ¯ チェーンストア・ゲーム再考 プレイヤー が、自分で戦略 が取れない状態に追い込めば、均衡 が実現せざるを得ない。 を仕掛けられたときに自動発動される対抗手段 µ 自分の手を縛る 自分が をとったら、第三者が制裁措置を自分に課す (-5,-5) F 1 A (1,1) E 2 N (10,0) シュタッケルベルグ均衡 ¯ シュタッケルベルグ均衡 が自己生産量を決定・公開 µ がそれを見て自己生産量を決定 ! 先導者 "、 ! 追随者 # 間の逐次手番ゲーム の へのコミットを知っていれば、 は ¾ を取る µ はナッシュより高い利得を実現できる y2 BR1(y2e) y* NE SE BR2(yS) y* yS BR2(y1e) yC y1 手番の順序と時間整合性 ¯ 事前に を計画するのは合理的 µ 時間整合性は? µ 事後的には Ë にコミットするインセンティブはない ¯ 事後的なインセンティブを考えれば、ナッシュしか実現できない! ¯ にコミットするにはそれなりの工夫が必要 y2 BR1(y2e) y* y2' BR2(yS) NE SE y* y1'' yS BR2(y1e) yC y1 工場建設や政府補助金 ¯ クールノー均衡 µ 戦略的代替性 µ タフな行動が利益増大 µ 自分のタフさに "$ が必要 µ が変化 例1:%!% を引き下げる工場建設 µ 等利潤曲線は青から赤へ µ 建設費用がサンクされれば最適反応曲線は右シフト 例2:政府の生産・輸出補助金 µ 私的費用低下 µ 等利潤曲線は青から赤へ µ 最適反応曲線の右シフト y2 ^ BR1(y2e) BR1(y2e) y* NE SE BR2(yS) yS y* BR2(y1e) yC y1