Comments
Description
Transcript
経済原論
経済原論 第7回 ゲーム理論 1.ゲーム理論とは何か? • 分析対象 – 企業、国、消費者 – 登場するのは2人以上 • ゲーム理論(Game Theory) – 「自分の利益が相手の行動に依存し、 相手の利益が自分の行動に依存しているときの 行動について分析をする研究分野」 2 1.ゲーム理論とは何か? • ゲーム理論の材料 – プレイヤー(Player) 「誰が参加しているか、何人参加しているか」 – 戦略(Strategy) 「『相手がこうしたら自分はこうする』というような、 状況に応じた行動の計画」 – 利得(Payoff) 「ゲームから得られる効用や利潤」 – 情報構造(Information Structure)と手番(Move) 「誰が何を知っているか」 「行動をとる順番、同時手順と逐次手順」 3 1.ゲーム理論とは何か? • 2人ジャンケン – プレイヤー(Player) プレイヤー1、プレイヤー2 – 戦略(Strategy) 「グーか、チョキか、パーを出す」 – 利得(Payoff) 「勝てば10、負ければ-10、あいこは0」 – 情報構造(Information Structure)と手番(Move) 「相手が何を出すかは知らない」 「同時手番(同時に出す)」 4 1.ゲーム理論とは何か? • すれ違いゲーム(同時手番) – プレイヤー(Player) プレイヤー1、プレイヤー2 – 戦略(Strategy) 「右によけるか左によける」 – 利得(Payoff) 「相手と同じ選択をすると-10違うと0」 – 情報構造(Information Structure)と手番(Move) 「相手がどちらに行くかわからない」 「同時手番(同時に出す)」 5 1.ゲーム理論とは何か? • すれ違いゲーム(逐次手番) – プレイヤー(Player) プレイヤー1、プレイヤー2 – 戦略(Strategy) 「右によけるか左によける」 – 利得(Payoff) 「相手と同じ選択をすると-10違うと0」 – 情報構造(Information Structure)と手番(Move) 「相手がどちらに行くかわからない」 「プレイヤー1が先に右か左によける」 6 1.ゲーム理論とは何か? • ゲームの表現方法 – 戦略形 プレイヤー2 プレイヤー1 グー グー チョキ パー チョキ 0 0 -10 0 10 0 -10 10 10 -10 10 -10 パー -10 10 0 10 -10 0 7 1.ゲーム理論とは何か? • ゲームの表現方法 – 展開形 プレイヤー1 右 左 プレイヤー2 右 (0, 0) 左 (-1,-1) 右 (-1,-1) 左 (0, 0) 8 2.囚人のジレンマ • 囚人のジレンマ – プレイヤー(Player) 囚人A、囚人B – 戦略(Strategy) 「自白する」「黙秘する」 – 利得(Payoff) 「2人とも自白すると共に-10」 「2人とも黙秘はともに-2」「片方が黙秘、片方が 自白は、自白した方が0、黙秘した方が-15」 – 情報構造(Information Structure)と手番(Move) 「相手がどちらに行くかわからない」「同時手番」 9 2.囚人のジレンマ • 囚人のジレンマ – 2人はどのような選択をするだろうか? 囚人B 囚人A 自白 自白 黙秘 黙秘 -10 -10 -15 0 0 -15 -2 -2 10 2.囚人のジレンマ • 囚人のジレンマの解き方 – 囚人Bの選択を想定し、囚人Aの行動を考える 囚人B 囚人A 自白 自白 黙秘 黙秘 -10 -10 -15 0 0 -15 -2 -2 – 囚人Bが黙秘をしたら、囚人Aは自白をする方が 得である(0>-2) 11 2.囚人のジレンマ • 囚人のジレンマの解き方 – 囚人Bの選択を想定し、囚人Aの行動を考える 囚人B 囚人A 自白 自白 黙秘 黙秘 -10 -10 -15 0 0 -15 -2 -2 – 囚人Bが自白をしても、囚人Aは自白をする方が 得である(-10>-15) 12 2.囚人のジレンマ • 囚人のジレンマの解き方 – 囚人Bの選択を想定し、囚人Aの行動を考える 囚人B 囚人A 自白 自白 黙秘 黙秘 -10 -10 -15 0 0 -15 -2 -2 – 囚人Bがどのような選択をしても、囚人Aは自白を 行う。逆のケースも同じようになる。 13 2.囚人のジレンマ • 囚人のジレンマの解き方 囚人B 自白 囚人A – 2人とも自白をする。 – これまでは、個人が自分 の効用(利得)を高める選 択をすることが社会的に 望ましいことであると話し てきたが、囚人のジレン マは、ゲームの状況では それが当てはまらないこ ともあると示した。 自白 黙秘 -10 -10 0 -15 黙秘 -15 0 -2 -2 14 2.囚人のジレンマ • 囚人のジレンマの応用 – 2国間の軍縮・軍拡 国家B 国家A 軍拡 軍拡 軍縮 軍縮 -1 -1 -2 5 5 -2 3 3 – 両国とも軍縮をすることが望ましいが、 15 2.ナッシュ均衡と色々なゲーム • ナッシュ均衡(Nash Equilibrium) – 「全てのプレイヤーが予測される他のプレイヤー の戦略に対して、最適反応をとっていること」 最適反応とは、「他のプレイヤーの戦略に対して 自分の利得を最大にする戦略」 1. 適当な戦略の組み合わせを選ぶ。 2. それぞれのプレイヤーについて、その戦略が最適反 応であるかを調べる。 3. 誰かが最適反応をとっていなければ、ナッシュ均衡 でない。全てのプレイヤーが最適反応をとっていれ ばナッシュ均衡。 4. これを全ての組み合わせで調べる。 16 2.ナッシュ均衡と色々なゲーム • 2人ジャンケン – プレイヤー(Player) プレイヤー1、プレイヤー2 – 戦略(Strategy) 「グーか、チョキか、パーを出す」 – 利得(Payoff) 「勝てば10、負ければ-10、あいこは0」 – 情報構造(Information Structure)と手番(Move) 「相手が何を出すかは知らない」 「同時手番(同時に出す)」 17 2.ナッシュ均衡と色々なゲーム • ジャンケン – 相手がパーを出せばチョキ、チョキを出せば…。 プレイヤー2 プレイヤー1 グー グー チョキ パー チョキ 0 0 -10 0 10 0 -10 10 10 -10 10 -10 パー -10 10 0 10 -10 0 18 2.ナッシュ均衡と色々なゲーム • ジャンケンの均衡 – 相手がパーを出せばチョキ、チョキを出せば…。 – ジャンケンのナッシュ均衡は、1/3の確率でそれぞれ の手を出すというもの。 • たとえば、Aがグーを出す確率を高めると、相手はパーを 出し、Aの利得が1/3ずつ出す場合よりも低くなる。そこで、 Aは1/3ずつ出すという戦略に変更する。詳しい説明は省 略。 • ゼロサムゲーム – 自分が勝つと相手が負けるゲームをゼロサムゲー ムという。 – 囚人のジレンマのように、プレイヤーが共に勝利(敗 北)するゲームをノンゼロサムゲームという。 19 2.ナッシュ均衡と色々なゲーム • バトル・オブ・セックス – プレイヤー(Player) 夫、妻 – 戦略(Strategy) 「オペラ観賞」「野球観戦」 – 利得(Payoff) 「2人ともオペラは夫が2,妻が3」 「2人とも野球は夫 が3,妻が2」 「2人が違うものをみると、ともに0」 – 手番(Move) 「同時手番(同時に出す)」 20 2.囚人のジレンマ • 3つ目の均衡 夫 妻 オペラ 野球 夫が野球を選択するとき、 (1-q) (q) 妻の期待利得は、 p*0+(1-p)*2=2-2p、夫が オペラ 2 0 (p) 3 0 オペラを選択するときは、 3*p+(1-p)*0=3pである。 野球 0 3 夫がどちらでも選択する (1-p) 0 2 可能性があると考えると、 2-2p=3pでp=2/5で、妻は2/5の確率でオペラを選ぶこ とになる。夫は同様の方法で3/5の確率でオペラを選択 するのが望ましい。2つ以上の行動を確率的にとること を混合戦略という。 これは、講義の範囲を超えるので覚えなくてよい。 21 2.ナッシュ均衡と色々なゲーム • イオンvsヨーカドー – プレイヤー(Player) イオン、ヨーカドー – 戦略(Strategy) イオン「参入」「非参入」 ヨーカドー「低価格路線」「現状維持」 – 利得(Payoff) 次ページを参照 – 手番(Move) 「逐次手番(イオンが最初に行動)」 22 2.ナッシュ均衡と色々なゲーム • イオンvsヨーカドー イオン 参入 参入しない ヨーカドー (0, 100) 低価格路線 (-50, -50) 現状維持 (50,50) 23 2.ナッシュ均衡と色々なゲーム • ナッシュ均衡は2つある イオン 参入 参入しない ヨーカドー (0, 100) 低価格路線 (-50, -50) 現状維持 ヨーカドーが低価格路線を必ず選 択するのならば、イオンは参入をす ると利得が-50になってしまうので、 参入しない(利得が0)の選択をとる。 (50,50) 24 2.ナッシュ均衡と色々なゲーム • ナッシュ均衡は2つある イオン 参入 参入しない ヨーカドー (0, 100) 低価格路線 (-50, -50) 現状維持 (50,50) イオンが参入をした場合には、ヨー カドーは現状維持をとった方が利得 が高くなるので(50>-50)、低価格 路線はとらない。 イオンが利得の情報を理解してい れば、参入さえしてしまえばヨーカ ドーが現状維持を選択するので、こ のナッシュ均衡が選ばれる。 25 2.ナッシュ均衡と色々なゲーム • ナッシュ均衡は2つある イオン ② 参入 ヨーカドー ① 低価格路線 (-50, -50) 参入しない (0, 100) 現状維持 (50,50) 選ばれないナッシュ均衡もそんざいする ことがわかる。2つめのナッシュ均衡を 求めるときは、先に枝の先の方の均衡 を求め、幹の方にたどっていくやり方を とる。 ① ヨーカドーは現状維持を選択。 ② イオンは50>0の利得から参入する。 この均衡をサブゲーム完全均衡という。 26 2.ナッシュ均衡と色々なゲーム • 手抜きレストラン – プレイヤー(Player) 客、レストラン – 戦略(Strategy) 客「店に入る」「入らない」、店「うまいご飯」「手抜き のご飯」を客に出す – 利得(Payoff) 次ページを参照 – 手番(Move) 「逐次手番(客が最初に行動)」 27 3.繰り返しゲームと協調 • 手抜きレストラン 客 入る 入らない レストラン (0, 0) おいしいご飯 (2, 1) 手抜きご飯 (-1, 2) 28 3.繰り返しゲームと協調 • 手抜きレストランのナッシュ均衡 客 入る 入らない レストラン (0, 0) おいしいご飯 (2, 1) 手抜きご飯 (-1, 2) この場合、客が店に入ってもレストラン は手抜きのご飯しか出さないため(利得 が2>1のため)に、客は店に入るという 選択をとらない(0>-1のため)。その結 果、客とレストランは(入らない、手抜き ご飯)という組み合わせが唯一のナッ シュ均衡でサブゲーム完全均衡。 29 3.繰り返しゲームと協調 • 手抜きレストランのナッシュ均衡 客 入る 入らない レストラン (0, 0) おいしいご飯 (2, 1) 手抜きご飯 (-1, 2) この場合、客が店に入ってもレストラン は手抜きのご飯しか出さないため(利得 が2>1のため)に、客は店に入るという 選択をとらない(0>-1のため)。その結 果、客とレストランは(入らない、手抜き ご飯)という組み合わせが唯一のナッ シュ均衡でサブゲーム完全均衡。この 時のお互いの利得は(0,0)である。 30 3.繰り返しゲームと協調 • ゲームを繰り返すとどうなるか? – レストランの利得 1 2 3 4 5 6 7 ・・・・ 美味い ご飯 1 1 1 1 1 1 1 ・・・・ 手抜き ご飯 2 0 0 0 0 0 0 ・・・・ – 一度、客の期待を裏切って手抜きのご飯を出すと、1回目 に利得2を得られたとしても、2回目以降は客は来なくなり、 0の利得しか得られない。美味いご飯を出せば、客は繰り 返し来るので、利得1を得続けることが出来る。レストラン はこの状況を予測して、最初からおいしいご飯を出す。 31