Comments
Description
Transcript
ゲームと時間 - C
連載:ゲーム理論の新展開 第 3 回 ゲームと時間 秋山英三 1. ゲームにおける時間 2. ゲーム理論:代数的記述によるゲームの形式化 生態系型システムの進化ゲームの理論、シミュ 我々は他者との係わりの中、様々な状況で様々 レーションあるいは従来のゲーム理論では、設定 な意思決定を行う。我々が選択した行動は他人に としてのゲームは固定的(静的)なものが使われ 影響を与え、逆に我々自身も他人の行動から影響 ることが多かった。しかし、現実の人間社会や生 を受ける。こういった、個人間、企業間、国家間、 物集団での相互作用は時間構造を含むことが普通 (あるいは生物間)など複数の意志決定主体が関 で、時間的な側面が重要な役割を果たすことは珍 わる状況を数学として記述したのがゲーム理論で しいことではない。 ある。 本稿の一番目の目的は、こういったゲームの動 ノイマンとモルゲンシュテルンは、このような 的な側面を自然な形で記述できる枠組み、 「力学系 ゲーム的状況での問題、つまり複数の意志決定者 ゲーム (dynamical systems game)」を紹介する が関わる問題は、通常の最大化問題とは根本的に ことである。従来のゲーム理論とは対照的に、力 異なることを指摘した10) 。つまり、全プレーヤー 学系ゲームではゲーム自身が力学系(微分方程式、 は自分の利得を「同時に」最大化しようと意志決 差分方程式などの時間発展をする系)として記述 定をするが、未来に何が起こるかは、他の人たち される。つまり、ゲーム自身がプレーヤーの行動 の意志決定によっても変わってしまう。従って「複 とプレーヤーの状態に影響を受けて変動しうる。 数の意志決定主体」が関わる問題を数学ベースに 二番目に、それを抽象的議論にとどめずに具体的 乗せるには、ある個人と環境の間で閉じた方程式 な解析、そして計算機実験による進化シミュレー 群ではなく、意志決定の相互関係を記述する「行 ションを行い、力学系ゲームを具体的な問題(社 列」による形式化が有効であるということをノイ 会的ジレンマ)へ適用する。そして、社会的ジレ マンは指摘した。ゲーム理論は現状で、複数の意 ンマ状況における協力の発生とその維持の問題に 志決定主体に関する、ほぼ唯一の数学的体系と言 ついて、従来のゲーム理論の枠組みでは原理的に える。 ∗1) 理解し得ないメカニズムについて議論する 。 一方で、(昔から指摘されていることではある が)利得行列などによる相互作用の代数的・静的 記述は、一見して「ダイナミクス」と相性が悪い。 *1) 本稿で紹介する内容は基本的に秋山英三と金子邦彦1)2) に 基づいている。 数理科学 NO. 447, SEPTEMBER 2000 例えば現実の系では、プレーヤーがある行動を選 択して実行すると、そのプレーヤーの好むと好ま 1 ざるに関わらず、その行動がゲーム環境自体を変 思決定を行う。こういった状況を自然に無理なく えてしまうことがある。また逆に、その変動した 記述できるゲームの枠組み、 「時間」を明示的に自 環境によって、プレーヤーの意志決定のプロセス 然な形で取り入れた枠組みを作ることはできない が影響を受けることもある。あるいは、同じ行動 だろうか? に関する効用が、自分自身の状態 (および他者の 状態) の違いによって変わってしまうこともある。 3. 力学系としてのゲームの形式化 environmental input player i 図1 このような、意思決定によって生ずる過去から player n fi ai (activity) 未来への時間的流れを、従来のゲーム理論も原理 player 2 player 1 yi y1 y2 yn f1 f2 fn a1 a2 an x environment 的には取り扱うことができる。図 1 を見てみよう。 図2 この「ゲームの木」の各「節」の部分で各プレー ヤーは行動を選択する。その選んだ行動によって 未来は枝分かれしていく。このようにして、現時点 この問いに対する一つの解答として、本稿では、 「力学系ゲーム」と我々が呼んでいる枠組みを紹 から遠い未来へ向けて、各時点について各プレー 介する。図 2 を見てみよう。力学系ゲームでは、 ヤーが実行可能な行動を全て数え上げ、未来の可 ゲーム自身が力学系として記述される。ゲームが 能なゲームについての分岐パターンを全て書き出 代数的記述の代わりに微分系・差分系として記述 す。これらの分岐全てを表現した大きな「ゲーム され、時間が明示的に入った形で表現される。た の木全体」を 1 つのグラフとして分析することに だし、ゲームの中で「プレーヤー」はある種の最 より、静的な視点から分析することが可能になる 適化関数 f を持つ「特別なクラスの力学系」であ (動学ゲーム (dynamic game) と言われる)。ここ り、環境変数を通して相互作用する∗2)。 で「戦略」とは、この(巨大な)ゲーム中の全時 力学系ゲームにおける「解」は、ゲームダイナ 点での可能性を考慮した「行動計画」のことであ ミクスのある種の「アトラクタ(後述)」として理 り、合理的な「解」の解析は、過去から未来まで、 解することができる。自分にとって平均利得が高 全プレーヤーの行動の全ての可能性を知ることに いアトラクタ、他のプレーヤーと良い協力関係を よって初めて可能になる。 (なお、理論的には、こ 築けるようなアトラクタを構築することがプレー のゲームの木は利得行列に変換可能であり、利得 ヤーにとって重要になる。プレーヤーたちは、学 行列の均衡として解を計算することもできる。) 習・進化を通じて同時にかつ自律的にその関数を しかし、しかし我々は、このような巨大な木を 最大化しようとする。高い利得を獲得できるよう 頭の中で構成することがいつも可能だろうか?仮 に意志決定機構を洗練化していく。以下の節では、 に可能だとして、そもそも我々は常にこのような この力学系ゲームを具体例にそって説明する。 思考プロセスで行動を決めるだろうか?現実世界 において、我々は時々刻々と変動するゲーム環境 の中で、各時点で自分が対峙している状況を見て、 それまでの経験や自分が可能な範囲の推論から意 2 *2) 例えば、我々自身が力学系であることは当然であるが、 「意 思決定をする力学系」としてのプレーヤーを数学的に記述す るとすれば、これが一番シンプルなプレーヤーの定義方法で あろう。 なお、こういった、ゲームを力学系としてとら えようという試みは、古くはラポポート、ラシェ フスキーらによって 1947 年に行われている12)13) 。 5. 社会的ジレンマ 社会的集団の中でどのように「協力」が形成さ しかし、ゲーム理論の広がりとともにこの手の試 れ、維持されるのか、といった問題は、一般に「社 みは事実上消滅してしまう。消滅した原因の一つ 会的ジレンマ」と呼ばれており、過去から多くの は、もちろんゲーム理論枠組みの強力さにあった 研究がなされている。以下では、社会的ジレンマ だろう。もう一つの原因は、当時、満足な計算機 の 1 モデルとしての木こりのジレンマゲームにつ 環境がなかったことである。ゲーム的状況を力学 いて議論する。 系で表現すると相互作用は非線形になるのが多く、 社会的ジレンマに関する古典的かつ有名なストー 非線形の系を解析する際に計算機がないと相当な リーに、1968 年にハーディンが提出した「共有地 困難が伴う。一方、近年になって、レスラー 、池 の悲劇」という逸話がある5) 。この話は、牧草が 上ら6) 7) によって力学系としてのゲームの研究が 育つ牧場 (共有地) で村人達が家畜を放牧する際に 11) 再開され推し進められている ∗3) 。 起こる問題について説いた話で、社会的ジレンマ の問題点を分かりやすい形で表現している。同じ 4. 木こりのジレンマゲーム ような例は、ゴミの廃棄の問題、資源の枯渇の問 題など、我々の身の回りにも枚挙にいとまがない。 以下では、力学系ゲームの具体例として「木こ 我々の身の回りにはこういった「悲劇」への危険 りのジレンマゲーム」というゲームを考え、この 性が無数に潜んでいるのだ。そしてハーディンが ゲームの解析、計算機上での進化実験を通じてゲー 指摘したように、実際に、社会的ジレンマ状況下 ムのダイナミクスに関する議論を行う。 で悲劇に陥ることは珍しいことではない。 木こりのジレンマゲーム:『ある丘に数人の木 しかし一方で、我々自身は社会的状況下でいつ こりがいる。また、この丘には数本の木が育って も悲劇に陥るわけではない、ということも事実で いて、ある程度大きくなる毎に木こりたちはそれ ある。例えば、ブラジルのバレンカの漁師たちの らの木を切る。まだ木が若いとき、つまり、木の 例をあげると14) 、彼らは長年の争いの経験・自然 成長率が高い時に、木こりたちが我慢して木が十 環境の知識の蓄積・街でのインフォーマルなコミュ 分成長するのを待ってから皆で木を切れば、皆が ニケーションを通して、漁のためのルールを作り そこそこに幸せになれる。一方、木こり個々人の 上げ、協力的に漁を行うようになった。そのルー 利得だけを考えれば、多少短くてもよいので、他 ルとは、例えば、漁場を適度に分割し漁師たちが の人を少しでも出し抜いて早めに木を切って独占 違う場所で違うタイプの漁を行う、といった類の してしまった方がよい。しかし、多くの人がそう ルールである(空間的な分業:なお現在でもその いった利己的な行動に走ると、丘はあっという間 ルールは少しずつ改良されている)。悲劇回避の に丸裸になってしまい、皆にとっても不幸なこと もう一つの例として、日本の愛媛県越智郡大西町 になる。ここにジレンマが生じる。』 の宮脇地区での灌漑について触れておこう15) 。こ この木こりのジレンマゲームの一つの特徴は、 の地区は昔から降雨量が少なく傾斜地だが、やは このゲームが力学系ゲームとして記述できるとい り長年の経験から水を巡る紛争を防ぐための協力 うことである。そして、もう一つの特徴は、この ルールが作られてきた。つまり、水田の土地が区 ゲームがいわゆる「社会的ジレンマ」の一つのモ 分化され、それらの区分の所有・耕作権をある人か デルとなっている、ということである。 ら他の人へと年限を区切って交代させていくロー *3) 池上の研究では、力学系としての戦略表現の可能性につい ても興味深い議論が行われている。 数理科学 NO. 447, SEPTEMBER 2000 テーションシステムを作られていた∗4)。 *4) 時間的かつ空間的分業:このシステムは明治の地租改正ま 3 こういった例に限らず、我々は、身近なジレン 府など)外的な制度、裏切りへの罰則などの戦略、 マ状況下で、相互作用/コミュニケーションを通 文化的な効果、評判の効果などが議論されている。 じて協力することがあるし、いつも悲劇に陥って いるわけではない。なぜそれが可能なのだろうか? これが社会的ジレンマの問いである。 (例えば4)16) などを参照のこと。) しかし本稿では、社会的ジレンマの問題につい て、全く別のファクターに注目したい。それはゲー ムの記述そのものに関わる問題である。 6. 社会的ジレンマに対する理論的アプローチ この問いに対しては過去から数多くの研究がな 7. 力学系ゲーム されてきたが、近年もっともインパクトがあったの 社会的ジレンマの問題を抽象化し、囚人ジレン はアクセルロッドの「互恵性」の理論であろう 。 マなどの利得行列などで記述することによって、 アクセルロッドは、繰り返し囚人ジレンマゲーム 我々は、確かにこの問題の重要な性質を浮き彫り についての計算機実験を行い、また理論的解析を にすることができる(例えば「人数の影響」など)。 行った。その結果、鸚鵡返し戦略と呼ばれる協力 しかし一方で、このように静的(代数的)にゲー 的な戦略が、裏切り戦略やその他の戦略に対して ムを記述するとき、ゲームの持つ動的な側面は捨 進化的に安定であることを示し、このことから協 象されざるを得ない。その失われた部分に重要な 力的社会が安定になりうることを証明した。この ものはないだろうか?我々が住む現実世界のゲー アクセルロッドの説明は純粋に戦略上の話として ムでは、例えば、入り江の地形の性質、潅漑用水の 成立し、個体間の血縁などを仮定する必要がない。 増減周期、牧草の成長のダイナミクスなど、ゲー それゆえ非常に説得力があり、実際「互恵性によ ム環境が持つ時間的・空間的構造が大きな意味を る協力行動の形成・維持」は様々な社会的現象の 持つ。また例えば、 「漁師たちが、漁場を分割して 説明として適用されてきた。 考え、それぞれ違う場所で漁をする」 「共有資源を 3) しかし、繰り返し囚人ジレンマの結果をそのま ま現実の社会集団に適用するのは少し問題がある。 交代に消費する」など、時空構造を考慮した戦略 も重要になる。 なぜなら、囚人ジレンマゲームは 2 人ゲームであ 本稿では社会的ジレンマを木こりのジレンマと るのに対し、現実の社会集団での相互作用は 2 個 いう「力学系ゲーム」として定式化し、具体的に 体間より多いことが普通だからである。実際、ジョ 計算機実験を行って解析した。これにより (囚人 シは、N 人繰り返し囚人のジレンマの解析を行い、 ジレンマと異なり) 社会的ジレンマ状況の時間的 プレーヤーの人数 N が増えると、(N 人バージョ な側面を自然な形で記述することができる。特に ン) 鸚鵡返し戦略が進化的に安定になる条件が急 「時間構造を持つ協力ルール」の形成と発展、ま 減に厳しくなる、ということを示した8) 。この「人 た、協力的なゲームダイナミクスの安定性などに 数が増えると協力が難しくなる」という効果を、 ついて議論することが可能になる。 以下簡単のために『人数の影響』と呼ぶことにし よう。まとめると、社会集団中で協力性を維持す るために、互恵性だけでは不十分だということだ。 8. 木こりのジレンマのモデリング では互恵性でないとすれば、どういうメカニズ さて、木こりのジレンマゲームの具体的な定式 ムが協力性の維持に効いているのだろうか?この 化についてここで説明しよう。本稿で用いた木こ 問いに対するアプローチとして、近年では、(政 りのジレンマは 400 ラウンドの繰り返しゲームで ある。ただし、ゲームの状態は繰り返しとともに で続けられた。 4 変化していく。 このゲームの概要は第 4 節で紹介したが、ここで ∗5) は、丘に育つ木の本数は 1 本であるとしよう にしよう。つまり、ゲームの時間発展の中で、プ さ レーヤーの意志決定とは無関係な部分で起こる て、ラウンド(=時刻)t での木の大きさを x(t) 時間発展の法則のことである。この結果、ゲーム と表し、プレーヤー i の状態を yi (t) と表すこと の状態は (x(t), y(t)) から (x(t)0 , y(t)0 ) になる。 にしよう。 「状態」は、例えば、金銭状態、栄養状 2. ゲームの状態 (x(t)0 , y(t)0 ) を参照して、各プ 態などと考えてよい。この状態 yi (t) がラウンド t レーヤー i は各自の意志決定関数 fi に従って行 でのプレーヤーの利得であるとする。そして「木 動 ai (t) を決定する(図中 a(t) は全プレーヤー こりのジレンマゲームにおけるプレーヤーの利得」 の行動の集合を示す)。本稿で紹介する木こりの は全 400 ラウンドの平均利得と考えよう。つまり、 ジレンマでは木の数が 1 本なので、プレーヤー 400 ラウンドを木こりの一生と考えて、一生の間、 i の行動 ai (t) は「木を切る」または「(切らず 平均的に良い生活をしている木こりを良い木こり に) 待つ」の二つのうちのどちらかである∗6)。 3. 切られると木は短くなる。切り取った木材は と考えるのである。 また、プレーヤー i は意志決定関数 (機構) fi を 木を切ったプレーヤーたちで山分けされ、切っ 持ち、ゲームの状態 (x(t), y(t)) を見て行動 ai (t) たプレーヤーたちの状態値は大きくなる(木 を決定する。ここで y(t) は全プレーヤーの状態値 を切ってないプレーヤーの状態値は y(t)0 のま の集合を表す(fi の詳細は本稿では省略する)。つ ま)。この結果、ゲームの状態は (x(t)0 , y(t)0 ) か まり、木こりは回りの木こりの状態と自分の状態 ら (x(t + 1), y(t + 1)) になる。 と木の高さから行動を決定するのである。 x(t+1)=x(t)’ x(t)’=u(x(t)) : x(t) x(t)’ 9. 1 ラウンドのプロセス : u(x) = 0.7 x 3 – 2.4 x 2 + 2.7 x x(t) x(t) y(t) (1) x(t)’ y(t)’ (2) x(t+1) y(t+1) (3) a i (t) 図3 図 3 を見てみよう。木こりのジレンマゲームの 1 ラウンドによってゲームの状態は (x(t), y(t)) か ら (x(t + 1), y(t + 1)) になるが、この 1 ラウンド を分かりやすく、以下の三つのプロセスに分けて 考えてみよう:(1) 自然法則の影響 (2) プレーヤー ( ) u(x) = min(1.5 x , 1.0) 図4 木の成長に関する自然法則のために、本稿では 二通りの写像を用意した。一つは x(t)0 = u(x) = 0.7x3 − 2.4x2 + 2.7x であり、もう一つは x(t)0 = u(x) = min(1.5x, 1.0) である。その写像のグラフ は図 4 の左側の列に与えてある。簡単のため、グ ラフの形から、前者の写像を用いたゲームを「凸 型木こりのジレンマゲーム」、後者を「区分線形木 の意志決定 (3) 意志決定の影響。 1. 系に与えられた法則(ゲームの設定)に従っ て、(a) 木は成長し、(b) プレーヤーの状態値は 減少する。この法則のことを自然法則と呼ぶこと *6) 全てのラウンドにおいて、木を切る行動の方が切らない行 動より利得が高いことに気をつけよう。木を切らなければプ レーヤーの状態は自然法則によって減少したまま (x(t)0 ) だ が、切ればそれよりわずかでも状態値は上がる。1 ラウンド に限ってみれば切らないより切った方がましなのである。以 *5) ただし、木の本数は容易に複数に拡張でき、実際、複数本 上のプロセスによって、木こりジレンマの 1 ラウンドでゲー のゲームについての分析も行われているが、本稿では 1 本 ム状態は時間発展をし、これを 400 ラウンド繰り返すことに の場合の結果のみに絞って紹介する。 よって木こりジレンマのゲームダイナミクスが形成される。 数理科学 NO. 447, SEPTEMBER 2000 5 こりのジレンマゲーム(簡単のために「線形ゲー マの 1 人ゲームを考えよう。つまり、丘には 1 人 ム」とも呼ぶ)」と呼ぶことにしよう。プレーヤー のプレーヤーと木が 1 本だけが存在し、木は凸型 が木を切らなかった場合に、両タイプの写像で木 写像による自然法則によって成長するとする。そ がどのように成長するかの時系列が図 4 の右側の して、このプレーヤーは「木の大きさが閾値 0.8 を 列に与えてある。 越えたところで木を切る」という単純な意志決定 ここで重要なのは、木の成長法則の詳細ではな をすると仮定しよう。そのときの木の大きさのダ く、異なったダイナミクスを生み出す 2 つのタイ イナミクスは図 5 のようになる。この図で横軸が プの成長法則を用意した、ということ自体であり、 ラウンド(時刻)で縦軸が木の大きさである。木の しかも、その 2 つのゲームが共通する性質を持っ 高さが小さい間はプレーヤーは木を切らない。し ているということである。例えば、図 4 の木の成 かし木の高さが 0.8 を越えたところでプレーヤー 長時系列をみると、両方のタイプに共通して、初 が木を切るので木は短くなる(点線矢印部)。その めは木がよく育ち、最後には成長が止まる(サイ 後また木は大きくなる。そして高さが 0.8 を越え ズ 1.0 で)。それゆえ、両方のタイプのゲームとも たところで短くなる・ ・。このようにして木の大き ∗7) 木こりの「ジレンマ」状況を表現している 。 さのダイナミクスが生成され、この図の場合、最 線形ゲーム、凸型ゲームという、2 つの多少異 終的に木の大きさのダイナミクスは {0.3, 0.6} の なった力学法則を持つ木こりのジレンマゲームは、 2 周期アトラクタに収束する (図中右側の矢印)。 共に社会的ジレンマであることは変わりはなく、 なお、閾値を 0.7 に変えても同じ 2 周期アトラク もし、古典的(静的)ゲーム理論の枠組みで考え タに落ち着く。しかし、閾値を 0.9 にすると 3 周 ると、ともに囚人ジレンマゲームとなるだろう。 期アトラクタにジャンプする。つまりこのゲーム しかし、以下で見るように、この 2 つの木こりの では、プレーヤーの戦略の変化に対して、ゲーム ジレンマはその力学的性質の違いゆえに、それぞ ダイナミクスのアトラクタは変化する場合もある れ全く異なる現象を生み出す。 し変化しない場合もある。また、戦略の連続的変 化に対して、観察されるダイナミクスは不連続に 10. 戦略とゲームダイナミクスのアトラクタ 変わっていく(ジャンプする)。一方、線形ゲーム の場合、戦略を連続的に変えたときにゲームダイ ナミクスも連続的に変わっていく。力学系ゲーム では、系に与えられた力学法則とプレーヤーたち 1 x(t) の意志決定によって、ゲームダイナミクスのアト x(t)’ 0.9 0.8 ラクタは固定点や周期、準周期、カオスアトラク Value 0.7 0.6 タになり得る∗8)。 0.5 0.4 2 人以上のゲームでは、他者との協力的なゲーム 0.3 0.2 ダイナミクスを築くことが大切であるが、ここで 0.1 0 0 5 10 15 round 20 25 30 t : round 図5 ここで例として、単純化した凸型木こりジレン *7) つまり、もし全てのプレーヤーが協力して木の成長を十分 問題なのは、他のプレーヤーの戦略の変異に対し てそのゲームダイナミクスがどの程度の安定性が あるのか、ということである。その安定性がこの ゲームにおける協力状態の安定性と直接かかわっ てくる。 に待ってから木を切ると集団としての利得は高くなるが、そ 6 の一方で、個人的な利得のみを考えれば、他のプレーヤーを *8) なお、ゲームダイナミクスはここで見ている木の大きさの 出し抜いて早めに木を切った方がよい、という性質を持って ダイナミクスの他に、各プレーヤーの状態、行動のダイナミ いる。 クスでも見ることができる。 11. 進化シミュレーションの結果の概要 数で作られた戦略たちがほとんどなので、様々な タイプの振る舞いのゲームが見られる。しかし、 木こりのジレンマ世界における協力ルールの形 世代が進行し進化が進むにつれ、木こりたちは木 成・発展のプロセスを見るため、計算機上で「進 を切る頻度を高め、他者を出し抜くことで利得を 化ゲーム」のシミュレーションを行った。つまり、 獲得しようとするようになる。その結果、あまり 適当な戦略をいくつか用意して木こりのジレンマ 木が育たなくなり、木こりが獲得する木材もなく ゲームのランダムマッチトーナメントを行う。こ なってくるので、図で見られるように適応度も徐々 れを 1 世代の戦いと呼ぶことにし、得点の高い戦 に低くなっていく。こういった状況が第 500 世代 略が次の世代に生き残るようにする。この際、一 くらいまで進行し、その後、ほぼ完全な裏切り社 定の確率で戦略に突然変異が起こるようにして、 会になったまま長い世代回復できなくなる。 (協調 戦略のバラエティを広げるようにする。 のルールが形成され、適応度が回復するのは、よ 様々な設定の木こりのジレンマゲームについて、 うやく第 7500 世代くらいになってからである。) 進化シミュレーションが可能だが、本稿では 2 人 では、同じ線形ゲームで、ゲームの人数が 3 人 ゲームと 3 人ゲーム;線形ゲームと凸ゲーム、合計 になった場合はどうなるだろうか。図 6 の右上の 4 つの組み合わせの木こりジレンマのシミュレー 図がその様子を表している。3 人ゲームでは、早 ションを行った。それぞれの組み合わせについて くも 30 世代くらいには完全な木の切り合い状態 3 回ずつの試行を行ったが、それら 3 つのシミュ に陥り、その後協力的な社会は現れない。このよ レーションは本質的に似たような結果を示した。 うに、線形ゲームではゲームの人数が 2 人から 3 以下、それぞれの設定について代表的な結果を一 人になると協力の形成が困難になる。つまり、 「人 つずつ示そう。 数の影響」がそのまま現れる。 次に、2 人凸型ゲームの結果を見てみよう(図 6 2 3 the 500th generation the 30th generation の左下)。2 人線形ゲームの時と同様、シミュレー ションの初期ではゲーム世界が裏切り社会へと向 かい適応度は低くなる。しかし世代が進むと(第 1000 世代あたり)、木こりたちは協力のためのルー ルを段階的に形成・発展させるようになり、適応 度も次第に高くなってくる。協力的社会は何度か 崩壊してはまた形成されるが、最終的に協力状態 図6 図 6 は進化シミュレーションで、最適戦略(一 番適応度が高かった戦略)の適応度(その世代の 全戦いの平均得点)が世代と共にどのように変動 していくかを示している。図中、上側は線形ゲー ム、下側は凸型ゲームの結果であり、また、左側 は 2 人ゲーム、右側は 3 人ゲームの結果である。 まず 2 人線形ゲーム(図 6 の左上)の結果を見 てみよう。この図で、横軸は世代で縦軸は最適種 族の適応度(以下、適応度と略す)である。ゲーム 内容を観察すると、シミュレーション初期は、乱 数理科学 NO. 447, SEPTEMBER 2000 は安定化し(図では第 4000 世代あたりから)、協 力ルールの変化はあるものの裏切り社会へは陥ら なくなる。第 10000 世代あたりの木こりジレンマ ゲームで木の高さの時間平均をみると、だいたい 0.25 くらいになる。 一方、ゲームの人数が増えた 3 人凸型ゲームで は、わりとシミュレーションの早い世代に安定な 協力状態が形成され、その後、裏切り状態に陥る ことはない。第 10000 世代あたりで木の高さの時 間平均をみると、だいたい 0.35 くらいになる。こ のことから、2 人の時より 3 人の時の方がかえっ て木が切られる頻度が低くなっていることがわか 7 る∗9)。 線形ゲームも凸型ゲームも社会的ジレンマのモ デルであることには変わりなく、それゆえ、両タ イプのゲームには間違いなく「人数の影響」が内 在する。しかしここで見たように、凸型ゲームで はゲームの人数の増加が必ずしも悲劇を招かない。 線形写像、凸型写像という木の成長ダイナミクス (a) の法則の違いが、なぜ、上で見たような根本的な 違いを生み出すのだろうか。 その答えは、凸型ゲームにおけるある種の協力 ルールのダイナミクスの安定性にある。 (b) 図8 12. ダイナミクスの効果 戦略の変異とゲームダイナミクスのアトラ クタとの関係 (2人凸型ゲーム):横軸は戦 略パラメータ、縦軸は木の高さのダイナミ クスのアトラクタである。(a) は協力的社 会、(b) は裏切り社会における典型的な例。 「パラメータ摂動に対する協力ルールの安定性」は、 力学系ゲームにおいて協力が成立するための必要 図7 図 7 を見てみよう。この図は 2 人凸ゲームのあ る世代で社会に広がった協力的行動パターン(社 会で支配的な協力のルール)である。この図は二 人のプレーヤーの行動のダイナミクスを表してお り、黒のタイルが「待つ」行動、白のタイルが「木 を切る」行動に対応している。上側の図では、左 から右へ全 400 ラウンドのうち 0 ラウンドから 80 ラウンドの様子が描かれている。この図の一部を 拡大したのが下側の図で、この拡大図から分かる ように、二人のプレーヤーの行動ダイナミクスは 最終的に「切る、待つ、待つ、待つ」という 4 周 期のパターンになっており、さらに、この二人は 変わりばんこで木を切っている(このとき、木の 高さのダイナミクスは 2 周期になっている)。 プレーヤーの戦略が微少に変化してもこの 4 周 期パターンは変化しない (図 8-(a))。こういった 条件である。なぜなら、社会において協力が成立 するためには、 「何が協力であるか」ということに 関する合意が必要であり、その協力ルールが安定 であれば、戦略はそこに向かって進化することが 可能だからである。この種の安定性がない場合、 協力的社会の形成は困難になる ((図 8-(b)))。 一旦、こういった協力的ルールを多くの戦略が 採用していたとしよう。このとき、ある木こりが 裏切って自分だけ木を切る頻度を上げすぎると、 他の木こりも木を切る頻度を上げてゲームダイナ ミクスのアトラクタが一段下のアトラクタにジャ ンプしてしまう場合がある。この場合、結局、裏 切った本人も損をすることになる。つまり、裏切 ることによって利得を上げるのは困難であり、そ の意味でこの協力的ルールは「裏切りに対して安 定」である。詳細は省略するが、木こりのジレンマ 社会におけるこの種の安定性は、突然変異によっ て実現可能な戦略空間内における、「進化的安定 性9) 」によってある程度説明することができる2) 。 *9) このことが「協力度が上がった」ことを意味するかどうか は別にしても、少なくとも、3 人凸型ゲームで協力ルールが 形成されると裏切り社会には非常に陥りにくい、とは言える。 8 戦略の進化により、突然変異によって到達可能 まとめてみよう。 このゲームでは、社会における協力ルールが、 「ゲームダイナミクスの安定なアトラクタ」として 形成され維持される。 (アトラクタが安定なのは当 然だが、ここでいう「安定」とは戦略の変化に対 する安定性である。)プレーヤー間に協調現象が 図9 安定に現れるには、 な戦略空間も変化するが、それとともに社会にお ける協力ルール自体が変化することがある。実際、 2 人凸型木こりのジレンマ生態系では、支配的な 行動パターン(流行)が、例えば、 「裏切り(木の 1. パラメーター変動に対する力学的安定性(力 学的側面) 2. 実質的に実現可能な戦略空間における進化的 安定性(ゲーム的側面) 切り合い)→ 5 周期 → 3 周期 → 4 周期 ・ ・(図 の両者が必要であり、また、協力ルールの変遷(社 9)」のように断続的に移り変わっていく。この種 会の変遷)はアトラクタの間の変遷という形で現 の変遷 (ルールの進化) が起こるかどうかは、ゲー れる。その結果、本研究では、(1) 社会的ジレンマ ム環境の基本設定に依存する。 状況下で、 「時間構造を持つ協力形態」によって悲 劇が回避され得ること、さらに、(2) ゲームダイ ナミクスの安定性による効果が「人数の影響」を (1) (2) 上回るケースがあることが計算機シミュレーショ (3) 40 0 Round 80 図 10 ンによって示された。 実際われわれが、他人と共有の場所から資源を 確実に獲得しようとするとき、われわれは資源の このように、木こりのジレンマゲームでは、協 量のダイナミクスを共同管理する必要がある。こ 力状態の安定性が、戦略の変異に対するダイナミ の場合、管理方法に関して何らかの合意がなけれ クスの安定性に帰着される。ちなみに、3 人凸型 ばならない。その結果われわれは、例えば「資源 ゲームでは 15 周期の協力的ダイナミクス (図 10) をある程度増やして、それから一緒に消費する」 が強力な安定性を持っており、3 人凸型ゲームで とか「資源をある程度増やしつつ、交代で消費す 見られた協力度の高さの理由はここにある。つま る」などの行動をとるだろう。実際の社会的ジレ り凸型ゲームでは「協力的ゲームダイナミクスの ンマ的状況の多くにおいて、このようにゲームの 安定性」の効果が「人数の影響」を上回っている 時空構造を考慮することは悲劇を回避するための のである。 一つのカギとなる。木こりのジレンマゲームのよ 一方、線形ゲームでは、ゲームの力学的な性質 うに力学系ゲームとして社会的ジレンマを記述す から、この手の安定なゲームダイナミクスがごく ることによって、このような協力形態についての 一部しか存在しない。その結果、2 人ゲームより 3 議論が可能になる。 人ゲームでは協力の形成が困難になっている。つ 力学系ゲームによってゲームを記述することの まり、社会的ジレンマの「人数の影響」がそのま 利点はここにある。つまり、力学系ゲームは、個体 ま現れているのだ。 間の相互作用の時間的な側面を明示的にモデルに 記述することができ、それゆえ、ダイナミクスを 伴う資源の管理などに関する問題を自然な形で取 13. まとめ り扱いうことができる。そして、タイムシェアリ 以上、木こりのジレンマゲームについて簡単に 数理科学 NO. 447, SEPTEMBER 2000 ングがカギとなる協力形態の安定性や、協力ルー 9 ルの変遷のメカニズムは、力学系ゲームによる記 述によってはじめて議論が可能となる。 講談社. 16) 高橋亮 (1997),「文化淘汰と協力の進化」日本動物行 動学会 NEWSLETTER 30:27-30. 我々の住むこの世界が基本的に時間的・空間的 な構造と切り離して考えることができない以上、 力学系ゲームのような視点は今後ますます重要に なってくるものと思われる。 参考文献 1) Akiyama E. and K. Kaneko (2000), “Dynamical systems game theory and dynamics of games,” Physica D 147, Issue 3-4, pp. 221-258 2) Akiyama E. and K. Kaneko (2002), “Dynamical systems game theory II – A new approach to the problem of the social dilemma –,” Physica D 167, Issues 1-2, pp 36-71. 3) Axelrod, R. (1984), “The evolution of cooperation,” Basic Books, New York, 松田裕之訳『つきあ い方の科学』HBJ出版 (1987). 4) Axelrod, R. (1997), “The evolution of cooperation,” Princetion University Press, 寺野隆雄訳『対 立と協調の科学』ダイヤモンド社 (2003) 5) Hardin, G., “The tragedy of the commons,” Science 162, 1243-1248. 6) 池上高志 (1999),「ゲーム―駆け引きの世界」東京大 学出版会, 105-144 7) Ikegami, T. and M., Taiji (1999), “Imitation and Cooperation in Coupled Dynamical Recognizers,” Advances in Artificial Life, Springer, 560-565. 8) Joshi, N. V. (1987), “Evolution of cooperation by reciprocation within structured demes,” Journal of Genetics, 66, 69-84. 9) Maynard Smith, J.(1982), “Evolution and the Theory of Games”, Cambridge University Press, Cambridge, 寺本英 訳, ”進化とゲ−ム理論 (闘争の 論理),” 産業図書, 1985. 10) Neumann, J. von and Morgenstern, O. (1944), “Theory of Games and Economic Behavior,” Princeton University Press. Princeton. 11) Rossler, O. E. (1994), “Fraiberg-Lenneberg Speech,” Chaos, Solitons & Fractals, 4-1 125-131, Elsevier Science Ltd. 12) Rapoport, A. (1947) ”Mathematical theory of motivation interaction of two individuals.” Bull. Math. Biophys. 9, 17–27 13) Rashevsky, N. (1947), ”A problem in mathematical biophysics of interactions of two or more individuals which may be of interest in mathematical sociology.” Bull. Math. Biophys. 9, 9-15 14) Ostrom, E., Gardner, R. and J. Walker (1994), ”Rules, Games, & Common-Pool Resources,” Univ. of Michigan Press. 15) 大橋力、猪原真知子、河野正文、河合徳枝 (1985)「宮 脇の水と祭り - 大井八幡連合における自己組織化と 葛藤制御に関する生態学的研究-」季刊人類学 16-2、 10 (あきやま・えいぞう,筑波大学社会工学系)