...

利他的行動・博愛 - Info Shako

by user

on
Category: Documents
26

views

Report

Comments

Transcript

利他的行動・博愛 - Info Shako
「協力行動の進化」

進化ゲーム理論からのアプローチ
キーワード




筑波大学大学院システム情報工学研究科
秋山 英三

利他的行動
群淘汰
血縁淘汰
血縁度
利己的遺伝子






繰り返し囚人ジレンマ
オウム返し戦略
互恵性が成立する条
件
四枚カード問題
エコー効果
N人囚人ジレンマ
2
ダーウィンが解決で
きなかった大問題
利他的行動・博愛


人間の親の子に対する
自己犠牲・献身
ハチ・アリの自己犠牲



ハチの一刺し
働き蜂は不妊


http://www.carolinabees.com/media/img/main/honey-bee-queen-00.png
1960年代までの主流だっ
た考え方

グループ淘汰(動物行動学者
コンラート・ローレンツ)


種族保存のために自己犠牲
を行うための遺伝子(みたい
なもの)がある
有名になった例(やらせ・・):北欧
のレミングの「集団自殺」
進化の理論

人間・生物は進化の産物
である
生きること=適応度を上
げるための 競争
人間社会、生態系のあち
こちで自己犠牲を伴う利
他的行動が見られるのは
なぜだろう?
3
4
1964 進化の理論の革命:
血縁淘汰 (ハミルトン)

血縁者は自分と同じ遺伝子
を持っている


血縁者への自己犠牲
自分の遺伝子を後世に残
すことができる可能性
個体レベルでなく、遺伝子レ
ベルで進化を考える
http://notexactlyrocketscience.files.wordpress.com/2006/09/dna_overview.png?w=79&h=204
6
1
「血縁度 r 」
・・・同じ遺伝子を共有する確率
「血縁度 r 」 ・・・同じ遺伝子を共有する確率

人間など2倍体の生物の場合


親と子の血縁度は0.5
兄弟との血縁度は0.5

父親経由の血縁度
+母親経由の血縁度
子1父子2
1.
2.
–
父

子1の半分の遺伝子を
父が持つ (0.5)
父の半分の遺伝子を
子2が持つ(0.5)
0.5×0.5=0.25


1.
子1母子2
母
1.
2.
–
2.
子1の半分の遺伝子を
母が持つ (0.5)
母の半分の遺伝子を
子2が持つ(0.5)
0.5×0.5=0.25
子1子2
・・・0.25+0.25=0.5
血縁度の求め方
3.
–
配偶者間に血縁がないと仮定
親子の血縁度が0.5の場合を例に
共通の祖先までの系譜を書く
パスの長さがL個なら (0.5)L
パスが複数あるなら、全てのパスの確率を
足す
兄弟の例を再確認
7
8
包括適応度(inclusive fitness)
血縁度:例題




祖父と孫の血縁度は?
答え 0.25
従兄弟との血縁度は?
答え 0.125

自分の適応度 - 利他的行動のコスト
+ 血縁者の適応度変化に関わる項

I=w- c+br

w :自分自身の適応度

c : 利他的な行動を行うコスト

b : 相手が受ける利益(相手の適応度の上昇)

r : 自分と相手との血縁度

遺伝子を共有している人(b)の適応度が上がると(r)
が大きいと、自分の適応度も上がる
9
ハチの例
血縁淘汰






ワーカーは全部メス
I = w - c + b r (自分の適応度 + 血縁者の適

応度)


b:相手の受ける利益、r:血縁度、c:コスト
ハミルトン則

10
ハチは半倍数体

包括適応度が増えるとき利他的行動は広
がる
b r > c なら利他的行動は広がる

 血縁淘汰
11
ただし不妊
女王蜂に一方的な献身
メス 受精卵から
・・・染色体が対になって
る
オス 未受精卵から
・・・染色体が対にならな
い
12
2
ハミルトンにはじまる革命(1960年代~)
ハチの場合



親子 ½, 姉妹 ¾

娘1父娘2
1.
2.


2.


父
母
娘1の半分の遺伝子を父が持つ (0.5)
父のすべての遺伝子を娘2が持つ(1.0)
0.5×1.0=0.5

名付け親: リチャード・ドー
キンス (1976)

「淘汰の単位は「個体」では
なく「遺伝子」である」

娘1母娘2
1.

「利己的遺伝子」説
父が一倍体
血縁度
娘1の半分の遺伝子を母が持つ (0.5)
母の半分の遺伝子を娘2が持つ(0.5)
0.5×0.5=0.25

娘1娘2
・・・0.5+0.25=0.75
姉妹である女王蜂に尽くすの
も遺伝子レベルから見ると合
理的
遺伝子淘汰
「個体レベルで利他的に見
える行動も、遺伝子レベル
では純粋に利己的な行動」
13
14
ハミルトンにはじまる革命(1960年代~)
「利己的遺伝子」説

例)
1.
2.


遺伝子を共有する自分の子供への献身は、自
分の遺伝子を後の世代に残すことに役立つ。
自分の姉妹を産む女王蜂を助ける働き蜂は、
自分で生殖しようとする個体よりも多くの遺伝
子コピーを次の世代に残すことができる。
では、血縁がない者の間
の協力行動は?

特に人間に見られる
個体・個人は、集団のために行動するわけ
でもなく、個体のために行動するのでもな
い。遺伝子の利益のために行動する。
15
囚人ジレンマ
おたがい協力してい
たら、懲役2年で
すんでいたのに・・・
あ
な
た
の
戦
略
「自分の利益」と
「みんなの利益」と
どちらを選ぶかで、
相棒の戦略
ジレンマ
協力
(自白しない)
裏切り
(自白する)
-2, -2
-7, 0
0, -7
-5, -5
左:あなたの利得

右:相棒の利得
囚人ジレンマゲームの結論

解は「二人のプレーヤーの裏切り合
い」
裏切り
(自白しない) (自白する)
協力
囚人ジレンマで協力は無理?

人間や生物は、協力することもあ
る・・・なぜ?


現実の人間関係は、一回きりでは終
わらない。また、様々な人とつきあう
集団で、繰り返し囚人ジレンマゲー
ムの総当たり戦をするとどうなる?

にわかには分からない  実験!
3
進化ゲーム理論による分析
進化ゲーム理論による分析
アクセルロッドの「繰り返し囚人ジレンマ」
アクセルロッドの「繰り返し囚人ジレンマ」

「繰り返し 囚人ジレンマ」のコンテスト

( R. Axelrod 1980)
 様々な分野の研究者に、繰り返し囚人ジレンマを戦
うための、コンピュータープログラムを募集した
 総当たり戦で総得点を競う
「オウム返し戦略」が優勝
(4行のプログラム!)
1.
2.
最初は「協力」する
2回目からは、「前の回に相手
がとった行動」をマネする。
協
裏切り
力
次は
次は
協力!
裏切り
19
オウム返し戦略の強さ
裏切り者
(1)自分から
は裏切らない
協
裏
裏
裏 (2) 裏切られたら
すぐに制裁する。
裏 搾取されない。
協
協
協
協
協
協
協
裏
裏
裏
キーワード
互恵性(お互いに恵みあう)

今日はあなたに協力します。

明日はあなたが私に協力してくれるでしょ
う。
(3) 協力的な人
とは、協力して
協 得点を稼ぐこと
ができる
オウム返し戦略に
よる協力の発生:
例

20
互恵性の進化(ゲーム論+進化論)


第一次世界大戦、塹壕戦の歩兵の行動


長期間の対峙のあとにできた暗黙のルール
自分たちの部隊が現在の標的になっていない限
り、おたがい、相手には発砲しない。
(オウム返し戦略!)
 相手の食事の邪魔になるような攻撃はしない
集団内で繰り返し相手とつきあうような状
況では、


互恵的な戦略が進化できる
その結果、協力的な社会になる可能性があ
ることが(制約条件つきだが)数学的に証明
できる。「進化ゲーム論」
「お互い恵みあう」メカニズムが進化しう
る!
4
A
A
B
B
進化ゲーム理論による分析
A -1 -1
B 7 -6
A -6 7
B 5 5
「オウム返しの協力」は世界に広がるのか?

進化ゲーム理論による分析
2.
A -1 -1
B 7 -6
A -6 7
B 5 5
「オウム返しの協力」は世界に広がるのか?
前提:現実世界のように:
1.
A
A
B
B

相手の前回の行動を考慮する戦略

オウム返し戦略が「進化的安定戦略」であること
が証明できる。(宿題)

様々な相手と、繰り返しつきあうと仮定(終
わりがない)
人間・生物が適応的に振る舞うと仮定(学
習・進化)


(1)全て裏切り (2)オウム返し
 オウム返し戦略により、協力的な社会が形成さ
れ、安定化されうる!
カギとなること = 「オウムは、個々の対戦では、ほ
とんど勝ちも負けもしない。総合得点で勝つ」
全て A-A(利得の時間平均は?)
1回目以外はA-A(利得の時間平均は?)
すべてB-B(利得の時間平均 は?)
25
26
オウム返し戦略の特徴
1.
2.
3.
4.
問題
上品さ(最初は協力する)
短気さ(やられたらすぐやり返す)
1.
寛容さ(相手の協力にはすぐに協力で答
える。それより過去は問わない)
分かりやすさ(シンプルである)
2.
A
B
A
-1
7
B
-6
5
ALLA(常に裏切り), TFT(オウム返し) を2戦略として、
2戦略対称ゲームの利得表を作成しなさい。ただし、
繰り返し回数は n (自然数)とし、利得は全繰り返しの
合計得点とする。(黒板で簡単に説明します)
ALLAがESSであることを証明しなさい。
27
問題(続き)
3.
4.
A
B
A
-1
7
B
-6
5
時間構造:適応のダイナミクスの一つ
「レプリケータ(複製子)ダイナミクス」
TFTがESSであるための n の条件を求めなさい。
TFT のpopulationの頻度が p とする。TFTの期待利得
がALLAの期待利得を上回るための p の条件を求め
なさい。

28
(問題を解いたら、たとえば、n=10の時、どのくらいの値に
なるかを自分で計算して確認してびっくりすること。)
29

dxi /dt = xi [ [Ax] i – (x, Ax) ]


純粋戦略の集合 I = { 1, 2, …, n }
純粋戦略の頻度のベクトル
x = (x1, x2, …, xn ) (Σxi = 1.0 )

適者生存を微分方程式の形で表現(突然変
異は考慮されていない)
30
5
互恵性が成立する条件(1)
「適応」のダイナミクスを見ると・・・
(以下、レポート問題で確認せよ)
 Point 1:繰り返しの回数
1

0.8
dxi /dt = xi [ [Ax] i – (x, Ax) ]
0.6

Point 2:つきあう相手の多さ

コンピュータでの
進化シミュレーション
0.4
「常に協力」戦略
協力に応じる人がグループに尐しでも居れば、オウ
ム返し戦略が広がりうる。


0.2

0.5
1
1.5
2
2.5
3
「人口の割合」の変動(横軸は進化の「世代」)

繰り返しの回数が大きくなればなるほど、(オウム返
し戦略による)協力者が有利になる。
まわりにオウムが多ければ多いほどオウムは得する
まわりに裏切り者がたくさんいても、裏切り者は得しない。
逆に言うと、上記2条件が充分に満たされないと、
相恵利他に基づく協力を形成するのは難しくな
る。
31
32
互恵性が成立する条件(2)


プレーヤーの能力



プレーヤーの能力(1)
個体・個人が、社会の構
成員をお互い認識できる
能力。
お互いの過去の行動をあ
る程度記憶できる能力。
実は、人間以外の動物では、それほど簡
単に例が見つかるわけではない


 比較的高度
トゲウオは、個体認識と対戦成績の記憶を
行っていることが確認されている。(Milinski
and Dugatkin (1987, 1991))
しかし、チスイコウモリの例も含め、これらの
例は、ある意味、Axelrodの発表のあと、探し
回って見つけた例。
33
34
プレーヤーの能力(2)


互恵性を支える能力
親切にしてもらった人には何となく親切
にしないと申し訳ない気がする・・

人間社会ではありふれた概念・習慣:
「義務」、 「借り」 、 「好意」 、 「交換」 、
「約束」 などが成立するのは、実は、そ
れなりの能力が必要
チスイコウモリの大脳新
皮質は、コウモリの中でも
特に大きい。
人間の脳 
Triune Brain model
35
小脳・大脳基底核
36
6
互恵性が成立する群れの大きさ

霊長類と食肉類

互恵性が成立する群れの大きさ(2)
大脳新皮質の大きさ vs 群れの大きさ

新皮質の割合と社会集団
の大きさの間に強い相関
(Dumber1992)
人間の認知能力に適した
社会集団の大きさ


大脳新皮質の大きさ vs 群れの大きさ
約150人らしい
大都市の人間関係が索
漠とする原因?
37
38
四枚カード問題
四枚カード問題
参考) http://homepage1.nifty.com/NewSphere/EP/b/psych_cards4.html

文脈をあたえるとどうなるか


ウェイソンの選択課題
(認知心理学)



A
3
D
6
アルファベットと数字が裏表の4
枚のカード

【母音のカードの裏はいつも偶
数】がホントだと確認するには最
低どのカードをめくればいい?
 よく間違える

【「18歳未満は飲酒禁止」に違
反していない】ことを確かめる
にはどのカードをめくればい
い?
 ほとんど正解する
記号でなく、文脈があればい
いのか?
16 ビ 20
歳 ー 歳
ル
を
飲
む
人
コ
ー
ラ
を
飲
む
人
参考) http://homepage1.nifty.com/NewSphere/EP/b/psych_cards4.html
39
40
進化心理学
四枚カード問題
「人間の裏切り者探知能力」

コスミデスの実験


「社会契約の文脈」を入れると正答
率が上がる


「額に入れ墨がある人しかキャッサバ
を食べてはならない」というルールの
場合?
「キャッサバを食べるのなら、入れ墨
をしていなければならない」といった規
則を破っている人がいないかどうか?
を探すのが人間は得意
「オウム返し戦略」の問題点(1)
キ
ャ
ッ
サ
バ
を
食
べ
る
モ 墨三
ロ が頭
の あの
実 るワ
を シ
食 の
べ
入
る れ
墨三
が頭
なの
いワ
シ
の
入
れ

「現実のプレーヤーは間違える」


「エコー効果」:ちょっとでもゲームにノイズ(出す
手を間違える)が入ると、得点が下がってしまう。
C C D* C D C D ・・・
C C C D C D C ・・・


C = 協力する cooperate
D = 裏切る defect(脱走する、離脱する)
一方、「キャッサバ畑の近くにだけ入
れ墨をした人が住む」といった「文
脈」を与えても結果はいまいち。
参考) http://www.kansai-cs.com/yamagishi-2.htm
41
42
7
「オウム返し理論」の問題点(2)
「オウム返し戦略」の問題点(1)
ノイズの下では、「寛大なオウム返し」戦略が
比較的強い。(Nowak and Sigmund 1992,
1993)


2人囚人ジレンマでいいのか?

プレーヤーの人数が3人以上になる
と どうなる?
裏切りに対して、時々、制裁せずに許す。
しかし、裏切りの進入を許してしまう。


他にもいろいろな研究が進行中。(Win-stay
Lose-shift 1993)
「最適戦略がなにか?」はさておき、2人ジレ
ンマ状況では、互恵的な戦略によりある程度
協調的な社会が実現されることは確認されて
いる(進化シミュレーションなど)


43
44
話は戻って
協力の理論の研究の現状
N人囚人ジレンマ

Nが増えると「協力が困難になる」というこ
とが数学的に証明されている
(Boyd&Richardson 1988)



どうすれば協力を導くことができる?
1.
囚人ジレンマ自体を避けるしかない?

匿名性の問題が出てくる




ただ乗り
2.
同じジレンマ的状況でも、2人ゲームと3
人以上のゲームは根本的に違う
3.
・・・困った。(まだ open problem)
なぜ困る?

 政府,法制度,税金の役割?
コストがかかりすぎる.また,super power が存在しない状
況、たとえば、国と国の間の争いはどうする?
「評判」など、二次的な情報の効果?例)ヤフオク
総当たりでいいの?人間関係のネットワーク構造は
もっと複雑では?
様々な方向への発展  解析的手法の限界
45
46
1
0.8
ジレンマ研究の現状
研究の現状
0.6
0.4


様々な方向への発展
 解析的手法の限界
実験2のレポート
第1ターンでは、同じグループの人がどのくらい点数を寄付す
るか分からなかったので、中間値の3点を寄付した。すると、
他のプレイヤーも同じことを考えていたので
0.2
0.5
1
1.5
2
2.5
3
コンピュータによる数理的分析



(次回紹介)
非線形・空間的な相互作用の
分析
例) 空間構造が入った囚人ジレ
ンマの理論

被験者実験・・認知心理学との結合

様々な分野の知見・様々な手法
 新しい理論の構築

47
経済“学”の「主体」でなく、現実の「主体」を知る
48
8
Further Reading

一般書



ロバート・アクセルロッド「つきあい方の科学
―バクテリアから国際関係まで」
パウンドストーン「囚人のジレンマ」
トリヴァース「生物の社会進化」
49
9
Fly UP