...

こちら - 北海道大学 理学部

by user

on
Category: Documents
8

views

Report

Comments

Transcript

こちら - 北海道大学 理学部
経済と社会の原基:価値をめぐって
松島俊也(北海道大学・理学研究院)
原初のアダムは幸せだったことだろう。エデンの園に一人、食べ物は豊かで手を伸ばせば
手に入った。しかし、それはよろしくない、と神様はイヴを作られた。人間にとって色々と面
倒なことは、どうもそのあたりから始まったようだ。
本稿ではヒヨコを用いた一連の研究を紹介する。孵化間もない動物が備えている経済的意
思決定について語る。研究の背景と経緯、特に古典的採餌理論と利潤率原則については、これ
までの総説 1-5)をご覧いただきたい。ここでは最近の課題に絞る。
1.
社会採餌と衝動性 競争の果てにあるもの
食っていくためにはどうしたら良いか。二つの手がある。額に汗して働くか、他者の富を
奪うか、である。Giraldeau と Caraco6)は、各々の個体が自己の利益を追求しながら群れをなす
状況を考えた。個体は群れの中で戦術を分化すべきであることに彼らは気づき、それを盗み寄
生と名付けた。生産者は餌を探索し、略奪者は餌を得た生産者を探して横取りをする。生産者
は当然のことながら発見した餌のそばにいる。発見者の分け前 (finder’s share) は、略奪者の分
け前より、原則として多い。黒沢明の映画「七人の侍」の描く百姓たちは、結局、最終的な勝
利者となる。
ここで重要なことは、両者が個体ごとに固定した戦略である必要はかならずしもない、と
いうことである。同一個体が状況に応じて二つの戦術を柔軟に使い分ける。生産者が有利であ
れば生産すればよい。生産者が増えれば略奪者であることがより有利になるから、略奪者に姿
を変える。百姓が一皮むけば山賊に化けるのである。二つの戦術は負の頻度依存性によってナ
ッシュ均衡に到るから、どちらの戦術をとっても結局のところ同じ利益に落ち着く。百姓も山
賊も等しい報酬を分け合う安定平衡解が実現する。これが理論の予測する理想郷である。ヒヨ
コの現実も、同様らしい。
動物にとっては、実は近視眼的行為がしばしば最適である 2,3,7)。餌のエネルギー利得 e
を、1 つの餌を処理するための時間 h で割った商、e/h を利潤率と呼ぶ。餌を確率的にしか知
りえない場合、一定以上の利潤率を持つ(つまり、充分に大きくて近い)餌に出会えばそれを
取ること、これだけが長期平均利益率に寄与する。餌の良さを測り取る価値関数として、ヒヨ
コは利潤率を用いると仮定すると、かなりの所までヒヨコの行動を定量的に説明できた。
では、e(大きいこと)と 1/h(近いこと)どちらを優先すべきだろう。略奪者を前にすれ
ば 1/h(近い)である。「略奪される前に取れ」、そのような衝動的行動が、社会採餌の下で
は正しい選択になる。ヒヨコを競争下で 3 日間オペラント条件付けを行った。その後に異時点
間選択テストの結果を調べたところ、確かに衝動性が高まっていた。6 粒の粟を 1 秒間待たさ
れるくらいなら、すぐに手に入る 1 粒を選ぶ、そのようになっていた 8,9)。実際、競争的他者
が隣にいる状況では、たとえ現実に餌は奪われなくとも、線条体ニューロンの報酬予期応答
(参照記憶に基づく応答)は減弱した 10)。ただし、衝動性が高まるためには、餌の量は変動
している必要があった 11)。遅延・競争・変動、この 3 つの要因がすべて満たされた時、衝動
性は発達する。
1
競わせよ。報酬は遅らせ、しかも不確実に変動させて与えよ。ならば、小さな収穫をこま
ごまと追い求めるように育つだろう。その世界ではこれが最適であり、餓死という最大のペナ
ルティーを最小化する手立てとなるからである。
2.
価値はスカラー値かベクトル値か
リスクと利潤率
ヒヨコの腹側線条体(側坐核)ニューロンの活動を調べると、ニューロンごとに e を表す
ものと、1/h を表すものが見つかった 12)。e が大きな餌は良い餌だ。1/h が大きい餌も良い餌
だ。だから全体としては、利潤率 e/h を正しく表現していることになる。ニューロン集団の活
動の和をスカラー値と見るなら、利潤率という価値を表現している。さて、これで良いのか?
リスクということを考えた。株への投資はリスクを伴う。株価は上がるかもしれないし、
下がるかもしれない。上がれば利益を得るが、下がれば損を生じる。上がるか下がるか、確率
的にしか知ることができない。このようなリスクは株の話に限るものではない。野外で採餌す
る動物も同様のリスクに直面している。先に述べた競争的な社会採餌は、その典型的状況であ
る。
大きな餌を求めてリスクを冒すべきか、小さくとも安定な餌を確保して満足すべきか。こ
れが問われる。一般に動物は餌の量、つまり e のリスクを嫌うことが既に良く知られていた
13)。食に安全を求めるのは、動物もかわりがない。そこで考えた。1/h にリスク(予期しえぬ
変動)がある時も、同じようにリスクを嫌うだろうか。もし利潤率 e/h が脳内でスカラー値を
持つ価値関数として計算されているなら、e のリスクにも 1/h のリスクにも同じ様に行動する
はずである。
実際、ヒヨコは e(量)のリスクを嫌った。確率 1/2 で 1 粒か 9 粒か、変動する餌場を与え
た。期待値は 5 粒だ。他方の餌場からは k 粒の餌を常に(確率 1 で)与えた。ヒヨコが両者を
等しく選ぶ等価点を、ヒヨコ自身に発見的に探索させた。k は期待値 5 粒より小さく、約 3 粒
となった。ヒヨコはリスクを嫌うのである。ところが h(近さ)を変動させた場合には、逆に
リスクへの選好性を示した 14)。餌が直ちに得られることは、たとえ毎回のことではなくと
も、ヒヨコにとって大変に魅力的なことであるらしい。この結果は価値関数がスカラー値を取
る、とする仮説を棄却する。せめて、ベクトル量である。では、ベクトル量の価値関数を行為
変数へ投射する関数は、どのようなものだろう。未解決の課題である。
もう一度、社会採餌にもどろう。北海道の 3 種のカラ類を捕獲して、実験室内でリスク感
受性を比べた 15)。ハシブトガラとヤマガラは貯食をするが、シジュウカラはしないことが知
られている。「金持ち喧嘩せず」であろうから、シジュウカラだけがリスク選好性が示すこと
を期待した。悲しいかな、金に困ればギャンブルにもはまるものだ。しかし、結果は異なって
いた。
ヤマガラはリスクを嫌い、シジュウカラとハシブトガラは共にリスクへの選好性を示した
のである。リスク感受性は食性と密接に結びついており、昆虫食と種子食のどちらに偏るか、
そのわずかな違いがリスクへの行動の違いと相関していたのである。冬の北海道では、カラ類
は強い被捕食淘汰圧を受けながら乏しい餌を探索する。その過程で、彼らはしばしば異種混群
をつくる。群れに加わる利益は取りたいが、餌資源を巡る競合は回避したい。そのためにカラ
は近縁種間で食性を分化させ、餌に合わせてリスク感受性をも分化させたのであろう。
3.
労働投資の社会的促進 ワーカホリズムの神経生態学
2
そもそも動物はなぜ群れるのだろう。捕食される危険を稀釈することが第一の理由であ
る。群れの中であなたが襲われれば、私が逃げて生き延びるチャンスが生まれる。クマに襲わ
れた 2 人の狩人にとって必要なことは、追うクマより速く走ることではない。もう 1 人の狩人
より早く逃げることである。群れる理由の第二は、略奪者としての利益を確保することであ
る。発見者の分け前が生産者にとって有利であるため、やはり手短な生産者を襲うほうが、略
奪者は多い餌を確保できる。この二つの理由は、積極的な群れ形成と個体間の運動の同期を促
し、スワーム形成の素過程となる 4)。
80 ㎝ほどの長さの通路の左右に 1 つずつ餌場を設けた。餌場からは 10~20 秒の不定の間隔
で 1 粒ずつの粟を給餌した。ヒヨコを 1 羽で通路に置くと、5~10 秒ほどの短い間隔で二つの
餌場の間を交互に行き来するようになった。明らかに労働投資が過剰だが、これはセロトニン
系の制御下にあった 16)。さらに 2 羽で通路に置くと、ヒヨコたちはほぼ同調し、過剰な労働
投資がさらに増えた 17)。心理学の古典 18)に倣って、これを社会的促進と呼んだ。
当初、報酬の動因(ドライブ)が亢進したものと考えてドーパミン系の関与を疑った。実
際、中脳被蓋の破壊は社会的促進を損なった。しかし選択的にドーパミン系だけを枯渇させた
場合は無効だった 19)。破壊された被蓋の組織像を詳細に検討すると、大脳からの下行路も共
に損傷していることが分かった。鳥の大脳には第一次運動野はない。しかし、弓外套と呼ばれ
る大脳の腹外側の領野は、海馬や中隔等の辺縁系・背側視床や視床下部に加え、中脳被蓋や視
蓋へ広範に投射する。この弓外套を破壊すると、労働投資の社会的促進は強く減弱した 20)。
特に弓外套外側部の破壊が選択的な効果を生んだ。外側部は辺縁系と強く連絡する領野であ
る。
従来、弓外套は哺乳類の扁桃体の一部と相同である 21)と信じられてきた。ところがメンフ
クロウでは、音源定位の聴覚による作業記憶に関わること 22)が示唆された。さらにヒヨコで
は、努力コストに基づく対象選択に関わることが分かった。この部位を損傷すると「努力を払
わずに手に入る小さな餌」への安直な選択が増えたのである 23)。これは哺乳類、特に霊長類
の前頭前野領域の損傷の結果 24)に対応する。扁桃体か前頭前野なのか。鳥の弓外套の対応関
係はまだ確定していない。
4.
ヨハンソンの生物的運動 学習と認知の許容的誘導
他者とはなにか。孵化直後のヒヨコは速やかに、動くものに対して刷り込まれる 1)。この
時、大脳背内側部の広汎な領野で毛細血管内皮細胞の Dio2 発現が亢進し、トリイオドチロニ
ン(T3)の脳内の濃度が増えることが分かった 25)。共同研究者、本間光一先生・山口真二先生
(帝京大学薬学部)の重要な成果である。他方、未処理のヒヨコの大脳背内側部に T3 を投与
すると、学習が強められた。さらに、通常は刷り込みの感受性期を過ぎたとされる孵化後 4 日
以後でも、刷り込みができるようになった。報酬強化色弁別課題の成績も上がっていた。刷り
込みは、その後の学習の扉を開く鍵を与えていたのである。その鍵は甲状腺ホルモンである。
刷り込みは特殊な学習のひとつだ、とする理解は誤りであろう。刷り込みはメタ学習であり、
学ぶことを獲得する過程と考えるべきだ。
では、他者とは学ぶことで初めて分かるようなものだろうか。記憶形成には至らぬ視覚刺
激に曝したヒヨコは、ヨハンソンの生物的運動 26)の画像に対して、強い選好性を示すように
なった 27)。学習に先立って他者理解の原基が備わっているのだ。しかも生物的運動への選好
はあくまで生得的であり、視覚刺激によって誘導されなければ発現しない。これは教示的誘導
ではなく、許容的誘導である。誘導された選好性は、その後の刷り込みを促進した 28)。これ
3
もやはりメタ学習である。従来は高次な認知現象と考えられてきた生物的運動は、原初の記憶
形成の立ち上げに先立っている。では、認知の誘導は記憶と同じように T3 作用を伴うだろう
か。未解決である。
5.
コンコルドの誤信 経済的不合理性の生態的合理性
1960 年代、英仏は超音速旅客機の共同開発を始めた。当初は多く受注したが、経済性や騒
音の問題からキャンセルが相次ぎ、他の航空機会社は開発を断念してしまった。問題はその後
である。商業的に完全に失敗することが分かってからも、英仏だけは開発を続け、2000 年の
事故を受けてようやく運航を停止した。なぜ、早々にやめなかったのか。それまでに投資した
開発費の巨大さが、その後の損失に対して政策決定者を盲目にしてしまったのだ、と理解され
る。埋没費用効果の別称「コンコルドの誤信」Concorde Fallacy の語源となったゆえんであ
る。
動物は人間ほど愚かではないから、すでに払い終えてしまった労働投資、もはや回収する
ことができないコストは、賢く無視するだろう。まずはこう考える。あるいは、人間にも動物
と同じ生態的合理性があるから、「コンコルドの誤信」を示すのだろう。これが別の考えであ
る。ホシムクドリ 29)を用いた研究は後者を示唆する。ヒヨコはどうだろう。
世界に餌は一様分布してはいない。空間的に不均一なパッチをなす。餌もまた生物である
から、群れるべき相応の理由があるのだ。パッチを見つけた採餌者は当初高い利潤率を実現す
る。しかし、自らの採餌そのものが原因となって、やがてパッチの中の餌の密度は下がってい
く。利潤率は逓減し、ここに餌がある蓋然性がなお高いにもかかわらず、合理的な採餌者はこ
こを離脱せねばならぬ。これが Charnov の最適パッチ利用モデルである 30)。古典的な経済学に
おける収益逓減則と、その本質は変わらない。ちなみに資本主義経済は商品を常に陳腐化しよ
うとする。携帯電話の市場が飽和すれば収益が逓減するので、スマホを持ち出す。飽和した市
場を清算し、高い利潤率を再生産しようとするのだ。我々はこれを経済成長と呼んでいる。
Charnov のモデルが意味するところは興味深い。採餌とは探索して見つけ、餌を消費する、
その繰り返しである。世界は不確実だから、探索による餌パッチの発見もまた確率的であり、
労働投資を強いられる。他方、消費は採餌者の決定下にある。逓減のどの時点で離脱をすべき
か、これは採餌者が自由に決定するところである。Charnov は簡単な数学(限界値定理)を適
用することで、前者(投資した労働)が後者(離脱の決定)を規定することを示したのであ
る。餌場の価値は、餌場そのものによって決まるものではない。採餌者が投資した労働量が高
いほど、得たものの価値は高まる。これはアダム・スミス以来の財の労働価値説と相似する。
コンコルドの誤信の基礎はここにある。
ヒヨコでも、探索時の労働投資を操作的に増やしていくと、逓減する餌パッチからの離脱
時間が徐々に延長した(未発表データ)。この最適パッチ利用行動が、ヒヨコにもコンコルド
の誤信を生み出すか、これが次の問いである。また、このヒヨコでの発見に一般性があるか、
ヒトとマウスを対象として検討を始めている。他方、時間差学習(temporal difference
learning、TD 学習)は強化学習の基本理論だが、ヒヨコの基底核にも時間差を算出するアルゴ
リズムが繰り込まれている 31)。TD 学習則が労働価値をどのように表現するか、そのアルゴリ
ズムは何か、考えこんでいる。その先に「コンコルドの誤信」問題の真の答えがあると期待し
ているからである。
4
ただ、少し急がねばならぬ。ヒトを対象とする神経経済学が急速に動物の採餌理論を取り
込み始めている。最適パッチ利用行動に必要な複数の価値関数は、ヒトの背側前部帯状回皮質
にきちんと表現されている 32)、と報告された。その先へと進まねばならぬ。
原初のアダムは幸せだったことだろう。他方、現実のヒヨコは殻を出たときから、世界の
厳しい現実に備えて生まれてくる。生産者と略奪者の戦術を秒単位で切り替えて、過去の報酬
価値のベクトル値を常に更新し続けている。おそらく、エデンには住みえぬ我々も同様だろ
う。経済と社会にはこのような原基があるのだ。ただ、その後のこと、つまり合理性の発達と
進化を問う仕事が膨大に残されている。
実際、この研究は盆栽を育てるような仕事である。何十年もかけて、採餌行動の大きな自
然の美を、ヒヨコという矮小な鉢の上に再現しようと試みた。素朴な自然主義者はこれを偽物
と言うかもしれないが、構わない。我々はただ、現実の核を取り出そうとしたのである。削り
捨てたものも多いがご容赦頂きたい。
引用文献
1) Matsushima T, Izawa E-I, Aoki N, Yanagihara S. Zool Sci, 20: 395-408. (2003).
2) Matsushima T, Kawamori A, Bem-Sojka T. Brain Res Bull, 76: 245-252 (2008).
3) 松島俊也、動物は何を考えているのか、共立出版、pp.98-122 (2009).
4) 松島俊也、Chentao Wen、小倉有紀子、網田英俊、計測と制御、計測自動制御学会、
52: 189-194 (2013).
5) 川森愛、松島俊也、臨床神経科学、中外医薬社、32: 25-29 (2014).
6) Giraldeau L-A, Caraco, T. Social foraging theory. Princeton, Princeton University Press (2000).
7) Charnov EL, Amer Natural, 110: 141-151 (1976).
8) Amita H, Kawamori A, Matsushima T. Biol Lett, 6: 183-186 (2010).
9) Amita H, Matsushima T. Front Neurosci, doi:10.3389/fnins.2011.00101 (2011).
10) Amita H, Matsushima T. Behav Brain Res, 268: 139-149 (2014).
11) Mizuyama R, Uno L, Matsushima T. (2016) Anim Behav, 120: 143-151 (2016).
12) Izawa E-I, Aoki N, Matsushima T. Eur J Neurosci, 22: 1502-1512 (2005).
13) Kacelnik A, Bateson M. Amer Zool, 36: 402–434 (1996).
14) Kawamori A, Matsushima T. Anim Cogn, 13: 431-441 (2010).
15) Kawamori A, Matsushima T. Anim Behav, 84: 1001-1012 (2012).
16) Matsunami S, Ogura Y, Amita H et al. Behav Brain Res, 233: 577-586 (2012).
17) Ogura Y, Matsushima T. Front Neurosci, doi:10.3389/fnins.2011.00091 (2011).
18) Zajonc RB. Science, 149: 269–274 (1965).
19) Ogura Y, Izumi T, Yoshioka M, Matsushima T. Behav Brain Res, 294: 162-176 (2015).
5
20) Xin Q, Ogura Y, Uno L et al. Eur J Neurosci, (2017).
21) Reiner A, Perkel DJ, Bruce LL et al. J Comp Neurol, 473: 377–414 (2004).
22) Knudsen EI, Knudsen PF. Nature, 383: 428–431 (1996).
23) Aoki N, Csillag A, Matsushima T. Eur J Neurosci., 24: 2314–2326 (2006).
24) Walton ME, Bannerman DM, Alterescu K et al. J Neurosci, 23: 6475–6479 (2003).
25) Yamaguchi S, Aoki N, Kitajima T et al. Nature Comm, doi:10.1038/ncomms2088 (2013).
26) Johansson G. Percept Psychophys, 14:201–211 (1973).
27) Miura M, Matsushima T. Anim Cogn, 15: 871-879 (2012).
28) Miura M, Matsushima T. Anim Behav, 116: 171-180 (2016).
29) Kacelnik A, Marsh B. Anim Behav, 63: 245-250 (2002).
30) Charnov E. Theor Popul Biol, 9: 129–36 (1976).
31) Wen C, Ogura Y, Matsushima T. Front Neurosci, doi:10.3389/fnins.2016.00476 (2016).
32) Wittmann MK, Kolling N, Akaishi R, et al. Nature Comm, doi:10.1038/ncomms12327 (2016).
6
Fly UP