Comments
Description
Transcript
計算論的神経科学とは
構成 計算論的神経科学の視点から 心理実験をデザインする 大阪府立大学 人間社会学部 牧岡 省吾 1. 計算論的神経科学とは 2. 神経系における学習の仕組み 3. 計算論的神経科学の視点から心理実験 をデザインする 「脳の機能を、その機能を脳と同じ方法で実現 できる計算機のプログラムあるいは人工的な機 械を作れる程度に、深く本質的に理解すること を目指すアプローチを計算論的神経科学と呼 ぶ。」(川人,1996 ) 1.計算論的神経科学とは 具体例として、メンフクロウの音源定位に関す る研究を紹介する。 参考:CogSci2011で のDavid Poepelの講演 特定の方向からスピーカーで音を出すと、 メンフクロウは正確にその方向に顔を向ける。 http://thesciencenetwork.org/ programs/cogsci-2011/governingboard-symposium-with-david-poeppel 小西正一 (1993).メンフクロウの両耳による聴覚情報処理,日経サイエンス6月号より 小西正一 (1993).メンフクロウの両耳による聴覚情報処理,日経サイエンス6月号より 1 メンフクロウは、どのような情報を使って 音源の方向を知覚しているのか? スピーカーを水平方向に動かすと、左右の耳 に入る音に時間差が生じた(左右の耳が身体 の両側についているため) 。 • 考えられる情報源: 左右の耳に入る音の時間差 左右の耳に入る音の音圧差(強度の差) • 小西らは、メンフクロウの耳の中にマイ クを取り付け、各方向の音源からの音を 記録した。 小西正一 (1993).メンフクロウの両耳による聴覚情報処理,日経サイエンス6月号より スピーカーを垂直方向に動かすと、左右の耳 に入る音に音圧差が生じた(左耳は下向きに、 右耳は上向きについているため)。 小西正一 (1993).メンフクロウの両耳による聴覚情報処理,日経サイエンス6月号より 時間差と音圧差の情報を組み合わせると、 音源の方向を特定できる。 小西正一 (1993).メンフクロウの両耳による聴覚情報処理,日経サイエンス6月号より Jeffress(1948)の遅延線モデル • メンフクロウが、時間差と音圧差の情報 を利用して音源定位を行っているらしい ことが分かった。 • これらの情報は、メンフクロウの脳内で どのように処理されているのだろうか? 小西正一 (1993).メンフクロウの両耳による聴覚情報処理,日経サイエンス6月号より 2 メンフクロウの脳内の層状核と呼ばれる部 分に、実際に遅延回路が存在することが分 かった(Carr & Konishi, 1990)。 メンフクロウの脳内での情報の流れ 青の経路: 時間差の処理 赤の経路: 音圧差の処理 小西正一 (1993).メンフクロウの両耳による聴覚情報処理,日経サイエンス6月号より 小西正一 (1993).メンフクロウの両耳による聴覚情報処理,日経サイエンス6月号より 視覚研究者のデビッド・マーは、認知システ ムを理解するための方法は、3つの水準に分 類できると唱えた (Marr, 1982)。 • 計算理論: 三角形の面積を計算する。 • 計算理論:計算の目標は何か、なぜそれが • 表現とアルゴリズム: a.数値表現を使い、底辺 高さ 2の公 式を使う。 b.ピクセル表現を使い、三角形の内部 のピクセルを数える。 適切なのか。 • 表現とアルゴリズム:入出力の表現は何か。 どのような手順で計算するか。 • ハードウェアによる実現:表現とアルゴリ ズムが物理的にどのように実現されるか。 • ハードウェアによる実現: a.そろばんで計算する。 b.コンピュータ上でプログラムを組む。 Marrの提言の意義 • 小西らによる研究では、計算理論におけ る理解が、脳の神経回路の構造と対応づ けられている。 • このように計算理論の水準と実際の脳の 神経回路を対応づけて理解することが、 計算論的神経科学が目指す方向性である。 Marrがその短い人生において提案した立体視のモ デルの一部は、その後、ヒトの視覚系のモデルと しては誤っていることが明らかになった。しかし 彼の提言は、その後の視覚研究の大きな流れをつ くったといえる。 3 神経細胞の反応の例 2.神経系における学習 Hubel (1988) Eye Brain, and Visionより 神経細胞の模式図 神経細胞間の情報伝達 (1) • 神経細胞体の活動電位が高まると、神経 細胞は「発火」状態となり、電気信号 (インパルス)を発する。 • 電気信号は軸索を通して次の神経細胞へ と流れていく。 甘利俊一『神経回路網とコネクショニズム』 東京大学出版会 より 軸索における電気信号(インパルス)の流れ 別冊日経サイ エンス『脳と 心』日経サイ エンス社 より シナプスにおける神経伝達物質の放出 別冊日経サイエンス『脳と心』日経サイエンス社 より 4 神経細胞間の情報伝達 (2) 神経細胞の数理モデル aj • シナプスに電気信号が届くと、神経伝達 物質が放出される。 • 神経伝達物質がの樹上突起の受容体と結 合すると、樹上突起の電位が変化する。 興奮性のシナプスの場合、活動電位は上 昇する。抑制性のシナプスの場合は活動 電位が低下する。 神経細胞の活性度 =活動電位 ai wij 受け手の神経 細胞への入力 の強さ !wwijijaaj j net i = ! j (1) neti = シナプス結合 の強さ (2) a i = j 入出力関数 1 1 + e " neti 平均発火率と発火タイミング • 多くの神経回路のモデルでは、ユニットの活性度 が情報を担う。これは、神経細胞がやりとりする 情報が基本的に平均発火率であると仮定している ことに相当する。 ai = 1 1 + e! neti • 生体の脳内に平均発火率に基づく情報表現が存在 するという証拠は多数ある。しかし一方で、個々 のインパルスのタイミング(発火タイミング)が 情報を伝達している可能性も指摘されている。 神経細胞レベルでの学習(1) 神経細胞レベルでの学習(2) • 学習は、シナプスが信号を伝える割合が変化 することによって生じる。これは の値が wij 変化することに相当する。 • このようなタイプの学習を最初に提案 したのは心理学者のD. O. Hebbだった。 ヘブの学習規則: ij j i • 脳内でこのような学習が実際に行われ ているという様々な証拠が得られてい る。 • 興奮性のシナプスの場合、シナプスの前後の 細胞が同時に発火すると、そのシナプスは強 化される(信号をよく伝えるようになる)。 "w = #a a 5 Hebb型学習の 仕組み 刺激を高頻度(100Hz)で与えるとシナプス構造が 強化され、低頻度(1Hz)で与えるとシナプス構造が 衰退する。 乾敏郎・安西祐一郎 編『イメージと認知』岩波書店 より 神経系における学習の分類 • 強化学習: 神経回路の出力に対して、それがうまくいった かどうかに関するフィードバックが外部から与 えられる。たとえばオペラント条件付けは強化 学習の一種である。教師あり学習では望ましい 出力パタンそのものが外部から与えられるが、 強化学習は出力に関する評価のみが与えられる という点が異なる。 • 教師なし学習: 入力パタンの類似性に基づいて学習を行う。パ タンを分類するための基準は外部から与えられ ない。視覚系や聴覚系の初期段階では教師なし 学習が行われていると考えられている。 • 教師あり学習: 外部から「今はこのように反応すべき」という 教師信号が与えられ、教師信号がなくても同じ 反応ができるように学習する。たとえば単語の 意味の獲得は教師あり学習である。 オペラント条件付け: 生体の何らかの行動に対して報酬を与えることに よってその行動の頻度を増加させるような学習。た とえばラットが偶然にレバーを押したときに餌を与 えると、ラットは頻繁にレバーを押すようになる。 教師なし学習規則の例:Hebb rule 教師あり学習規則の例:delta rule aj aj ai ai wij wij w a !w =!"a j ai (1) neti = ij ij j j (2) a i = 1 1 + e " neti 教師信号 w a !wij = "(t! i # ai )a j (1) neti = ij j 比較 j (2) a i = 1 1 + e " neti 6 バックプロパゲーション法を用いると、3層 以上のネットワークを訓練することができる。 O Reilly(1996)のGenRecアルゴリズム (生物学的に妥当なアルゴリズム) 誤差信号を逆向きに伝搬させる。 O’Reilly&Munakata (2000) より 研究例1:共感覚に関する研究 Makioka, S. (2009). A self-organizing learning account of number-form synaesthesia, Cognition, 112, 397–414." 3.計算論的神経科学の視点 から心理実験をデザインする • 数について考えるときに、数字が特定の配置で並ん でいる心的イメージが強制的に喚起されるナンバー フォームズという共感覚がある。 • ナンバーフォームズは、1)個人内での一貫性、2)個 人間での多様性、3)規則性と不規則性の混在、とい う特徴をもつ。この研究では、ナンバーフォームズ が自己組織化学習(教師なし学習の一種)によって 生じると仮定することにより、これら3つの性質が 自然に導出されることを示した。 Number formsの例(1) Number formsの例(2) 7 SOLA (self-organizing learning account of number forms) 研究例2:単語認知過程に関する研究 Tsuji, Makioka & Tamaoka (進行中)" • 様々な心理実験により、単語の視覚的に認知過程に おいては、Open Birgamと呼ばれる中間的表現が存 在すると考えられている。 シミュレーションの結果の例 単語優位効果 • 単語中の文字は、ランダムな文字列中の文字と 比べて、認知しやすい(瞬間呈示での正答率が 高い)。これを単語優位効果と呼ぶ。 Reicher(1969) の実験 100msec程度 の瞬間呈示 • Open Birgamがどのような種類の学習によって獲得 されるのかを検討中。 • 単語優位効果は、日本語など、英語以外の言語に おいてもみられる。日本語では動詞や形容詞など が漢字仮名まじりで表記されるが、そのような場 合でも単語優位効果がみられるのだろうか? • 実験の結果、単語優位効果が確認された。これは、 日本語の単語認知過程には、漢字とひらがなを組 み合わせた表現が存在することを意味する。 牧岡(2000).漢字仮名混じり語における単語優位効果,神経心理学,16(1),66-72.より 8 Open Bigramが存在する証拠: Perea & Lupker (2003)の実験 Transposed-Letter コントロール条件 (TL)条件 マスク プライム ##### ##### jugde jupte • TL条件では、語彙性判断の反応時間がコ ントロール条件より短い。 呈示時間 500msec • これは、TL条件のプライムは、コント ロール条件のプライムよりターゲット刺 激に「近い」ことを意味する。 80msec ※プライムは 意識的には 知覚できない。 ターゲット judge judge • 少なくとも1文字文程度の文字位置の ずれは許容されているようである。 反応するまで Opinion Open Bigramによる単語の表現 • 以上のような心理実験の結果から、Open Bigramと いう考え方が提案された。Open Bigramは、2文字 の順序を保持しながら、位置のずれをある程度許容 する。 JUDGE: {JU, JD, JG, UD, UG, UE, DG DE, GE} JUGDE: {JU, JG, JD, UG, UD, UE, GD, GE, DE} JUPTE: {JU, JP, JT, UP UT, UE, PT, PE, TE} 高 次 視 覚 野 低 次 視 覚 野 TRENDS in Cognitive Sciences Putative area Coded units Left OTS? (y ! –48) Small words and recurring substrings (e.g. morphemes) Left OTS? (y ! –56) Local bigrams Bilateral V8? (y ! –64) Bank of abstract letter detectors Bilateral V4? Letter shapes (case-specific) Bilateral V2 Local contours (letter fragments) Bilateral V1 Oriented bars Bilateral LGN Local contrasts ※赤はターゲットと異なる部分 Vol.9 No.7 July 2005 RF size and structure 337 Examples of preferred stimuli extent CONTENT En E - + - TRENDS & in Cognitive Sciences Dehaene, Cohen, Sigman Vinckier (2005) Figure 1. Model of invariant word recognition by a hierarchy of local combination detectors (LCDs). The model is inspired from neurophysiological models of invariant object recognition [10,11]. Each neuron is assumed to pool activity from a subset of neurons at the immediately lower level, thus lead to an increasing complexity, invariance and size of the receptive field at each stage (see text for details). Note that only the excitatory components of the receptive fields are sketched here; however, both feedforward (e.g. center-surround) and lateral inhibition are likely to contribute significantly to define selective responses. The anatomical localizations are highly tentative, based on recent neuroimaging studies of the visual word form system [1,31] and their coincidence with a standardized atlas of visual areas [54]. Abbreviations: OTS, occipito-temporal sulcus; LGN, lateral geniculate nucleus; y, approximate antero-posterior coordinate relative to the human Montreal Neurological Institute template. • Open Bigramは左脳の後脳側頭回(37野) に存在すると考えられている。 encompass the entire visual field, but progressively become larger, by a factor of 2 to 3, in parallel to an increase in the complexity of the neuron’s preferred features [10,11]. Figure 1 shows how a neurobiological scheme of increasingly broader and more abstract local combination detectors (LCDs) might achieve invariant word recognition. At the lower level, combinations of local oriented bars can form local shape fragment detectors, which already have some small tolerance over displacements and changes in size. At the next stage, combinations of fragments can then be used to form local shape detectors. These neurons can detect a letter, but only in a given case and shape. Abstract letter identities can be recognized at the next stage, by pooling activation from populations of shape detectors coding for the different upper and lowercase versions of a letter. Because their receptive fields remain small, such letter detectors have a moderate tolerance for changes in size and location. Multiple letter detectors have to be replicated at several locations, thus forming the bank of case-invariant letter detectors postulated in many models. Crucially, the natural subsequent stage is not locationindependent bigram units, but neurons sensitive to local combinations of letters. One neuron, for instance, might respond optimally to ‘N one or two letters left of A, both around 0.5 degree right of fixation’. Given that receptive field size increases by a factor of 2 or 3, neurons at this level might code for short sequences of 1, 2 or 3 letters. However, there is a trade-off here between location invariance, selectivity, and information conveyed. A neuron coding for a triplet of letters can do so only at a specific location. Hence, it conveys very narrow information, useful for only a few words. Conversely, a neuron coding for a single letter at any of three locations is frequently activated but uninformative about relative letter location. Bigram neurons, however, can respond selectively, yet with some tolerance for location of the Open Bigramはどのように 獲得されるのか? • Dehaene et al. (2005)の枠組みは、教師な し学習を示唆。隣接する文字の組み合わせに 関する内部表現が学習される。 www.sciencedirect.com • 日本語は単語間に空白を挟まずに表記される。 もし教師なし学習で獲得されるのなら、単語 をまたいでも、頻度が高いbigramは学習さ れるはず。一方、教師有り学習なら単語内の bigramのみが学習されると予想される。 9 コーパス分析を用いて bigramの頻度を統制 Table 1. 刺激例 Fig.1 実験手続き ※毎日新聞データベース2001-2007を用いて頻度を算出 ※同じ選択肢同士で比較する必要があるため、漢字 条件と疑似漢字条件の正答率を比較する。漢字条件 の正答率が疑似漢字条件より有意に高ければ、 bigramにより正答率が向上したと言える。 Table 2. コーパス中のbigram frequency 歩く 歩と 歩ぬ Table 2. 実験の結果(正答率) Fig.2 疑似漢字条件との差(促進率) 考察と展望 まとめ • 単語内のbigramだけで促進効果がみられた。 これは、open bigramが教師あり学習によっ て獲得されることを意味する。 • 計算論的神経科学は、脳内で行われる計 算の性質を明らかにすることを目指して いる。 • 日本語刺激を用いた最近の研究(Witzel, Qiao, Forster; 2011)もこの見方を支持。 • その方法論は心理実験で問うべき仮説を 導出する際にも有効である。脳内で行わ れる計算の性質について検討するための 心理実験を行うことにより、心的機能に ついて明確な理解を得ることができる。 • 日本語の漢字仮名交じり語でopen bigramが 存在するという直接的証拠を示る必要がある。 10