Comments
Description
Transcript
資料WG5-1 CiNet 西本様プレゼンテーション資料
総務省省 情報通信審議会 AI・脳研究WG 第5回 2016/4/15 脳研究と⼈人⼯工知能研究の接点: 実験神経科学の視点から ⻄西本伸志 1) 国⽴立立研究開発法⼈人 情報通信研究機構 脳情報通信融合研究センター 2) ⼤大阪⼤大学 ⼤大学院医学系研究科 3) ⼤大阪⼤大学 ⼤大学院⽣生命機能研究科 ⾃自⼰己紹介:専⾨門分野(システム神経科学) (1) ⼤大脳視覚野における情報処理理の理理解(神経⽣生理理学、動物) 神経回路路 ⽪皮質刺刺⼊入型多点電極 (Utah Array) V5/MT野細胞の時空間受容野 (2) ヒト⾃自然認知下における脳活動モデル化と脳情報解読(fMRI、ヒト) A underwater animal text body part face talk person man mist backpacker athlete room structure boat hallway 3rd PC wheeled vehicle car 2nd PC fMRI(機能的磁気共鳴画像) 脳内知覚の映像化 B 脳内意味空間の定量量 text structure car boat wheeled 分野の国際プレゼンス ヒト脳情報の解読/制御分野において⽇日本は⼀一定の国際プレゼンスがある 例例:川⼈人(ATR)、神⾕谷(京⼤大/ATR)、⻄西本(NICT)、… Natureの特集等で分野を代表する 研究例例として度度々紹介(2012-‐‑‒) Google⽶米国本社に呼び出されて 脳情報解読について講演(2015) 前提と概要 脳とは: § 存在が確認されている唯⼀一の汎⽤用知能 § ⼈人⼯工知能が幸せにするべき対象 ↓ 脳研究と⼈人⼯工知能研究が相互参照 することは有益なはず ↓ どうやって? 脳 ↓ ⽰示唆的な実験結果が直近5年年で出てきた ↓ 今⽇日のお話: § ⼀一般(⾃自然)認知を司る脳神経活動の定量量理理解 § 脳内表象と深層学習表象の類似性 § データ駆動型脳神経科学の促進へ 世界 ⼈人⼯工知能 ヒト⾃自然知覚を⽀支える脳情報処理理の定量量理理解 知覚体験 脳活動 high low § 動画視聴中のヒト脳活動をfMRIで連続・全脳3次元記録 § 知覚体験(多次元時空間パターン)と脳活動(多次元時空間パターン)の関係を定量量的に 結ぶ(予測モデルを構築する) ヒト⾃自然知覚を⽀支える脳情報処理理の定量量理理解 知覚体験 脳活動 high エンコーディングモデル デコーディングモデル low § エンコーディングモデル(⼈人⼯工脳) →脳型⼈人⼯工知能を開発するための数理理基盤 § デコーディングモデル(脳活動解読機) →何を感じて/考えて/意図しているかを解読するための数理理基盤 ヒト⾃自然知覚を⽀支える脳情報処理理の定量量理理解 知覚体験 脳活動 high エンコーディングモデル 中間表象 (仮説) 映像、意味、印象、… デコーディングモデル low § エンコーディングモデル(⼈人⼯工脳) →脳型⼈人⼯工知能を開発するための数理理基盤 § デコーディングモデル(脳活動解読機) →何を感じて/考えて/意図しているかを解読するための数理理基盤 初期視覚野脳活動のモデル化とデコーディング (1) ⼈人⼯工脳訓練フェーズ 体験 脳モデル 脳活動 実際の知覚体験 初期視覚野脳活動から 推定した知覚体験 運動エネルギー 表象 (2) 脳活動解読フェーズ 体験 ? 脳モデル 脳活動 (Nishimoto et al., 2011 Current Biology) § ⾃自然知覚下脳活動を運動エネルギー表象を⽤用いてモデル化 § 脳活動を解読することで知覚体験の映像化に(⼀一定精度度で)成功 § 応⽤用例例:画像を空想している時の脳活動から空想内容を推定 想起脳活動に基づくGoogle画像検索索 (Naselaris et al., 2015 NeuroImage) ⾼高次視覚野脳活動のモデル化とデコーディング 体験 ⾃自然⾔言語 アノテーション 脳モデル 脳活動 ⾃自然⾔言語 (word2vec) 表象 (Nishimoto and Kashioka 2015 patent pending; Nishida et al., SfN2015) § ⾃自然⾔言語処理理モデル(word2vec)由来の表象で脳活動モデル化に成功 § 客観的/主観的な知覚意味内容を脳活動から(⼀一定精度度で)解読 § 応⽤用例例:印象評定サービスとして今年年度度にも商⽤用化(株式会社NTTデータに技術移転) wheeled vehicle 3rd PC 脳が持つ世界観(意味空間)を定量量する car 2nd PC 脳内意味空間 (主要3次元) A 動物クラスタ underwater text animal text body part face talk B ヒトクラスタ person car structure man boat wheeled vehicle room mist backpacker talk athlete man face body part 2nd PC B wheeled vehicle athlete 4th PC 乗り物クラスタ backpacker boat hallway car 2nd PC (Huth, Nishimoto, Vu, Gallant, 2012 Neuron) text § 脳内における事物(男、ボート、霧…)間の表現類似度度を定量量化 § ヒト、動物、乗り物等はそれぞれ別クラスタとして分布 car boat § 将来的には:ヒトと接する⼈人⼯工知能が持つべき世界観/常識識の”答え” structure wheeled vehicle 例例:正しいAI「⼈人間どもは動物の⼀一種」 常識識的なAI「⼈人間は動物と違う!」 talk room man underwater animal structure 3rd PC hallway person room 2次元投射 mist face body part mist hallway underwater 視覚経路路階層 深層学習と脳は似ている:階層的表象の類似性 § 脳と独⽴立立に学習した階層的表象が脳と 相同性を持つ(驚きの結果) § ⾃自然認知タスク(画像/動画認識識)最 適化を⾏行行ったら必然的に脳に似る? 深層学習(C3D)階層 Güçlü and van Gerven 2016 (Nishimoto et al., 2014 オープンデータ利利⽤用) 腹側経路路でも背側経路路でも 同様の階層的類似性 (Yamins et al., 2014; Güçlü and van Gerven 2016) § より⾼高次の認知でも同様? § 課題:脳データが少ない データ駆動型脳神経科学とAIの融合を⽬目指して:もっとデータを! § ほぼ全てのヒト脳神経活動データ 個体あたりサンプル数(画像/刺刺激条件数)が10〜~数100程度度 特定の仮説検証が⽬目的 → 汎化が難しい § Nishimotoヒト⾃自然動画視聴下脳活動データ (2014) 個体あたりサンプル数7740(ヒトオープンデータとして世界トップレベル?) DNNのファインチューニングぐらいには使える(Güçlü and van Gerven 2016) § ⽶米国Human Connectome Project (HCP, 2010-‐‑‒2015) 約45億円($40M)かけて1000⼈人以上について10〜~数100サンプル “広い”ビッグデータ → 汎化が難しい/⽅方向性が異異なる § (提案)⽇日本版脳ビッグデータプロジェクト 個体あたり数万〜~数⼗十万サンプルのヒト⾃自然認知/脳活動対応データ 汎化/深層学習に耐える“深い”ビッグデータ → これから必要なデータ 多様な認知機能を対象としたデータ取得とモデル化 視聴覚認知 会話 ゲーム … 個体脳から数10〜~数100時間(数万〜~数⼗十万サンプル) § 多様な⾃自然認知条件下における脳活動と⾏行行動メタデータを従来より1-‐‑‒数桁多く集める (視聴覚認知、会話、ゲーム、学習、購買、創造、SNS、倫倫理理、… ) § 多くの実験系と⼈人員が必要 (例例: MRI 10機/実験運⽤用/データ処理理 → HCP($40M)相当?) § 国研で⼤大規模データ取得を主導、⼤大学で個別の仮説検証 § 究極的には:⾼高次認知 → 判断 → … → ⼈人格のモデル化/再現 最後に:彼らがやること/私たちがやること Googleplex, Mountain View, CA 2015年年6⽉月 Google Researchいわく § 脳神経科学には⾮非常に興味がある § 今のところは⼈人⼯工知能が最優先 § 研究は常に従来の1-‐‑‒数桁上を⽬目指す § 共同研究が出来ないか考える § 今のところGoogleは神経科学と⼈人⼯工知能を 直接関連づけようとはしていない(たぶん) § ただし神経科学者は随時採⽤用している (AlphaGoのHassabis博⼠士も神経科学者) 彼らがやる前にやる and/or 彼らも取らないリスクを取る