...

認知モデリングに基づく高齢者支援の試み

by user

on
Category: Documents
11

views

Report

Comments

Transcript

認知モデリングに基づく高齢者支援の試み
認知モデリングに基づく高齢者支援の試み
Supporting the Elderly based on Cognitive Modeling Approach
森田純哉 1∗
平山高嗣 2
間瀬健二 2
山田和範 3
1
名古屋大学未来社会創造機構 1
Institute of Future Innovation 1
2
名古屋大学情報科学研究科 2
Graduate School of Information Science 2
3
パナソニック株式会社 3
3
Panasonic Corporation 3
1
2
Abstract:
The research field of Intelligent Tutoring System (ITS) has so far developed an
approach based on cognitive modeling to trace learning process. In our study, we apply this to
support the elderly. We constructed an image recommender system comprising an ACT-R model.
We built the model using a private photo library, and ran a simulation manipulating the activation
noise of the declarative chunks. The noise was found to strongly influence the memory retrieval.
When the noise level was low, the model retrieved a few memory items that occurred recently. On
the other hand, when the noise level was high, the retrieval process was like a random walk over a
memory network, with frequent recalls of old photos. The results suggest a condition of an ACT-R
model can facilitate mental time travel into the distant past.
1
1.1
はじめに
知的学習支援と高齢者支援
知的学習支援の一環として,認知的状態をモニタリ
ングし,教示に対する反応を予測する学習者モデルが
研究されている.たとえば,認知チュータと呼ばれる一
連のシステム [2] は,認知アーキテクチャをベースとす
る学習者モデルを含む.認知チュータが用いる ACT-R
(Adaptive Control of Thought-Rational [1]) は,認知
心理実験を再現する数多くの認知モデルに用いられて
きた.こういった認知モデルベースのアプローチをと
ることで,認知チュータは,学習場面における認知プ
ロセスのトレースと誘導を可能にしている.
一方,高齢化の進展を受け,高齢者の心身機能の維
持を狙う研究が近年盛んに行われている.短期記憶の
維持を狙う認知トレーニング,情動機能の安定を狙い
つつ認知機能全般の回復を狙う回想法などの試みであ
る.学習を,
「経験を通した行動の変容」,
「人のあらゆ
る活動に伴って現れる遍在的な活動(先進的学習科学
と工学研究会 Web サイト)」と捉えるなら,高齢者支
援の営みは,知的学習支援の枠に含まれる.
∗ 連絡先:名古屋大学未来社会創造機構
〒 464-8603 名古屋市千種区不老町
E-mail: [email protected]
上記の考えに基づき,著者らは,知的学習支援の研
究で進められてきた認知モデルベースのアプローチを
高齢者支援へ拡張することを試みている.本稿では,は
じめに著者らの目指す高齢者支援の枠組みを示す.そ
の後,その枠組みの要素技術となる認知モデルを説明
し,予備的なシミュレーションを示す.
1.2
健康長寿力モデルとしての ACT-R
著者らの狙いは,高齢者の「健康長寿力」をモニタ
リングし,ケアすることである.一般的な用語を用い
れば,人間の健康は,知力・気力・体力という 3 つの
「力」に支えられていると言える.これらの力は,知力
を認知機能(大脳皮質),気力を情動機能(辺縁系・基
底核),体力を身体機能(自律神経系・循環器系)と
置き換えることができる.近年の神経科学や生理心理
学の分野では,上記 3 つの機能が相互に密接に関係し
合うことが指摘されている [4].よって,著者らは,こ
の 3 つの機能を調和した形で保つことが,高齢者の健
やかな生活に必要と考えている.
ACT-R は,健康長寿力を構成する 3 つの力のうち,
知力のモデル化に最適な選択といえる.先に述べたよ
うに,ACT-R は数多くの認知科学研究で用いられてき
た.また,生理学的にいえば,ACT-R は,大脳皮質と
基底核のループ構造をモデル化しており,強化学習的
な意味での気力をモデル化する.さらに,ACT-R は,
近年,自律神経系のモデルとの接合が試行され [5],身
体と認知の関係のモデル化を可能にしている.
1.3
モデルベース回想法
対象課題として,回想法などで行われている自伝的
記憶の振り返りに焦点を当てる.自伝的記憶の振り返
りは,ときに関連する記憶を連続的によびおこすメン
タルタイムトラベルと形容される意識状態を引き起す
[11].輝かしい過去を追憶することで,ポジティブな感
情が呼び起こされるとも言われる [10].
最近のデジタル環境では,ユーザの自伝的記憶が,ラ
イフログとして記録される.ライフログのなかでも写
真は,記憶の振り返りに有効である.写真を用いた自
伝的記憶の心理学研究,心理学研究を応用したデジタ
ルフォトアルバムの研究もなされている [8].さらに,
近年では SenseCam などの先端的なデバイスを使った
記憶支援もなされている [6].
こういった背景から,著者らは,ACT-R を組み入れ
た写真スライドショーを開発している.ACT-R を用い
ることで,ユーザとなる高齢者のパーソナルな思い出
のモデルを構築する.そのモデルによって,写真に対す
る高齢者の反応を予測しつつ,記憶を活性化させ,気
力を充実させ,外出へ誘導する写真を提示していく.
図 1 は,実装中の写真スライドショーの構成を示し
ている.写真はコンシューマ向け写真管理ソフトに格
納される.後述するプロトタイプでは,iPhoto 9.5 が
用いられる.iPhoto のメタデータ,および写真に対す
る画像処理によって,写真の情報を記号化したデータ
ベースを構築する.写真の表示は,Web サーバによっ
て制御される.Web サーバが ACT-R のプロセスのト
リガーを引き,ACT-R からのレスポンスを得ること
で,写真をブラウザに連続提示する.
この状況は,ユーザがブラウザの写真を観察すると
同時に,ACT-R が同一の写真を観察し,次の写真を
検索する状況に対応する.ここで ACT-R のプロセス
がユーザのプロセスをトレースできているのであれば,
ACT-R によって検索される写真は,同調メカニズム [3]
によって,ユーザにポジティブな効果を与えると期待
できる.さらに,ユーザに同調しつつも,高齢者が自
発的には思いつきづらい写真を提示することで,知力
や気力を望ましい状態へ導くことも可能になる.
こういった仕組みを実現するためには,(1) ユーザの
記憶をトレース可能なモデルを構築する,(2) ユーザ
からのフィードバックによってモデルを調整するとい
う 2 つの課題がある.本稿では,前者の課題に焦点を
あてる.すなわち,組み込まれるモデルにおいて,心
図 1: 写真スライドショーの構成
理的に妥当な写真検索が起きるかを検討する.ユーザ
の追憶を誘導する(引き込む)ためには,ACT-R 自身
がメンタルタイムトラベルを経験できなければならな
い.メンタルタイムトラベルのできるモデルは,どう
いった条件を備えるのだろうか.
2
ACT-R モデル
本研究では,ACT-R の視覚モジュール,宣言的モ
ジュール,プロダクションモジュールを用いることで,
写真を知覚し,関連する写真を連想検索するモデルを
構築した.学習として,サブシンボリック学習を取り
入れる.
2.1
視覚モジュール
ACT-R は,仮想的なディスプレイ(AGI: ACT-R
Graphical Interface)と相互作用する視覚モジュール
をもつ.しかし,ACT-R の視覚モジュールは,画像を
直接認識できない.AGI に置かれる要素(ボタン,テ
キストなど)は,事前に記号化されている必要がある.
本研究では,知覚系への入力として,既存の画像処理
エンジンの出力を用いる.近年の写真管理ソフトの多く
は顔検知モジュールをもつ.また,Human-in-the-loop
的なトレーニングによって,検出された顔に対する個
人認識を行わせることもできる.本研究では iPhoto に
付属するこれらの機能を用いる.
これに加え,本研究は,写真が写すシーンを解析する
ために,ReKognition API (https://rekognition.com)
を用いる.ReKognition API は,Deep Learning ベー
スの認識エンジンとされている.写真の画像特徴と,山,
海,食べ物などのシーンタグの結合が学習されている.
上記の認識技術によって抽出される人とシーンに関
する情報を,AGI の 2 次元空間に配置する.例えば,
図 1 の写真は以下のようにコーディングされる.
(setf *photo-struct*
’(("QM7QZbQMSNSxq4oS7CbSlA" 10 10 BLUE)
("text" 0 430 GREEN)
("cloth" 128 430 GREEN)
("face" 256 430 GREEN)
("girl" 384 430 GREEN)
("crosswordpuzzle" 512 430 GREEN)
("face4701" 91 245 RED)))
この例で,*photo-struct*は 7 つのリストから構成さ
れている.各リストの第一要素が AGI に配置されるテ
キスト,第 2・第 3 要素はテキストを配置する AGI の xy
座標,第 4 要素はテキストの色を示している.色はタ
グの種類に応じている.BLUE は写真 ID,GREEN は
ReKognition API によるシーンタグ,RED は iPhoto
データベースにおける人物 ID を示している.写真 ID
は,写真にシーンや人以外の固有情報が含まれると考
え,AGI に並べる.
2.2
宣言的モジュール
ACT-R の宣言的知識を構成する要素はチャンクと呼
ばれる.本研究では,チャンクを What 属性,Who 属
性,Where 属性,When 属性の観点から記述した.こ
れらの属性は,[12] による自伝的記憶の研究を参考に
している.以下,各属性の実例を示す.
2.2.1
Who 属性
写真に写る人を示す.iPhoto の顔認識を用いること
で,以下のチャンクを付与した.
2.2.3
どの場所で撮影された写真か示す.Exif にジオタグ
が付与されていれば,場所に関する情報をチャンク化
することは容易である.ただし,緯度と経度の連続値
をそのまま ACT-R に搭載することはできない.本研究
では,x-means によるクラスタ分けによって位置情報
を記号化した [7].この手法は,情報量の観点で最適化
されたクラスタ数が自動的に求まることに利点がある.
クラスが定まれば,Where 属性は以下のようにチャン
クにできる.
(p-*** isa geo-data photo <<GUID>> class g2)
チャンク中の g2 は x-means によるクラスタ番号を
示している.このチャンクを用いることで,現在の写
真と同じクラスの写真を検索する.
2.2.4
(p-*** isa time-data photo <<GUID>> class t3)
2.2.5
2.2.2
What 属性
何を写した写真であるかを示す.本研究では,ReKognition によるシーン認識の結果を用いる.Who 属性と
同様,以下のチャンクを構築した.
(p-*** isa scene-data text "s-car" scene s-car)
(p-*** isa include-scene photo <<GUID>>
scene s-car)
上のチャンクによって AGI に写るシーンが認識され,
下のチャンクによってシーンを含む写真が検索される.
When 属性
Where 属性と同様,Exif から撮影日時を取得できる.
これを元に写真の時間情報を ACT-R の宣言的知識に加
えることができる.本研究では時間情報を,上記 Where
属性に対する x-means で出力されたクラス数を k とす
る k-means によってクラスタリングした.これにより,
When 属性と Where 属性は等しい粒度を持つことに
なる.
(p-*** isa face-data text "f738" face f738)
(p-*** isa include-face photo <<GUID>> face f738)
1 つめのチャンクは AGI に表示される文字列,”f738”
が人物 ID の 738 を表すことを示す.2 つめのチャンク
は,GUID で識別される写真に f738 の人物が含まれる
ことを示す.1 つめのチャンクは,AGI 中の顔を認識
するために用いられる.2 つめのチャンクは認識され
た顔が含まれる写真を検索するために用いられる.
Where 属性
宣言的パラメータ
ACT-R において検索の成功確率は,チャンクの活性
値によって定まる.チャンク活性値は,ベースレベル
活性値,活性化拡散値,部分マッチ,ノイズを項とす
る多項式によって決定される.本研究では,このうち,
ベースレベル活性値とノイズを項とした.また,ベー
スレベル活性値は,ACT-R に実装される以下の簡易版
の式により定義した.
Bi = ln(n/(1 − d)) − d ∗ ln(L) + βi
(1)
n はチャンク i の出現回数,L は,チャンクが生成
されてからの時間,d は減衰率,βi はオフセット値を
示す.この式の第一項により学習のベキ乗則,第 2 項
により忘却のベキ乗則が再現できるとされる [1].本研
究では,自伝的記憶をシミュレートするモデルを構築
するために,L を写真の撮影時刻を利用して設定した.
AGI のテキストとシーンや顔の関係を記述するチャン
クは,そのタグの出現回数に応じた値を n に割り当て
た.写真の ID を含むチャンクは,出現回数を 1 とした.
プロダクションモジュール
3
3.1
シミュレーション
データセット
本研究では,予備的なシミュレーションとして,第一
著者が私的に保持する写真 3202 枚を利用した.これら
の写真は,本研究のために選択したものではなく,第
一著者が私生活の中で撮影した,あるいは第一著者が
参加したイベントにおいて他者が撮影し,譲渡を受け
るなどしたものである.2015 年 1 月 1 日時点で利用可
能な全ての写真を対象とした.撮影時にデジタル化さ
れていたものだけでなく,フィルム写真についてもス
キャナで取り入れ,手作業で場所と日付の情報を入れ
てある.
150
100
Frequency
200
図 2: モデルのプロセス
50
モデルは,ブラウザに表示されている写真と関連す
る写真を宣言的記憶から検索し,検索された写真をブ
ラウザに表示する.つまり,自身の検索した写真が次
の手がかりとなり,写真検索を繰り返してく.このプ
ロセスは,イベントに関する記憶を自由連想していく
ことに対応する.
図 2 にモデルの持つルールを示す.ルールは矢印で
結合された複数の独立したプロセスを構成する.各プ
ロセスが終了した時点で,ゴールバッファの state ス
ロットが start に切り替えられ,新たなプロセスが選
択,開始される.プロセスの選択は,先頭のルールの
IF 節に記述される条件によって制御される (図中では,
When... と表示).条件が共通していた場合,競合解消
によりプロセスが選択される.ACT-R による競合解消
は,ルールに付与されたユーティリティの比較によっ
てなされる.本研究では,全てのルールに対して同じ
ユーティリティの値を設定した.将来的には,ここに
ユーザからの反応に応じた強化学習を取り入れる予定
である.
一番上のボックスは,写真から顔,シーン,写真固有特
徴を認識するフェーズである.Start-perceive ルールに
より,AGI の文字列がランダムに選択される.選択され
た文字列に対応するチャンクが宣言的モジュールから検
索され(perceive-photoID,Perceive-scene,perceiveface),モデルが認識する (photoID-to-goal, scene-togoal, face-to-goal).写真に直接現れない時間と場所の
情報は,photoID がゴールバッファに格納された後に,
認識できるようになる(図 2 中段のボックス).一番下
のボックスは現在の写真と関連する写真を思い出すプ
ロセスである.Who 属性,What 属性,Where 属性,
When 属性のそれぞれの観点から,現在の写真と共通
する属性を持つ写真が検索される.
0
2.3
1977
1981
1985
1989
1993
1997
2001
2005
2009
2013
Years
図 3: データセット中の写真の時間分布
写真は,iPhoto で管理されており,検出された全ての
知人の名前が入力され,全ての写真について,ReKognition API によるシーン認識の結果を得ている.日付
は,1977 年から 2014 年 12 月 13 日までの範囲である.
図 3 に,撮影時間によってライブラリに含まれる写
真枚数を分類した結果を示す.撮影時間の軸上で,写真
の枚数は大きく偏っている.この偏りは,デジタルカメ
ラの入手,カメラ付き携帯電話の入手,個人的な生活
の変化と関係している.在外研究や数回の引越,結婚,
子供の誕生など,環境の大きな変動がおきたときに多
くの写真が撮影されている.本研究で扱うのは,あく
まで単一事例ではあるものの,時間を遡ることによる
記憶項目数の減少,技術進歩による記憶手がかりの上
昇,ライフイベントに応じた記憶手がかりの上昇など
は,ある程度,普遍的なものといえるだろう.
300
1977
1981
200
101
151
1977
201
パラメータ設定
ACT-R の組み込み関数 (mp-process) を用いること
で,モデルのシミュレーション時間を,2015 年 1 月 1
日 00:00:00 に設定した.データセットに付与された時
刻設定と組み合わせることで,現実世界と対応した記
憶検索のシミュレーションを行うことができる.各写
真の提示時間を 3 秒とし,写真 1,000 枚を検索した時
点でシミュレーションを終了した.
操作パラメータとして,宣言的記憶の活性値に付与さ
れるノイズ (:ANS) を選択し,0.2 と 1 を比較した.他の
パラメータは,decay rate を 0.5,Base Level Constant
(:BLC) の値を 15 とした.
結果
検索された項目の分布
2 つの条件で検索された項目の頻度分布を図 4 に示
す.図の横軸は,検索された頻度による写真の順位を
示している.図から,低ノイズ条件の分布が大きく偏っ
ていることがわかる.つまり,この条件では,特定の
項目が繰り返し検索された.この結果は,ACT-R の記
憶が,学習のベキ乗則に従うことと整合的である.式
1 に示されるように,ベースレベル活性値は,参照回
数 n に伴って増加する.そのため,一度検索された写
真は,将来にも検索される確率が高くなる.それに対
し,高ノイズ条件の分布は,一部の写真への偏りが観
察されるものの,多くの写真が検索されたことがわか
る.検索された写真の数は低ノイズ条件が 22 であった
のに対し,高ノイズ条件は 171 であった.
4.2
1997
Years
2001
2005
2009
2013
2005
2009
2013
Frequency
0
150
0
51
図 4: 検索された写真の頻度分布
4.1
1993
(b) :ANS = 1.0
1981
Rank Order of the Retrieved Photo Items
4
1989
:ANS=1.0
1
3.2
1985
:ANS=0.2
100
Freaquency
400
Frequency
0 400
(a) :ANS = 0.2
検索された写真の撮影時刻
検索された写真の分布を,写真が撮影時期の観点か
ら検討した.図 5 は,検索された写真の頻度を,撮影
1985
1989
1993
1997
Years
2001
図 5: 検索された写真の時間分布
時期に分けてカウントした結果である.図 5a から,低
ノイズ条件で検索された写真の大多数は,過去半年以
内に撮影されたものであったことがわかる.この結果
は,忘却のベキ乗則と対応する.式 1 に示されるよう
に,ベースレベル活性値は,時間の経過によって減衰
する.それに対して高ノイズ条件は,最近の写真に加
え,比較的古い写真(2010∼2011 年)も多く検索され
ている.この時期は,図 3 において多くの写真が蓄積
されていた時期と対応している.
5
考察
シミュレーション結果は,まずノイズによる記憶探索
の広がりを示した(図 4).さらに重要なことは,記憶
探索の拡大の中で,古い写真の検索が起きていたこと
である(図 5).この結果は,ノイズの付与により,活
性値の高い記憶による古い記憶のブロックが外れ,元
のデータセットの構造を反映した検索が生じたと解釈
できる.つまり,本研究のシミュレーションが示すの
は,記憶のネットワークをランダムに遷移することに
よる古い記憶の想起である.
こうした結果を踏まえれば,メンタルタイムトラベ
ルを生じさせる一つの条件は,ノイズの設定と考える
ことができる.ここで生じる疑問は,ノイズの意味であ
る.認知アーキテクチャに関する近年の研究では,アー
キテクチャのパラメータを,情動の観点から説明する
提案がなされている.それらの提案で共通する考えは,
情動がパラメータの調整器となっているということで
ある.特に,宣言的記憶のノイズについては,覚醒度
やストレスと対応づける議論がなされている [9].
ノイズパラメータに関する議論から導かれる本研究
の示唆は,メンタルタイムトラベルは,覚醒度の高い
とき,集中しているときには起きないという予測であ
る.また,アプリケーションとしては,脈拍計や脳波
計などを介することで,ACT-R のノイズパラメータ
をリアルタイムに調整していくこともできそうである.
これは,先行研究 [5] において行われている生理モデル
の利用を実際の人間に置き換える試みとも言える.
6
結論
本研究では,ACT-R を組み入れた写真スライドシ
ョーを構築するために,実写真を搭載したシミュレー
ションを行った.最終的な目標は,認知モデルによる
モニタリングとケアを組み入れた高齢者支援システム
を構築することである.加齢により低下する能力を改
善しようという努力は,知的学習支援の研究としても
意味があると考える.
なお,本研究は,著者らによる高齢者支援の取り組
みの第一歩であると同時に,ACT-R による初の人生に
渡る自伝的記憶のシミュレーションである.他のモデ
ルのフレームワークにしても,本研究のように実デー
タを扱ったシミュレーション研究を知らない.そのた
め,今後検討すべき多くの課題が残されている.
まず,扱うデータの充実が不可欠である.今回利用し
たデータセットは第一著者のものに限られていた.本
研究の背景を踏まえれば,より長い人生の記録を持つ
高齢者のデータを収集しなければならない.モデルの
妥当性を検証するための心理学的な実験も必要になっ
てくるだろう.
本研究のモデル構成に対しては,検討が必要な課題
が多く残されている.ReKognition API を利用するこ
との妥当性,場所と時間のクラスタリングの適切さ,パ
ラメータ設定の功利性などである.これらの課題を解
決していくことは,より妥当なユーザモデルの構築に
必要なことだろう.
謝辞
本研究は独立行政法人科学技術振興機構 (JST) の
研究成果展開事業「センター・オブ・イノベーション
(COI) プログラム」の支援によって行われた.
参考文献
[1] J. R. Anderson. How can the human mind occur in the physical universe? Oxford University
Press, New York, 2007.
[2] J R Anderson, C F Boyle, and B J Reiser. Intelligent Tutoring Systems. Science, Vol. 228, No.
4698, pp. 456–462, 1985.
[3] T L Chartrand and J A Bargh. The chameleon
effect: The perception-behavior link and social
interaction. Journal of Personality and Social
Psychology, Vol. 76, No. 6, pp. 893–910, 1999.
[4] AR Damasio. Looking for Spinoza: Joy, sorrow,
and the Feeling Brain, 2003.
[5] C. L. Dancy and F E Ritter. Using a cognitive architecture with a physiological substrate
to represent effects of a psychological stressor on
cognition. Computational and Mathematical Organization Theory, in-press.
[6] A R Doherty, C J A Moulin, and A F Smeaton.
Automatically assisting human memory: A
SenseCam browser. MEMORY, Vol. 19, No. 7,
pp. 785–795, 2011.
[7] T Ishioka. An expansion of X-means for automatically determining the optimal number of clusters. In Proceedings of International Conference
on Computational Intelligence, 2005.
[8] T. C Ormerod, J Mariani, N J Morley, T Rodden,
A Crabtree, J Mathrick, G Hitch, and K Lewis.
Mixing Research Methods in HCI: Ethnography
Meets Experimentation in Image Browser Design. In EHCI-DSVIS 2004, pp. 112–128, 2005.
[9] F E Ritter. Two Cognitive Modeling Frontiers.
Transactons for the Japanese Society for Artificial Intelligence, Vol. 24, No. 2, pp. 241–249,
2009.
[10] C Routledge, T Wildschut, C Sedikides, and
J Juhl. Nostalgia as a Resource for Psychological
Health and Well-Being. Social and Personality
Psychology Compass, Vol. 7, No. 11, pp. 808–818,
2013.
[11] E Tulving. Memory and consciousness. Canadian
Psychology/Psychologie canadienne, Vol. 26,
No. 1, pp. 1–12, 1985.
[12] W Wagenaar. My memory: A study of autobiographical memory over six years. Cognitive
Psychology, Vol. 18, pp. 225–252, 1986.
Fly UP