Comments
Description
Transcript
1/4 感情モデルに基づく文面解析ソフトウェアの開発 -メール文面からの
感情モデルに基づく文面解析ソフトウェアの開発 -メール文面からの感情分析と返信文例の自動生成- 1. 背景 昨今のネットワークコンピューティングの発達と、高速 CPU や大容量の記憶 媒体を持ったPCの普及により、人間が取り扱う情報の殆どは予め電子文書化 される事が多くなった。この結果、日々の情報をEメールや Web を介してやり 取りする事が容易になり、従来の定型データを基本とする事務処理システムで は扱いが困難とされた「人の戦略的意志」を含む文字情報が大量にネットワー クを行き来する時代となった。 現在、日常会話等の些細な情報からビジネス上の複雑な機密文書までが予め 電子データとして作成され、メールを媒体として各個人のPCに配布されてい る。個人のPCに蓄積されたメールを分析すれば、その個人と他の人間との交 友関係、さらには従事する業務の内容や手順まで把握できる場合もある。従っ て、これらの蓄積データを文字列や文章単位ではなく、その中に含まれる意味 情報を自由に再利用する事ができれば、従来のコンピュータシステムでは扱え なかった属人的な業務ノウハウや経験値を目的別に文書として生成したり、交 友関係のデータベースを出力する事ができる。さらにはスケジュールや重要度 の高い情報を判断して通知する等、頭脳ワーカーの秘書業務的な処理をソフト ウェアで再現する事が可能となる。しかしながら、現時点においては、蓄積さ れたメール文章から人間の交友関係や状況的な緊張度を把握したり、それらを 活用するソフトウェア分野は存在していない。 2. 目的 本ソフトウェア開発の目的は、個人 PC 等に蓄積されたメール等の文字情報を 利用して自動的に、顧客との対人関係データベースに変換する技術や、業務の 重要性やスケジュール的な緊急度を把握してユーザに警告を促すソフトウェア 分野の早期実現を可能にする事である。 本プロジェクトでは、E メールの日本語文章を解釈して意味情報を蓄積し、各 メール文面内に存在する重要度の高い意味情報を抽出して、メール内に登場す る人間関係を分析する事や返信文例の自動生成を行える Windows アプリケー ションを開発した。 3. 開発の内容 3.1. 動作環境 本ソフトウェアは、以下のソフトウェア及びハードウェアの条件を満たす一般 1/4 的な個人 PC1台にインストールする事により、利用が可能となる。 (1)ソフトウェア ・OS: Windows XP シリーズ (2)ハードウェア ・WindowsPC(1台) CPU Intel PentiumⅡ 600MHz 以上 メモリ 256MB 以上、HDD 10GB 以上 3.2. 機能 本ソフトウェアは、人間関係や各人の立場を、メール文章内に含まれる意味 情報を解釈する機能を有する。また、各メールの到着時における送信者や受領 者の感情状態や、その時に各人がどのような行動を取るべきかの分析を行い、 その分析結果及びメール受領者が返信するべきメール文例を生成する。 一般PCユーザー 携帯メールから ・重要事項の抽出 ・返信すべき文面や、 対処すべき作業を分析 ・メール相手の感情状態 を分析 ビジネスメールから 文面を「意味」として把握・蓄積 感情モデルに基づく文面解析ソフトウェア ・Eメール情報を蓄積し人間関係を把握 ・Eメール文面内の意味を解釈し、緊急度、重要度を 持つ内容を人間の感情パターンに沿って導出 図1)開発ソフトウェアの概要 4. 従来の技術との相違 上記の機能を実現する為に今回開発したコア技術は、文章に含まれる意味的 な情報を人間が解釈する時に生じる感情の発生過程をフロイト心理学の概念を 2/4 用いてソフトウェア的に再現する事、及びその結果を、心理学者の R.Plutchik が定義した感情立体モデルに置き換える技術である。 従来の研究では、同じ文面や会話から導出される意味的な重要度は全て同じ 値となる。しかしながら、実際の人間社会において物事の意味は人や主観の置 かれている立場により様々であり、単に文面の中に存在する単語毎に「重要度 の高さ」を設定するだけでは現実社会においてはあまり実用性が少ない。 ソフトウェアで意味解釈や重要度の判断を行う為には、ある程度人間の本能 的且つ基本的な思考及び立場別の行動パターンを用意し、その種類毎の時間変 異における状態の遷移経路を用意しておかなければ、重要度や次の行動を判断 する為の「人の感情」を導出できない。 そこで今回、従来型とは異なる以下の文面解析のコア技術を開発した。 ①【感情の導出と重要性の判断】感情出力機能 人間にとって重要とされる物事をフロイト心理学のリビドーの観点で述べれ ば、現在発生している事象が、自分や主観となる物の生命維持や生殖活動にと って有利か不利益に結果として作用する場合を指す。この本能的な価値判断を ロジック化する事により、同じ文面によって与えられる情報でも、主観の置か れている立場によって情報の重要度は異なるものとなる。 ②【立場の判断と未来予測】社会的意味モデルの表現 主観の置かれている立場は、意味表現の従来手法である意味ネットワークをフ レーム表現する事で実現可能だが、本プロジェクトではこれを人間の基本行動 パターンである「利用」、「共生」、「敵対」で分類し、全てに時間変異における 状態遷移の経路を予め準備する形で設計した。フロイトの定義する生命体の行 動意志やパターンは、生命維持や生殖に関わる単純な行動回路から成り立って おり、この観点で物事を分類すれば人間の行動パターンはそれほど複雑ではな くなる。実際に人間の置かれている立場や行動は、本能的観点から見れば生命 維持や生殖における優位性確保に向けて、5つ程度の行動パターンを組み合わ せて実行しているにすぎないと本ソフトウェアでは仮定している。 ③【言葉辞書、社会的意味辞書、感情心理辞書】知識ベース 日本語の構文解析手法については既存の最長一致法等を応用したロジックに より実現したが、②で述べた5つの行動パターン(処理手続き)とその時間遷 移まで表現する知識辞書は既存の物が存在しない為、今回新規に言語辞書、社 会的意味辞書を作成し、これらが表現する意味ネットワークを保存可能な専用 DBMS を開発した。また、これらと R.Plutchik の感情立体モデルを結ぶ感情心 3/4 理的意味辞書も新規に作成し、現時点で登録が完了している 3000 単語を使って の会話文章を前提とした。 5. 期待される効果 本プロジェクトの成果を発展させることにより、次の用途が考えられる。 ・ メール等から得られる意味情報を整理してデータベース化。 ・ ユーザーからのメールによる指示を解釈して蓄積情報の照会。 ・ 音声認識技術との組み合わせによる、家庭用ロボットの頭脳への適用。 6. 普及(または活用)の見通し 2008 年度末までに、以下の3点の実現に向けて機能拡張および普及に努める。 外出先からオフォスの パソコン内の 情報が取り出したい 電子人格秘書に メール文章で指示 電子秘書 指定のビジネス情報や緊急 情報をサマリーして送信 外出先 オフィス 図2)電子人格秘書としての発展および活用のイメージ ・電子人格秘書が新規のソフトウェア分野として認知される事。 ・携帯電話やモバイル機器の「メーラー」を、そのまま業務PCの情報端末と して PDA 的に利用する方法が一般化する事。 ・家庭用ロボットの頭脳ロジックとしてハードウェアメーカーに採用される事。 7. 開発者名(所属) ・小日向広寿(合資会社 IntelliMark 新規事業開発部) ・桑原美香(合資会社 IntelliMark 新規事業開発部) (参考)開発者 URL http://www.intellimark.co.jp 以上 4/4