...

PDF 0.24MB

by user

on
Category: Documents
22

views

Report

Comments

Transcript

PDF 0.24MB
意味ネットワークを用いたシナリオベース対話システムの研究
Study of Scenario-Based Dialogue System with Semantic Network
情報工学専攻
大木一史
OHKI Kazufumi
概要
本研究の目的は,雑談をおこなう対話システムを作成することである.対話システムとは自然言語をインタ
フェースとする機械システムの総称であり,自然言語とは普段われわれが使っている言語を指す.
本論文では,対話の要素としてシナリオを定義し,シナリオの遷移によって雑談をおこなうシナリオベース対話
を提案する.シナリオを用いることによって場面を限定し,タスク指向型対話システムのようにして雑談をおこな
う対話システムを実現する.場面を限定することで,システムは自由な入力文からでも情報を抽出することがで
き,選択肢を列挙しておこなう対話よりも,人間どうしの対話のような自然な対話をおこなうことができる.ま
た,意味ネットワークを用いて単語の概念距離を定義し,“人間どうしの雑談では,話題は関連性のある話題に遷
移する”という仮定に基づいて,概念距離の近い話題に遷移することで自然な対話を実現する手法を提案する.
提案手法を用いたプロトタイプシステムを作成し,簡単な対話システムである人工無能との比較,シナリオの遷
移を固定したシステムとの比較を,アンケートを用いた評価実験によっておこない,
“言語理解”
,
“論理的整合性”
,
“対話の自然さ”,
“話題の遷移”などの点において提案手法が有効であることを示した.
キーワード: 雑談,対話システム,意味ネットワーク,概念距離,シナリオベース対話
1 はじめに
肢を列挙しておこなう対話よりも,人間どうしの対話の
ような自然な対話をおこなえる.また,意味ネットワー
本研究の目的は,雑談をおこなう対話システムを作成
クを用いて単語の概念距離を定義し,“人間どうしの雑
することである.対話システムとは自然言語をインタ
談では,話題は関連性のある話題に遷移する ”という仮
フェースとする機械システムの総称であり,自然言語と
定に基づいて,概念距離の近い話題に遷移することで自
は普段われわれが使っている言語を指す.対話システム
然な対話を実現する手法を提案する.
をその目的によって分類すると,チケットの販売や観光
提案手法を用いたプロトタイプシステムを作成し,ア
案内などをタスクとした,チケット販売システムや観光
ンケートを用いた評価実験により提案手法の有効性を
案内システムなどのタスク指向型対話システムと,雑談
示す.
などを目的とした非タスク指向型対話システムに分けら
れる.非タスク指向型対話システムは,対話の制御がタ
スク指向型対話システムに比べて難しく,自然な雑談を
おこなう対話システムは実現していない.
本論文では,対話の要素としてシナリオを定義し,シ
2 ユーザモデルと意味ネットワーク
本節では,言語理解や応答文生成,対話の制御に用い
る,ユーザモデル,意味ネットワークについて述べる.
2.1 ユーザモデル
ナリオの遷移によって雑談をおこなうシナリオベース
対話システムはユーザに適応した対応をおこなうこと
対話を提案する.シナリオを用いることによって場面を
が望ましい.雑談においては,ユーザの年齢や職業,趣
限定し,タスク指向型対話システムのようにして雑談を
味,システムの利用経験などの情報をシステムに与える
おこなう対話システムを実現する.場面を限定すること
ことによって,ユーザごとに話題の遷移を変えられる.
で,システムは自由な入力文から情報を抽出でき,選択
また,ユーザとの対話履歴を管理することで,一度遷移
した話題には遷移しないようにするなどの制御もでき
る.このようなユーザごとの情報を管理するためのモデ
ルを,本論文ではユーザモデルと呼ぶ.
3.1 シナリオ
シナリオとは,タスクを達成するためのユーザに対す
る発話手順の記述であり,どのドメインに属するかの
情報をもつ.ここで,タスクとは“職業について聞く”,
表 1 ユーザモデル
“行った場所について聞く”など,シナリオの中で必要
属性の種類
ユーザの属性
となる情報を取得することであり,ドメインとは話題の
名前
一史
領域のことである.また,シナリオの属する話題の領域
対話経験の有無
あり
のことをシナリオドメインと呼ぶ.シナリオでは,ユー
最終対話日からの日数
1日
ザからの返答が限定できる発話文を用意し,ユーザか
職業
学生
らの入力情報によって出力する発話文を決定する.これ
趣味
サーフィン
によって, タスク指向型対話のようにシステムの対話を
部活・サークル
スクーバダイビング
制御できる.また,シナリオはユーザからの入力情報に
よって状態変化をおこす状態遷移図を用いて表現でき
る.図 1 に“職業について聞くこと”をタスクとしたシ
本論文で用いるユーザモデルの例を表 1 に記す.表 1
のユーザモデルを用いれば,対話経験・最終対話日から
ナリオの例を記し,図 2 に“職業について聞くシナリオ”
の状態遷移図による表現を記す.
の日数によって“はじめまして”や“お久しぶりですね”
というようなあいさつを変更することができる.また,
趣味や職業などの情報をもつことで,一度遷移した対話
には遷移しないように対話の制御ができる.
2.2 意味ネットワーク
本論文では,単語と単語の意味関係を表現するために
意味ネットワークを用いる.意味ネットワークとは,概
念間の意味関係をあらわす記述法である.意味ネット
ワークでは,単語をノードであらわし,単語間の関係を
リンクであらわすことにより単語間の意味関係を記述す
る.意味ネットワークを用いることにより,コンピュー
Ren :一史さんは,何歳なんですか?
24歳だよ。
Ren :24歳なんですね.
Ren :それじゃあ,社会人さんなんですか?
違うよ。
Ren :じゃあ,学生さん?
そうだよ。
Ren :どんな勉強をしているんですか?
人工知能の勉強とか
Ren :人工知能って,どんな勉強なんですか?
言語処理の勉強とかだよ。
Ren :へえ.言語処理ですか.
図 1 職業について聞くシナリオを用いた対話例
タでも意味関係を解析できるようになる.
本論文では,用いるリンクは“isa”
,
“belong”
,
“object”
の 3 つである.“isa”リンクによって,主に上位下位概
念をあらわし,“belong”リンクによって所属関係をあ
らわす.また,
“object”によって動詞とその目的語の関
係をあらわす.これらのリンクは,雑談をおこなう対話
システムを実現する上で必要となるものを中心に取り決
めた.
3 シナリオベース対話
それ以外の入力
Ren :{User}さんは,何歳なんですか?
それ以外の入力
年齢の入力
年齢の入力
年齢{Age} > 22?
No
Ren :{Age}歳なんですね.
Ren : それじゃあ,学生さんですか?
否定文の入力
否定文の入力
Ren : すみませんが,よくわかりません.
本節では,対話の要素としてシナリオを定義し,“人
Yes
Ren :{Age}歳なんですね.
Ren : それじゃあ,社会人さんなんですか?
それ以外の入力
Ren : じゃあ,社会人さん?
それ以外の入力
Ren :ごめんなさい.よくわからないです.
Ren :{User}さんの年齢を教えてください.
Ren : どんな勉強をしているんですか?
勉強内容の取得
Ren : {Study}って,どんな勉強なんですか?
間どうしの雑談では,話題は関連性のある話題に遷移す
る”という仮定のもと,シナリオの遷移を制御すること
によって自然な雑談を実現する手法について述べる.
図 2 職業について聞くシナリオの状態遷移図による表現
3.2 シナリオの制御
4.1 対話システム Ren
シナリオを遷移させることによって対話をおこなう手
対話システム Ren に実装したシナリオは表 2 の通り
法がシナリオベース対話であるが,ここで,シナリオを
である.実験のため,シナリオを固定した対話システム
どのように遷移させるかが問題となる.
Ren(制御なし)と,シナリオの遷移制御をおこなう対
シナリオの制御部では,まず,ユーザからの入力文を
話システム Ren(制御あり)を作成した.
解析し,入力文中の特徴語を抽出する.次に,抽出した
特徴語と概念的な関連性のある話題を検索し,その話題
に属するシナリオを遷移可能なシナリオのリストに登録
する.シナリオが終了した後,遷移可能なシナリオリス
トにあるシナリオに遷移することで,話題の関連性のあ
るシナリオへの遷移が実現できる.
特徴量を算出する方法として tf-idf 法 [1] を用いる.
また,意味ネットワークを用いた意味的類似度の評価 [2]
を参考に,概念距離を意味ネットワーク上の 2 つのノー
ド間におけるリンクの最短距離と定義する.シナリオ制
御をおこなうアルゴリズムを図 3 に記す.シナリオの遷
導入のシナリオを用いて対話を開始する.
シナリオを用いた文生成をおこなう.
ユーザからの入力を受け,入力文の解析をおこなう.
入力文から特徴語抽出をおこなう.
特徴語と概念距離の近いシナリオドメインを検索する.
概念距離の近いシナリオドメインがあれば,シナリオドメインに属す
るシナリオを検索し,遷移可能なシナリオリストを更新する.
シナリオが終了したら へ進み,終了していないなら に戻る.
遷移可能なシナリオリストにシナリオが一つもなければ へ進み,
一つ以上あるなら へ進む.
ユーザモデルから遷移できるシナリオを検索し,遷移可能なシナリ
オリストを更新する.
遷移可能なシナリオリストにシナリオが一つもなければ へ進
み,一つ以上あるなら へ進む.
自由に遷移できるシナリオを検索し,遷移可能なシナリオリストを
更新する.
遷移可能なシナリオリストにシナリオが一つもなければ へ進
み,一つ以上あるなら へ進む.
遷移可能なシナリオリストからシナリオを一つランダムに選び,リ
ストを初期化する.
選んだシナリオに遷移し, に戻る.
対話を終了する.
表 2 実装したシナリオ
シナリオ名
タスク
f s start
ユーザ名の取得
f s job
職業を聞くこと,first
f s hobby
趣味を聞くこと,first
f s club
サークル・部活を聞くこと
f s how are you
最近の調子を聞くこと
f s who
会った人について聞くこと
f s where
行った場所について聞くこと
f s about school
学校について聞くこと
f s someone job
友人について聞くこと
f s about job
仕事の調子について聞くこと
(0)
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(1)
(7)
(8)
(12)
(8)
(9)
(10)
(12)
(10)
(11)
(14)
(12)
(12)
(13)
(1)
(14)
図 3 シナリオ制御のアルゴリズム
システムは文書の入力を受けると,入力文の解析をお
こない,シナリオを用いた応答文生成をおこなう.文章
解析をおこなう際に,意味ネットワークの更新をおこな
う.ここで,Ren(制御あり)は遷移可能なシナリオリス
トの更新もおこなう.シナリオが終了したら,Ren(制
御なし)は,あらかじめ決めてある次のシナリオに遷移
し,Ren(制御あり)は,遷移可能なシナリオリストから
シナリオをランダムで一つ選び,選んだシナリオに遷移
する.Ren(制御なし)は,予め決めたシナリオの遷移
がすべて完了したら対話終了とし,Ren(制御あり)は,
遷移できるシナリオがなくなるか,シナリオの遷移を 5
回おこなったら対話終了とする.
4.2 人工無能 Sakura
対話システムと簡単な人工無能との比較実験をおこな
移制御をおこなうことで,関連のある話題に遷移する対
うため,人工無能プログラム [3] を参考に,形態素のマル
話をおこなうことができ,これにより自然な雑談が実現
コフ連鎖に基づいた応答をおこなう人工無能 Sakura を
できると考えられる.
作成した.ユーザが文を入力すると,Sakura は入力文
4 シナリオベース対話システム Ren
を形態素解析し,一つの単語をランダムに選び,選んだ
単語を開始単語とし,マルコフ連鎖に基づいて応答文を
本節では,作成したシナリオベース対話システム Ren
生成する.実験では応答を 10 ターン繰り返したら終了
について説明し,アンケートを用いた対話システムの評
する.応答文生成用辞書データには,対話システム Ren
価実験について述べる.
とユーザの対話記録を形態素解析したデータと用いた.
あり)の方が平均で 0.4 ポイント評価が高く,一人一人
4.3 対話の評価
被験者は大学生から社会人までの 5 人であり,Sakura,
の評価をみても,Ren(制御あり)の方が,Ren(制御な
Ren(制御なし),Ren(制御あり)のシステムと,それぞ
し)以上の評価点を得点していた.このことから,本論
れ 2 回ずつ対話をおこない,対話後アンケートの記入を
文で提案した対話の制御手法は,話題の遷移の自然さに
おこなう.対話を 2 回おこなうのは,ユーザモデルによ
対して有効であることがわかる.“対話の自然さ”の項
る対話の変化を評価するためである.評価実験に用いた
目では Ren(制御あり)は Ren(制御なし)よりも,平
アンケートの質問事項を図 4 に記す.アンケートでは,
均で 0.6 ポイント低い評価になっている.これはシナリ
オの数が限られているため,同じシナリオの対話を数回
システムは,発話内容を理解していると感じた.
(※ 発話内容 とは,あなたの入力した文章の内容のことです.)
システムは,論理的に正しい受け答えができていた.
システムとの対話において,話題の変化は,人間と対話している
ときのように自然なものであると感じた.
システムとの対話は,人間と対話するときのように自然なものだ
と感じた.
システムとの対話は,楽しいものであると感じた.
システムとの対話を,さらに続けたいと思った.
システムとの対話において,気付いたこと・感じたこと等を記述し
てください(自由記述)
(1)
“
”
(2)
おこなってしまったためであることが自由記述からわか
る.アンケートの結果から,作成したプロトタイプシス
(3)
テムには十分なシナリオがあるとはいえないが,提案手
(4)
法が有効であるといえる.
(5)
(6)
5 おわりに
(7)
本論文では,対話の要素としてシナリオを定義し,シ
ナリオの遷移によって雑談をおこなう手法としてシナリ
図 4 アンケートの質問事項
オベース対話を提案した.また,意味ネットワークを用
対話システムの言語理解,対話の制御,楽しさなどにつ
いて評価をする.評価は,当てはまらないなら 1,どち
らかというと当てはまらないなら 2,どちらともいえな
いなら 3,どちらかというと当てはまるなら 4,当ては
いて単語の概念距離を定義し,“人間どうしの雑談では,
話題は関連性のある話題に遷移する”という仮定に基づ
いて,概念距離の近い話題に遷移することで自然な対話
を実現する手法を提案した.提案手法を用いたプロトタ
イプシステムを作成し,アンケートを用いた評価実験を
まるなら 5,という 5 段階とした.
アンケートによる評価実験の結果として,得点の平均
値を図 5 に示す.この結果から,人工無能 Sakura に比
おこなうことで提案手法の有効性を示した.
今後の課題として,概念距離に関する定義や意味ネッ
トワークのリンクの改良があげられる.また,雑談以外
へのシナリオベース対話の応用やインターネット上の情
4.5
4
報を活用したシナリオの作成などもあげられる.
3.5
3
2.5
Sakura
(制御なし)
Ren(制御あり)
2
Ren
1.5
1
[1] G. Salton, A. Wong, and C. S. Yang, “A Vector
Space Model for Automatic Indexing,” Commu-
0.5
0
参考文献
項目(1) 項目(2) 項目(3) 項目(4) 項目(5) 項目(6)
図 5 アンケート結果
nication of the ACM, Vol.18, No.11, pp.613-620,
1975.
[2] Philip Resnik, “Using Information Content to
Evaluate Semantic Similarity in a Taxonomy,” In-
べて本システムが,
“言語理解”
,
“対話の制御”
,
“対話の
ternational Joint Conference for Artificial Intelli-
自然さ”において有効であることがわかる.“対話の楽
gence, IJCAI-95, pp.448-453, 1995.
しさ”という項目においては,よくわからない発話を楽
しいと感じるかどうかによって人工無能 Sakura の評価
が分かれた.また,
“対話の制御”に関しては,Ren(制
御あり)と Ren(制御なし)を比べたとき,Ren(制御
[3] 小高知宏, はじめての AI プログラミング, オーム社,
東京, 2006.
Fly UP