映像情報メディア学会ワードテンプレート (タイトル)

by user

on 28 марта 2017

Category: Documents

>> Downloads: 2

views

Report

Comments

Description

Download 映像情報メディア学会ワードテンプレート (タイトル)

Transcript

映像情報メディア学会ワードテンプレート (タイトル)

社団法人映像情報メディア学会技術報告
インターフェースとしての役割をもった CG キャラクタの設計
道家
†日本放送協会
E-mail:
守†
浜口
斉周†
林
正樹†
放送技術研究所〒157-8510 東京都世田谷区砧 1-10-11
†{douke.m-eq, hamaguchi.n-go, hayashi.m-hk}@nhk.or.jp
あらまし我々は視聴者であるユーザー個人の好みの番組をテレビ受信機で自動生成し，ユーザーが番組を見た
いときにいつでも視聴できる TV4U(TV for You)システムの研究を行なっている．本システムでは上述した特長に加
えて，ユーザーが視聴中に番組に割込み，出演者である CG キャラクタと対話し，さらに欲しい情報を取得するこ
とができる．このように CG キャラクタは番組出演者としての役割に加え，システムとユーザーとのインターフェ
ースとしての役割も担うことになる．本稿では人間とコンピュータの関係に関する心理学的知見をもとにした，CG
キャラクタの望ましい振る舞いについて述べる．さらにこれを実装したプロトタイプ・アプリケーションを作成し，
インターフェースとしての役割を持つ CG キャラクタの設計はどうあるべきかについて検討した．
キーワード TV4U，TVML，CG エージェント，ユーザー・インターフェース，自動番組制作
A Design of CG Character Having a Role as User Interface
Mamoru DOKE†
Narichika HAMAGUCHI† and Masaki HAYASHI†
†Science & Technical Research Laboratories, NHK 1-10-11 Kinuta, Setagaya-ku, Tokyo, 157-8510 Japan
E-mail:
†{douke.m-eq, hamaguchi.n-go, hayashi.m-hk}@nhk.or.jp
Abstract We are studying the TV4U (TV for You) system which generates personalized TV programs automatically for
individual user. In addition to this feature, this system enables the user to brake into the running TV program at any timing and
to have a conversation with the CG broadcaster in the program so that the user can get more information in an interactive way.
In our system, the CG character needs to act as an user-interface besides the role as a TV presenter. In this paper, we describe
“desirable behavior of CG character” based on psychological knowledge and study how we should design CG character with
the role as an user-interface. Also we introduce a prototype system which implements the behavior based on our study.
Keyword TV4U, TVML, CG Agent, User Interface, Automatic Program Production
１．はじめに
プレゼンターとして，番組内容をユーザーに提示する
我々はテレビ受信機に番組を自動制作する機能を
他に，システムとユーザーの対話型インターフェース
持たせることにより，視聴者であるユーザーがテレビ
としての役割を担っている．その際「番組内の CG キ
の視聴という馴染み深い情報取得スタイルを用いたま
ャラクタは，視聴者であるユーザーに対しどのように
ま，そのユーザーが本当に欲しい情報を，自分だけの
振る舞えば良いのか」が大きな課題となってくる．こ
テレビ番組を視聴することで取得出来る仕組み
れは言ってみれば，ユーザーは CG キャラクタという
TV4U [ 1 ] （ TV for You）の研究を行なっている． TV4U
「他人」と対話を行なうことに等しい．このような状
では視聴している情報に関連する情報や，視聴中理解
況において， CG キャラクタがどんな振る舞いをすれ
できなかった事柄などに対し，情報を提示している番
ば，ユーザーはその対話が快適なものであると感じる
組内の CGキャスター（ CGキャラクタ）に直接話し掛
のか．そのような CG キャラクタの振る舞いを実現す
けて対話し，さらに欲しい情報や必要な情報を，その
ることは，望ましいヒューマン・インターフェースを
ままテレビの視聴というスタイルで取得することが出
実現するのに大変重要なことである．
来る．
対話エージェントの分野では，様々な研究が行われ
この仕組みの中で，ユーザーは更に欲しい情報の取
ている．その中で我々の CGキャラクタの振る舞いに関
得を，番組内の CG キャラクタとの対話によりシステ
する研究は，擬人化対話エージェントの範疇に属する
ムに要求を伝えて行う．つまり CG キャラクタは番組
と思われるが，これまで擬人化エージェントは，より
リアルな人間に近づけることが主な目的となっており，
認するため，その一部（表 1）を，プロトタイプ・ア
技術的にいかにリアルな表現が可能かについて，さま
プリケーションを作成し実装した．
ざまな研究が行われてきている
[2][3]
．しかしながら対
話の相手である人間から見た，そのエージェントに対
表 1
する印象から対話エージェントを設計したアプローチ
大きな目で，ユーザーをまっすぐ
に見ること
微妙な表情（微笑，少し悲しいな
ど）が表現できること
3等身ほどの体のバランスが望ま
しい
セットアップ項目
喋る内容にあわせたリップシンク
が可能なこと
喋る内容にあわせ，声のトーン，
スピードが変えられること
マンガライクなキャラクタを使用す
る
CGキャラクタ側から自己紹介を行
なう
提示コンテンツと関係無い内容で
システムスタート後
ある程度の対話が可能なこと
ユーザーに入力をせかす動作をし
ないこと
いつでもアクセスを待っていること
システム終了時
をユーザーに伝える
はほとんど無い．
今回このような CG キャラクタの振る舞い方につい
て，主に既存の心理学的知見を元に「望ましい振る舞
い方」を検討した．またそれらの一部を実装したプロ
トタイプソフトウエアを作成し，インターフェースと
してユーザーが好感を持つ CG キャラクタの振る舞い
はどうあるべきかについて検討を行なった．
２．心理学的知見に基づく CG キャラクタの
振舞い
TV4U システムでは，ユーザーは番組のキャスター
である CG キャラクタとの対話により，システムに対
し入力を行なう．システムのユーザー・インターフェ
ースを考えた場合，対話がユーザーにとって負担とな
らないもので，かつ長く使う気になるものが望ましい．
このような場合 CG キャラクタがユーザーに対し，ど
のような言葉をどのような調子で話すか．またどのよ
実装したデザイン･ガイドライン
尚今回作成したアプリケーションは，以下のような
うなジェスチャーをするかといった， CG キャラクタ
動作を行うものである．
の所謂「振る舞い」の設計が課題となってくる．
■自然言語による対話
Stanford大学 Communication学科の Reeves， Nassらの
ユーザーはキーボードからのテキスト入力により，
グループでは，人がコンピュータと接する際，コンピ
自然言語で PC モニタ上に登場する CG キャラクタと
ュータに対しどのように振る舞うかについて，様々な
対話する．尚 CG キャラクタは，ユーザーに対して合
心理学的実験を行なっている [ 4 ] ．彼らによると，人は
成音声による喋りで対話する．
人と接するときと同様に，コンピュータに対しても振
■コンテンツ
る舞うことが分かっている．
アプリケーション上のコンテンツの流れを以下に示す．
そこで今回彼らの心理学的知見を基にして，ユーザー
(1) アプリケーションを開始すると，CG キャラクタが
から好感を持たれる CG キャラクタの振る舞いを検討
アプリケーションウインドウ内に登場し自己紹介
した．彼らの心理学的実験に基づく知見をベースとし
を行って，次にユーザーに名前を尋ねる．
たものを CG キャラクタの振る舞いへ応用し，インタ
(2) ユーザーが自分の名前を伝えると，CG キャラクタ
ーフェースとしての役割を担う CG キャラクタを作成
がユーザーの名前を喋りながら挨拶をする．次に
する上でのデザイン・ガイドラインを作成した．以下
ユーザーに 3 項目のニュースヘッドラインを紹介
にその一例を示す．今回作成したガイドラインは，容
姿，ジェスチャー，喋る内容など 38 項目に渡っている．
する．
(3) ニュースヘッドライン紹介後，どのニュース項目
が詳しく知りたいかユーザーに尋ね，ユーザーの
デザイン・ガイドラインの一部
希望したニュース項目について詳しく説明し，更
■微妙な表情（微笑，少し悲しいなど）が表現出来る
にニュースの内容に対しコメントする．
こと．そしてそれら表情は連続的に可変出来ること．
（理由）人間は極端な表情は簡単に表現できるため，
それが本心からの表情なのか判別が難しい．そのため
相手の極端な表情を信用しにくい .一方微妙な表情は
簡単に表現することが難しく，相手の本心から出てい
るものと感じられ，その表情の示す意味を信用する．
(4) 上記の流れにおいてユーザーに入力を求めるシー
ンで，コンテンツの目的となる返答以外に，自然
言語によるある程度の「世間話」的な対話が可能．
アプリケーションの構成を図 1 に示す．このアプリ
ケーションはそれぞれ後述する Mind Engine [5 ] ， CG
キャラクタ・コントローラ，TVML Player [ 6 ] から構成
されている．それぞれの動作の仕組みについて以下に
３．プロトタイプの作成と実験
前章で述べたデザイン・ガイドラインの有効性を確
述べる．
専用のスクリプトに記述しておくことで，限定された
ユーザ
対話テキスト入力
動作タグ
トピックスにおける自然言語による対話を実現する．
質問：どのニュースを詳しく知りたいですか？
CGキャラクタ
コントローラ
Mind Engine
対話内容
＆
動作
入力
テキスト
ユーザーからの入力
・First one.
・Please tell me the first news.
・Could you explain the first one.
・など
TVML
スクリプト
TVML Player
あらかじめ定義してあるパターンと一致
図１
３．１
アプリケーションの構成
最初のニュースの詳細を説明
TVML
TVML(TV program Making Language)は，テレビ番組
図３
Mind Engine による対話処理の概要
の台本を記述するためのコンピュータ言語であり，
TVML で記述された番組台本を，ソフトウエアである
３．３
CG キャラクタ・コントローラ
TVML Player に入力することにより，CG や音声合成な
CG キャラクタ･コントローラは， Mind Engine の出
どを使ってリアルタイムにテレビ番組を生成するもの
力する対話スクリプトを解析し，スクリプトに応じた
である．図 2 に TVML スクリプトの例を示す．このス
TVML による CG キャラクタの動作スクリプトを生成
クリプトを TVML Player に入力すると，カメラが BOB
するもので，今回新規に開発した．その具体的方法は，
という名前の CG キャラクタにクローズアップし，
前述したコンテンツのストーリーにおいて ,各シーン
BOB がおじぎをした後，笑顔で「こんにちは」と喋る
における CG キャラクタの振る舞いを実現するのに，
映像を出力する． TVML Player は TV4U システムのプ
シーンを表現するタグを定義し，それらを Mind Engine
レゼンテーションエンジンとして使われている．
のスクリプト中に挿入した．これらを CG キャラク
camera: closeup( what = BOB)
character: bow( name=BOB)
character: expression (name=BOB, type=happy )
character: talk (name=BOB, text=“こんにちは”)
タ・コントローラ側で解析して，各シーンにおける適
切な振る舞いを実現している．例えば図 4 に示すよう
に，アプリケーションのスタート直後に CG キャラク
タが自己紹介するシーンでは，自己紹介文に挨拶のシ
図２
TVML スクリプトの例
ーンであることを示す <GREET>タグを付加している．
このタグのシーンにおける適切な CG キャラクタの表
３．２
Mind Engine
情とその程度，喋りの調子を， TVML で表現するのに
CGキャラクタとの対話は，一般的に特定のキーワー
必要なパラメータの値を振舞い DB から取得し，CG キ
ドやコマンドを用いて行なうことが多いが，対話型エ
ャラクタの応答文と合わせて，振舞いコントロールに
ージェントとしては自然言語を用いた対話の方が望ま
必要な TVML スクリプトを生成する．これらの TVML
しい．そこで自然言語による対話を実現するため，今
スクリプトを TVML Player に入力することにより，CG
回 Extempo社 [ 4] の Mind Engineというソフトウエアを用
キャラクタは，にこやかな表情と声の調子で自己紹介
いた．Mind Engineでは，アプリケーションのストーリ
を行う言葉を喋る．尚各シーンでの表情の種類や程度，
ーに沿った，専用のスクリプトを作成することにより，
声の調子を表現するために TVML スクリプトで用いる
自然言語による対話を実現することが出来る．その仕
パラメータ類の値は，別途 CG キャラクタの表情と声
組みは，想定される入力表現のパターンをあらかじめ
の調子を連続的に可変できるソフトウエアを制作し，
用意しておき，ユーザーからの入力がいずれかのパタ
これを使って主観的に決定した．また CG キャラクタ
ーンにマッチすれば，所定の動作や応答文を返すとい
からユーザーに対し入力を促す質問をした後は，デザ
うものである．例えば図 3 に示すようにユーザーに対
イン・ガイドラインにあるように，ユーザーが入力を
し，「どのニュースの詳細が知りたいですか？」と尋ね
急かされていると感じないよう， CG キャラクタはユ
た場合に，最初のニュースの詳細が知りたいのでそれ
ーザーに対し質問した後一定時間経過すると，画面内
を説明してくれるよう頼むには，「 first one」 ,「 Please
の椅子に座ってリラックスした態度を取る．そしてユ
tell me first news」，「 Could you explain the first one」な
ーザーから入力がありそれに対して応答する際は，ユ
ど，文言や単語の出現パターンを多数用意しておくこ
ーザーに対し失礼とならないよう椅子から立ち上がり，
とで，いずれの場合も最初のニュースの詳細を説明す
ユーザーを見て喋り始める．
る動作を行なう．これら入力表現パターンと応答文を
対話スクリプトの例
（挨拶）
<GREET>Hello, I’m Ai. I’m an navigator….
タグ
応答文
「少し嬉しい」「嬉しい」「とても嬉しい」程度の表現
は出来るが，ニュートラルな表情から「少し嬉しい」
や「少し嬉しい」から「嬉しい」表情への遷移が滑ら
かでないため，突然表情が変わるように感じてしまう．
CGキャラクタコントローラ
キャラクタは悲しい表情をするが，その次に内容が理
振舞い生成
エンジン
データ
またユーザーの入力した内容が理解できない場合，CG
TVMLスクリプト生成
解出来かつにこやかに喋るシーンの場合，悲しい表情
振舞い
振舞い
DB
から一転してにこやかになるため，表情の遷移に違和
挨拶シーンでの各パラメータ
然言語による対話を Mind Engine を用いて実現してい
感を覚えてしまう．またこのアプリケーションは，自
・表情タイプ：happy
・表情の程度：0.5
・喋りのトーン：2.0
・喋りの速さ：2.0
るため， Mind Engine が扱える英語のみの対話に限定
されている．
生成されたTVMLスクリプト
character: expression (name=Caster, type=happy, degree=0.5)
character: talk (name=Caster, text=“Hello, I’m Ai….”, rate=2.0,
pitch=2.0)
TVML Player
出力映像
図４対話スクリプトからの TVML スクリプト生成
の流れ
３．４
実験と考察
図５
アプリケーションの GUI と出力例
４．まとめと今後の課題
図 5 にアプリケーションの GUI と TVML Player によ
本稿では心理学的知見に基づき， CG キャラクタの
る映像出力例を示す．ユーザーは GUI 上のテキスト入
望ましい振る舞いについてデザイン・ガイドラインを
力ウインドウから、自然言語による対話内容の入力を
作成し，その一部をアプリケーション上に実装し，表
キーボードにより行う．今回作成したアプリケーショ
示実験を行ない，これが親しみの持てるインタラクシ
ンでは，ユーザーとの対話の途中各シーンに応じて，
ョンとなることを述べた．
CG キャラクタが微妙な表情をしたり，口調を変えた
本稿で述べたものはプロトタイプであり，今後
りする．例えば図 5 の出力例は，ユーザーの入力をア
TV4U システムへの実装，より多くの気の利いた振舞
プリケーション側が理解できなかった場合を示してい
い，対話内容にマッチした感情表現の実現等の課題に
る．この時 CG キャラクタは少しだけ悲しい表情と，
取り組んでいく必要がある．
トーンを少し落とした声でユーザーに謝り，ユーザー
の要求に応えられないと言う．このシーンに引き続い
文
[1]
献
浜口，道家，林「 TV4U
テレビセット内で作ら
て，更にユーザーがアプリケーション側の理解できな
れる自分だけのテレビ番組」信学技報
い言葉を入力した場合は，先ほどより悲しい表情とト
PRMU2002-29,pp.63-68(2002.6)
ーンをさらに落とした声で，ユーザーの入力が自分の
[2]
このような振る舞いをすることで，ユーザーの要求
を理解出来ない場合でも，にべもなく｢あなたの言って
土肥，石塚「 Face-to-face 型擬人化エージェント・
インターフェースの構築」情報処理学会論文誌，
理解の範疇を超えていると言う．などである．
Vol40,No.2,pp.547-555,Feb.1999
[3] 嵯峨山他「擬人化音声対話エージェントツールキ
いることは理解できません｣と CG キャラクタに言い
ット
放たれてしまうよりも，ユーザーはアプリケーション
2002-SLP-45-10, pp.57-64, Feb. 2003.
に対して不満を抱きにくい．また自然言語による対話
[4]
は，ユーザーにこの対話が自然なものであると感じさ
Galatea 」
情報処理学会研究報告 ,
Reeves,Nass「 The Media Equation」Cambridge CSLI
Publications ISBN1-57586-053-8
せる．一方このアプリケーションでは， CG キャラク
[5]
http://www.extempo.com/
タのスムーズな感情表現の遷移が出来ておらず，違和
[6]
http://www.nhk.or.jp/strl/tvml/
感がある．現段階では例えば「嬉しい」表情の場合，