...

人と人,人とモノのコミュニケーションを 良くするNTTのAI技術

by user

on
Category: Documents
15

views

Report

Comments

Transcript

人と人,人とモノのコミュニケーションを 良くするNTTのAI技術
人と協創するAI
NTT R&Dフォーラム2016 ワークショップ
NTTの4つのAI
コラボレーション
人と人,人とモノのコミュニケーションを
良くするNTTのAI技術
お
ざ
わ
ひ で あ き
小澤 英昭
NTTメディアインテリジェンス研究所 所長
計算機能力の進歩により,今再びブームになっている人工知能(AI).
本稿ではAIの潮流について解説するとともに,NTTグループが考える「コ
ンピュータと人間が協創するAI」とその取り組みについて紹介します.
文 字 認 識 の 研 究,1980年 代 に は
実際のデータが非常に重要であるとい
ANSERという音声認識を使ったシス
うことです.そのためパートナーの皆
今,人工知能は非常にブームとなっ
テムやAI専用マシンの実用化などを
様とコラボレーションして皆様がお持
て多くの方に興味を持っていただいて
行っています.最近では,NTTドコ
ちの実際のデータを利用しながら技術
います.
「人工知能」という言葉は,
モの「しゃべってコンシェル」のよう
開発を進めることにより,AIを発展
古くて,そして,ある意味とても新し
に,スマートフォンに話しかけるとさ
させることができると考えています.
い言葉といえます.実は,2016年は
まざまなことを調べてくれるようにな
奇しくも人工知能という言葉が使われ
るなど,数多くのAI技術に取り組ん
だしてから60年目にあたります.人工
できました.
「人工知能」は古くて新しい
AIとは何か
AIという言葉には多くの方がさま
知能(AI: Artificial Intelligence)は
なぜ,今AIがここまでブームになっ
ざまなイメージをお持ちです.一般の
1956年に行われた,ダートマス会議
ているのかと述べますと,計算機の能
方はロボットのようなものをAIと考
で初めて使われた言葉といわれていま
力が非常に進歩し大量のデータが処理
えているかと思います.企業の方なら
す.その後,例えば日本でも1980年
で き る よ う に な っ た こ と, そ し て
IBM社の「Watson」というサービス,
代にICOT(新世代コンピュータ開発
ディープラーニングなどの非常に強力
技術に詳しい方は「DNN」という技
機構)の設立や第 5 世代コンピュータ
な技術が出現したことが挙げられま
術を思い浮かべる人もいます.これら
という言葉や,ニューラルネットワー
す.以前は,人間がモデル ・ ルールの
はすべて異なるものを指しています.
クを使った家電が発売されるなど一時
記述を積み上げてAIを実現していま
AIという言葉が使われるときに指す
ブームとなりました.そして,最近で
したが,現在のAIは,世の中に存在
ものを分類すると図 1 のようになり
はApple社のiPhoneに搭載されている
する大量の実データを計算機に分析 ・
ます.
「Siri」や,
「ロボット」
「機械学習」
学習させることにより実現するものへ
「DNN(Deep Neural Network)
」 と
と変わりました.その結果,AIが実
これには人間に似たような仕組みをコ
いった言葉とともに,今またAIが脚
用に耐え得る領域が広くみえてきたこ
ンピュータ上につくろうという考え方
光を浴びているという,非常に長い歴
とにより,話題として多く取り上げら
と,もう 1 つは人間が使う知識を上手
史のある言葉です.
れるようになったと考えられます.
に活用し,私たちの生活をより豊かに
一方NTTでは,40年前には手書き
24
NTT技術ジャーナル 2016.4
つまり,AIにおいて大事なことは,
はじめに,AIの目的があります.
していこうとする考え方の 2 つの方
特
集
向性があります.
また,仕組みという観点では,いく
つかのレイヤで分かれていきます.ま
コンピュータに人間の
ような知性を持たせる
目的
ず,
「情報を分類する」
「相関関係を計
知識を活用して,私たちの生活に
役立つ機械やシステム
算で導き出す」
「知識を大量に蓄積す
る」といったAIの処理技術のレイヤ
AIサービス
があります.次に,これら処理技術を
人工頭脳
利用して,
「顔の画像を認識する」
「大
量の情報を集め意思決定する」
「音声
を認識する」といったAIの要素技術
AI要素技術
ロボット 自動運転車 オペレータ支援
意思決定
検索・推論
画像認識
翻訳
音声対話
ヒューマンインタフェース
対話理解
音声認識
自然言語処理
のレイヤがあります.さらに要素技術
を使い,
「ロボット」
「人工頭脳」
「自
動運転」
「コンタクトセンタのオペレー
AI処理技術
DNN
機械学習
タ支援」
「しゃべってコンシェルのよ
知識データベース
図 1 AIの領域
うな音声対話サービス」のレイヤに分
けられます.このようにAIとは,こ
れらのどこをやることが本当に世の中
の役に立つのか,ターゲッティングを
コンピュータと人間が協創する AI
することが非常に重要な技術です.
NTTがめざす「人と協創するAI」
お客さま
担当者
NTTが考えるAIとは,コンピュー
室内センサ
タと人間がともにコミュニケーション
を行い協創できるAIというものです
(図 ₂ )
.
例えば,コンタクトセンタでは,
AIが後ろについてオペレータの回答
を支援することで,お客さまに必要な
ことを的確にお伝えし,お客さま満足
交差点のカメラ
会話をAIが聞いて
担当者をサポート
さまざまな知識
お客さまには快適に,オペレータには
ストレスがない環境の実現
寝ているときも,見えないところも,
そばで見守る安心・安全
大事にしたいのは,
いつもそばで見守れる AI の技術
度を向上させるものです.また,そこ
図 2 NTT が考える AI
ら中の乗り物や機械,個人がAIを備
え,そのAIが安全を見守ってくれる
ことで,交差点で事故を起こさせない
ちは必ずしもすべての情報を集める必
間のコミュニケーション,もう 1 つ
ようにする社会にできれば良いと考え
要はないと考えます.大事にしたいこ
は,AIどうしのコミュニケーション
ています.SF映画では,世界中の情
とは,いつも自分のそばで見守ってく
というものを考えています(図 ₃ )
.
報を集めるセンタのようなAIが人間
れるAI技術の実現です.
人とAIのコミュニケーションでは,
より賢くなり,最後は暴走する姿が描
そばで見守ってくれるAIを実現す
常に私たちのことを見守り私たちの状
かれることがあります.しかし,私た
るために,大きく分けて,人とAIの
況を「理解」する機能と,私たちにサ
NTT技術ジャーナル 2016.4
25
NTT R&Dフォーラム2016 ワークショップ
ジェストするための情報をどこからか
価値を生み出せる世界をつくっていく
Touching-AI」です.必ずしも言葉で
見つけ生み出す「探索」機能,その結
必要があると思います.これらを私た
はなく,脳科学などを用い体の表面に
(1)
果を私たちに分かりやすく
「デザイン」
ちは 4 つのAI という言葉で整理し
現れるさまざまな変化から私たちの深
する機能が必要と考えています.
また,
ています(図 ₄ )
.
層心理などを見抜くことによって,よ
AIどうしのコミュニケーションでは,
1 番目は「Agent-AI」です.話し
り付加価値を高めることをめざすもの
さまざまなセンサや人に合わせてAI
ている言葉や画像を理解しそこから
です.また,モノとモノ,モノと人と
が遍在し,その 1 つひとつ置かれた
ユーザに対して価値の高い情報を提示
の組み合わせを結びつける世界とし
AIどうしが連携して,新たな知識や
していくものです. 2 番目は「Heart-
て,3 番目のAI「Ambient-AI」と呼ぶ,
センサが賢くなるというイメージのも
のがあります.さらに 4 番目としてこ
人と AI が,コミュニケーションする
AI と他の AI がコミュニケーションする
れらのAIがネットワークとして組み
合わされたとき,
「 3 人集まれば文殊
見守るべき人のことをいつも見ている,
聞いている
AI は,センサや 1 人ひとりについて
遍在する
マイAI
AI
と呼びます.
AI
常に私たちのそばにいる,という
AI
デザイン
カメラ
見守るべき人に分かりやすい
インタラクションをする
まり知恵を生み出せるものをめざそう
としています.これを「Network-AI」
探索
理解
の知恵」のようなさまざまなAIが集
AIですから,私たちが生まれてから
年老いていくまで,常に見守ってくれ
AI どうしも連携して,新たな知が
生まれる
るというAIになるのではないかと考
えています.若年の人には,必要な専
門知識を早く取得できるようにする
図 3 いつもそばで見守る AI に必要なこと
AI,高齢になったときには,記憶力
や体の障がいなど残念ながら欠けてし
まった機能についてサポートしてくれ
複数の AI が有機的につながって価値を生む
人間を AI がサポート
見守るべき人のことをいつも見ている,
聞いている
HeartAgent-AI
Touching-AI
人の発する情報を
読み解き,
意図・
感情を理解
理解
意識されない人
の心と身体を読
マイAI
み解き,
深層心理・知性・
デザイン本能を理解
AI は,センサや 1 人ひとりについて
Network-AI
遍在する
複数の AI が有機的につながり成長し,
社会システム全体を最適化
るAIをつくっていき,その結果,老
い も 若 き も と も に 輝 け る 社 会 を,
NTTは皆様と一緒に日本だけでなく
世界につくり上げていきたいと考えて
います.
探索
Ambient-AI
AI
AI
森羅万象
(人,
モノ,
環境)
を読み解き,
カ
メ
ラ
瞬時に予測・制御
AIへの取り組み例
AI
見守るべき人に分かりやすい
AI どうしも連携して,新たな知が
インタラクションをする
生まれる
環境の情報を読み解き予測・制御
図 4 人間をサポートする 4 つの AI
前述した理解 ・ 探索 ・ デザインとい
う 3 つの要素に対して,私たちの取り
組み例を紹介します.
■理 解
まず,人や環境の理解です.見守っ
てくれるAIの実現には非常に重要な
26
NTT技術ジャーナル 2016.4
特
集
のです.
要素です.その中でも重要なものに音
す.一方,AIの領域では,量は少な
声があります.NTTでは,1998年に
く整理された正しい知識の中から答え
このAIを実現するために,私たち
腕時計型PHSを実現した際に音声認
を探し出すことが重要になります.し
は,インターネットにあるさまざまな
識で電話をかけられるようにしまし
かし,問い合わせのされ方が幅広いも
情報を集めNTTの日本語解析技術で
た.その後,アナウンサーの音声の字
のとなります.そのため,知識と問い
解析し,どの単語どうしの意味が近い
幕化や,ある程度決まった答弁をする
合わせをつなぐところにAIがいます.
のかを示すマップをつくりました.こ
議会の議事録の作成支援,最近ではコ
例としてFAQからの検索がありま
のマップを用いることで,例えば「国
ンタクトセンタのオペレータやお客さ
す.マニュアルに質問
(Q)と回答
(A)
際電話」という言葉と「ニューヨーク
まの会話の文字化,また,ロボットと
の例はあります.ところが,お客さま
にかける」という言葉が近いことが分
声で会話ができるようになるなど音声
は質問例にないさまざまな言い方で質
かるようになり,より適切な回答を示
認識を進歩させてきました.NTTは
問してくるために,それが質問例と同
せるようになりました(4)
(図 ₅ )
.
ディープラーニングだけでなく,非常
じことを言っているかをAIが判定し
■デザイン
に多くの語彙の辞書を持てるWFST
適切な回答例を提示しようとするも
最後がデザインです.この典型的な
(Weighted Finite State Transducer)
技術も有しており,その結果現在では
コンタクトセンタで音声マイニング(2)
∼をネットで調べてみて∼
というAgent-AI技術を実現していま
インターネットで検索すると∼
す.
また,
「目は口程にものを言う」と
いいますが,不快感や眠気を感じてい
るかを目から測るという研究もしてい
ウェブで時刻表調べて∼
インターネットで社会は∼
大量の実テキスト
(主にCGM文書)
大規模意味辞書
3 :主体
4 :人
ことにより,その人が見ている物や聞
探索とは,検索とは少し異なるもの
です.検索は,今ある情報から見つけ
出すということですが,探索というの
は未知の事柄を探し出すということで
す.検索の例として文書検索では検索
ワードを与えると大量の整理されてい
ない情報の中から,ただその検索ワー
単語の意味ベクトル
1000:抽象
362:組織
373:団体
同じことを
言っているか
どうか?
を進めることによりHeart-Touching-
■探 索
メール
389:場所
することができます.このような研究
います.
ブラウザ
372:団体・党派
いている音の好みや,眠気などを推定
AIの実現に近づけるのではと考えて
ネット
1 :名詞
2 :具体
小な眼球の動きと,瞳孔反応を調べる
ウェブ
ニューラルネット
ワークで
ベクトル化
ネットにつなぎましょう
ます(3).マイクロサッカードという微
インターネット
日本語
解析技術
050 plusで国際電話
かけられますか
050 plusでニューヨークに
電話したい
050 plusで国際電話でき
ますか
050 plus って外国にかけられますか
050 plusで海外に電話
できますか
050 plusでシンガポールに
電話できますか
050 plusでニューヨークに
かけられますか
Q. 050 plusで国際電話を
かけることは可能ですか?
A.国際電話をかけること
は可能です.ご利用いただ
く際には「国際電話を利用
する」設定にしてください.
FAQ集
図 5 言葉の意味のベクトル表現とFAQ検索
ドが含まれている文書を見つけてきま
NTT技術ジャーナル 2016.4
27
NTT R&Dフォーラム2016 ワークショップ
を進め,真の意味で日本の皆様,世界
の皆様のお役に立つAIという未来を
まだまだ得意ではないことがたくさんある
・簡単そうなことが実は難しい
気配り
気配り
切り拓ければと考えます.
・物理的な距離は超えられない
■参考文献
秒の単位の
応答
遠いクラウド
数m秒程度の
応答
近くのエッジ
⇒ 全体を俯瞰して対処するような
「おもてなしの心」
は,正解・不正解
といったような学習に向いていない
⇒ AI が遍在し,瞬間瞬間に人間を
サポートするには,遠くで処理している
と間に合わない
図 6 まだまだ端緒についたばかりの AI
例が「人流」です.NTTでは,遊園
のさまざまなデータと組み合わせるこ
地など混雑する状況にあるお客さま
とによって,新たな付加価値を生み出
が,少ない待ち時間でより快適に希望
したいと考えています.
するところを回れる技術を開発してい
しかし,まだAIには得意ではない
ます .この問題の難しいところは,
ことが数多くあります(図 6 )
.例え
誘導する対象となるお客さまの集団や
ばレストランのウェイターが行う気配
各遊具での混雑状況が前もって正確に
り,目配りのようなものはまだ難しい
見積もれないことです.遊園地には
です.これは全体を俯瞰し,どこに重
次々と新たな来場者が来たり,待ち行
きを置くかを判断するといったことが
列の長さが変わるなど,状況は刻々変
まだ難しいためです.また,現在では
化するため事前の最適化は困難です.
クラウドにデータを蓄え処理すること
つまり,リアルタイムにお客さまにど
が必要とされますが,何千キロも離れ
のタイミングでどの行列に並んでもら
たクラウドで処理をさせようとする
うのが良いかを計算することがポイン
と,
秒単位で遅れが生じてしまいます.
トになります.そこで,私たちは,人
交差点での車どうしの衝突を防ぐシス
の流れや待ち時間の時空間予測技術と
テムを実現するには数ミリ秒で応答で
数理最適化アルゴリズムを組合せ,リ
きる技術が必要です.これを可能にす
アルタイムに集団を最適に誘導する技
るためにNTTではエッジコンピュー
術の開発を行っています.
ティング技術を開発しています.
(5)
AIの課題と今後のNTTグループ
の取り組み
今後もNTTグループ全体として,
私たちとパートナーの皆様とが持って
いる知識や技術をコラボレーションさ
NTTはAIの取り組みを,これから
せ,脳科学の研究や,IoT(Internet
も引き続き行っていきます.また,さ
of Things)
,エッジコンピューティン
まざまな技術を提供し,皆様がお持ち
グなど,さまざまな新しい技術の開発
28
NTT技術ジャーナル 2016.4
(1) 山田 ・ 高橋 ・ 納谷 ・ 池邉 ・ 古川:“NTTグルー
プ に お け るAI研 究 の 取 り 組 み と 方 向 性,”
NTT技 術 ジ ャ ー ナ ル,Vol.28,No.2,pp.813,2016.
(2) 河村 ・ 町田 ・ 松井 ・ 坂本 ・ 石井:“コールセ
ンタにおけるAIの活用,” NTT技術ジャーナ
ル,Vol.28,No.2,pp.35-37,2016.
(3) 古 川 ・ 米 家 ・ LIAO ・ 柏 野:“目 か ら 読 み 取
る 心 の 動 き─Heart-Touching-AIの キ ー 技
術,” NTT技 術 ジ ャ ー ナ ル,Vol.28,No.2,
pp.22-25,2016.
(4) 松尾 ・ 東中 ・ 浅野 ・ 牧野:“AIを支える自然
言語処理技術,” NTT技術ジャーナル, Vol.28,
No.2,pp.14-17,2016.
(5) http://www.ntt.co.jp/RD/active/201502/jp/
ct/ct001.html
◆問い合わせ先
NTTサービスイノベーション総合研究所
広報担当
TEL 046-859-2032
FAX 046-855-1104
E-mail sv-forum lab.ntt.co.jp
Fly UP