...

世界一のメディア処理エンジン開発 から萌芽的・探索的技術の創出まで

by user

on
Category: Documents
17

views

Report

Comments

Transcript

世界一のメディア処理エンジン開発 から萌芽的・探索的技術の創出まで
エンタープライズICT総合誌 月刊ビジネスコミューニケーション(Webサイトへ)
特集
NTTメディアインテリジェンス研究所のR&D展開
−革新的なサービス創造を支えるメディア処理機能のエンジン開発−
世界一のメディア処理エンジン開発
から萌芽的・探索的技術の創出まで、
メディア系技術の研究開発に注力
2012年7月1日、NTTメディアインテリジェンス研究所(以下、MD研)という新たな名称
でスタートした新生 MD 研。革新的なサービス創造を支える各種メディア処理の要素技術
とエンジン開発を柱とするMD研の取組みについて、端山聡所長にうかがった。
各種メディア処理の要素技術と
エンジン開発の R&D 活動を推進
像・映像など各種メディア処理の要
素技術の研究と、要素技術を他社サ
NTT メディアインテリジェンス研究所
所長 端山 聡氏
ービスとの差異化のキーとなる使い
―
−2012
2012年
年77月
月11日、名称も新たにス
日、名称も新たに
やすい部品(エンジン)にするため
認識・合成技術、言語処理技術、オ
タートされた貴研究所の主要ミッシ
スタートされた貴研究所の主要ミッ
のエンジン開発を行い、それを「ク
ーディオ信号処理技術の研究開発を
ョン及び組織構成からお聞かせくだ
ション及び組織構成からお聞かせく
(※ 1)の上で活用し、
ロスファーム」
行っています。最近の主要トピック
ださい。
各種プロトタイプやトライアルにて
として、NTTドコモが提供している
端山
私ども MD研は、人々の生活
検証・評価することで、実用化につ
“しゃべってコンシェル”へのコア技
をより豊かに快適にする革新的なICT
なげるのが主要ミッションです。現
術提供と技術支援があげられます。
サービス創造に向けた研究開発を主
在、図1に示す3つのプロジェクト
3つ目の「画像メディアプロジェクト」
要ミッションとする「NTTサービス
構成で研究開発を推進しています。
では、映像認識処理、映像符号化、
さい。
イノベーション総合研究所」傘下の
「第一推進プロジェクト」は、実用
高臨場の映像通信技術の研究開発を
4つのR&D部隊の1つです。旧NTT
化開発を行う部隊であり、世の中の
行っています。昨年12月に沖電気工
サイバースペース研究所時代と同様
ニーズを踏まえて、他の2つのメデ
業様が販売開始したビデオ会議シス
に、ブロードバンド・ユビキタスサ
ィアプロジェクトの研究開発成果を
テム「Visual Nexus」に、私どもの
ービスの基盤となる音声・言語・画
応用したシステムの自主開発を行っ
H.264ソフトウェアコーデックが採用
ています。最近の主要
されています。また最近、フルHD対
な取組みとしては、通
応テレビの 4 倍の解像度を実現した
話分析によりお客様の
“4Kテレビ”が注目を集めていますが、
生の声をビジネスに活
この4Kの映像を高品質・高圧縮で符
かすコンタクトセンタ
号化する映像符号化技術の研究とエン
向け音声マイニング技
ジン開発にも取り組んでいます。
N
T
T
メ
デ
ィ
ア
イ
ン
テ
リ
ジ
ェ
ン
ス
研
究
所
︵
M
D
研
︶
第一推進プロジェクト
研究所内外のコア技術を基盤とし、映像・音声言語等のメディア処理技術を
応用した各種システムのプロデュース、および技術開発、プロダクト開発を
行うとともに、導入支援、維持管理を実施し、新しいサービス/端末の開発、
業務プロセスの改善に貢献
音声言語メディアプロジェクト
高い付加価値を持つブロードバンド・ユビキタスコミュニケーションビジネス
の実現に資する音声言語メディア基盤技術の確立を目指した、オーディオ信号
処理技術、言語処理技術、認識合成技術の研究開発
画像メディアプロジェクト
サービス創造グループの技術的な求心力となるべく、画像メディアに関わる
革新的な要素技術を確立し、オープンイノベーションとの組合せにより新たな
サービスを創出するための、映像メディア処理技術、映像メディア符号化技術、
高臨場映像通信技術の研究開発
図 1 NTT メディアインテリジェンス研究所の組織構成と主な取組み
14
術があげられ、すでに
NTTグループのコンタ
(※ 1)ビジネスコミュニケーション誌 2013
年 1 月号 P21 ∼ P22 参照。
クトセンタで活用され
ています。2つ目の
「音声言語メディアプロ
ジェクト」では、音声
パーソナル化された UI/UX の
実現に向けた研究開発を担う
―研究開発の基本的な方向性をお聞
−研究開発の基本的な方向性をお
ビジネスコミュニケーション
2013 Vol.50 No.3
エンタープライズICT総合誌 月刊ビジネスコミューニケーション(Webサイトへ)
かせください。
聞かせください。
端山
研究開発の基本的な方向性は
図2に示すように、「ナチュラル」
◆高臨場感「ナチュラル」の追求に加え、利用環境への対応「ユビキタス」、ネットワーク上の無限の情報を活用する
「ソーシャル」、個人性への対応「パーソナライズ」の切り口で研究を推進。
◆サイバー空間で進展していた行動支援を、実空間と融合した行動支援に拡張する。
実世界との連繋
実世界でのサービス
「ユビキタス」「ソーシャル」「パー
実世界情報検索
ソナライズ」の4つを基軸に、臨場
感や利便性の高い情報を人や場所に
サイバー世界
タグ付け、インデクシング
マッチング、
認識、合成、符号化
提示
認識
実世界データ
豊富な知恵、
個々人を理解
メタデータ、ログ
データベース
合わせて提供するためのメディア系
付加情報を提示する
コミュニケーション
技術の研究開発を行います。昨年
Ubiquitous
Natural
Social
タグ付け
インデクシング
実世界データに情報をマージして提示
11 月に発表した NTT グループの中
知識、情報
合成
符号化
超高臨場感コンテンツ配信
Personalize
期経営計画では、①お客様のニーズ
クラウド
に合わせて(Suitable)、②より簡
単・便利に(Simple)、③より安
図 2 メディア系技術の研究開発の方向性
心・安全に(Secure)、という3つ
の役割を果たし、お客様に選ばれ続
テレビに代表される超高精細映像へ
“進化的メディア符号化技術”や、
ける「バリューパートナー」への変
の期待を背景に、本年春には映像符
あたかも相手が同じ空間に一緒にい
革を目指すとしています。この中で
号化技術 HEVC(High Efficiency
るかのような究極の存在感に挑戦す
Simple の観点では、特にパーソナ
Video Coding)の標準化が予定さ
る“映像を実在化する空間定位技術”
ル化された UI/UX(ユーザインタ
れています。私どもも、標準化に貢
や“リアルタイム波面合成・音場伝
フェース/ユーザエクスペリエン
献するとともに、4K 映像を HEVC
送技術”などがあげられます。
ス)を実現することが重要視されて
対応で圧縮する符号化エンジンの開
います。その意味では、この領域を
発や、新しい視聴スタイルを実現す
担っている R&D 部隊として、責任
るパノラマ映像配信技術の取組みを
の重さを痛感しています。
加速しています。
徴的な点はありますか。
特徴的な点はありますか。
端山
−最後に今後の抱負と研究者への
―最後に今後の抱負と研究者へのメ
ッセージをお願い致します。
メッセージをお願い致します。
−後続の各論の頁で最近の取組み
―後続の各論の頁で最近の取組みの
いくつかをご紹介しますが、何か特
のいくつかをご紹介しますが、何か
事業への貢献を第一義に要素技
術の研究とエンジン開発を推進
従来とは一線を画す萌芽的・探
索的技術の創出にもチャレンジ
端山
MD研として、事業への貢献を
第一義に、メディア処理の要素技術の
−55年∼
年 ~10
―
10 年先を視野に入れた萌
年先を視野に入れた萌芽
研究とエンジン開発をしっかりと行
スへの対応があげられます。例えば、
的な技術の研究開発にも取り組まれ
芽的な技術の研究開発にも取り組ま
い、タイムリーに提供できるようにす
従来の音声認識技術は、自動議会録
ていますね。
れていますね。
ることが一番重要だと考えています。
生成等に代表されるように雑音の少
端山
次世代の新たなサービス創出
今後も従来から行ってきたサービス可
ない環境を想定していましたが、ス
に向けた弾込めを推進するという観
視化・トライアルによるサービス創造
マートフォンの場合は雑音環境でも
点でも、従来とは一線を画す革新的
活動をさらに継続・加速していきたい
音声を正しく認識する技術が求めら
な萌芽的・探索的技術の創出に向け
と考えています。研究者には、市場・
れています。さらには、スマートフ
た取組みも重要だと考えています。
技術の動向をきっちりと把握し、世界
ォンの機種ごとの特性に自動適合す
現在取り組んでいる萌芽的・探索的
一と胸を張って言える技術の研究開発
るエコーキャンセラ技術があげられ
技術のテーマとして、例えば入力画
に取り組んで欲しいと思っています。
ます。第二に映像系では、モバイル
像に特化したオーダーメイドの符号
―本日は有り難うございました。
−本日は有り難うございました。
デバイスでの映像視聴の増加や 4K
化アルゴリズムを全自動生成する
やはり第一にスマートデバイ
ビジネスコミュニケーション
2013 Vol.50 No.3
(聞き手・構成:編集長 河西義人)
15
Fly UP