...

Page 1 2012/11/19 1 ©2012 戸田 真志 eラーニング推進機構e

by user

on
Category: Documents
10

views

Report

Comments

Transcript

Page 1 2012/11/19 1 ©2012 戸田 真志 eラーニング推進機構e
2012/11/19
第141回
スケッチインタフェースを核とし
た未整理映像検索
① 大量の未整理映像へのアクセス
- 「こんな感じ」で検索
確かこんな感じ??
昔,こんなの
見たなぁー
イメージ
② 映像想起とスケッチ表現
- 予備実験結果を中心に
キーワードでは表現しにく
い特徴もクエリ化できる
キーワード等である程度
絞り込まれた映像
スケッチ化
ユーザはスケッチで映像を表現
④ 検索結果例
③ 提案システムの概要
- 移動物体領域の推定
⑤ おまけ(戸田の自己紹介)
- 特徴抽出(形状/動き)、マッチング
eラーニング推進機構eラーニング授業設計支援室
©2012 戸田 真志
ランチョンセミナー
1
未整理映像に対する情報アクセス
犬・ボール・遊ぶ・・・??
+
犬・ボール・遊ぶ・・・??
+
※ http://www.youtube.com
1
2012/11/19
映像情報爆発
巷には映像が溢れている
• 大量の画像・映像が蓄積されている
– デジタルカメラや携帯電話などの撮影機材の小型化 / 低価格化
– 記憶装置の小型化 / 大容量化 / 低価格化
– 「ハレ」(記念記録)のメディアから「ケ」(日常記録)のメディアへ
• カメラは最も身近で手軽な記録装置
• 個人でも大量の画像・映像を容易に記録・保存可能
– 無編集な未整理映像
映像情報爆発
巷には映像が溢れている
• 映像の流通も盛ん
– YouTube、ニコニコ動画などの動画共有サイトの利用は日常
– 閲覧のみならず、投稿も
• 大量の蓄積された映像情報を検索
– キーワードを設定しにくい
– キーワードだけでは絞り込めない
2
2012/11/19
キーワード検索はツカエナイ
• YouTubeの場合
– 「犬」「ボール」「遊び」 約3,580件
– 「猫」「ジャンプ」 3,580件
• ニコニコ動画の場合
– 「犬」「ボール」「遊び」 70件
– 「猫」「ジャンプ」 452件
• 目的の映像を見つける為に、
全て映像に目を通す!?
映像検索の問題点
キーワード検索
一般的な検索
(YouTube等)
- シーンを表現し切れ
ない
特徴量による検索
特徴量の
直接設定
類似映像
- 予め映像を保有
- 新規作成の場合
コスト高
- 映像の内容に依存
- うまく設定できない
場合も
クエリの設定方法を考える必要がある
3
2012/11/19
ユーザの「イメージ」をクエリ化
• キーワードだけではアクセスが困難な
動画にアクセスする
• ユーザのイメージ / 記憶 / 心象をそのまま
表現し、クエリとして利用する
手書きスケッチ
手描きスケッチをクエリとした
映像検索システム
• ユーザのイメージ/映像想起をスケッチ表現
確かこんな感じ??
昔,こんなの
見たなぁー
イメージ
キーワードでは
表現しにくい特徴も
スケッチ化
クエリ化できる
キーワードで
検索された映像
スケッチで検索だー!
ユーザはスケッチで映像を表現
目的の映像を
絞り込むことができる
4
2012/11/19
では、どんなスケッチを描く?
• 映像を視聴後、内容を絵で説明してもらう実験(実験条件の
詳細は割愛)
では、どんなスケッチを描く?
5
2012/11/19
では、どんなスケッチを描く?
• 4コマ漫画風にシーンを分割して描画
• 1枚の絵に複数シーンを重畳
• 映像自体を説明するような
描画(映像を再構成する)
ではどんなスケッチを描く?
• 主たる対象以外のものも描く
• 形状や動きはデフォルメ
されるケースもある
• その他の表現(擬態語など)
6
2012/11/19
ではどんなスケッチを描く?
• デフォルメ画
– 棒人間
– へのへのもへじ
• オブジェクトの簡略化
– 円で代用
では、どんなスケッチを描く?
• 映像の描画の仕方にはいくつかのパターンがある
–
–
–
–
特徴的なシーン/全体を1枚画として記述
複数コマに分けて、漫画調に記述
特徴的な代表画像を緻密に
再構成 / 意味を説明
• 対象はデフォルメされて描かれる
• 動きは矢印や動線で描画されることが多い
– 他の表現もある
• 主たる対象以外も描かれる
– 特徴ある背景や色、模様など
7
2012/11/19
注目する表現
• 1枚の絵で表現
• 物体の動きを矢印で
• 印象的な背景
提案手法の概要
• 「物体の形状」「物体の動き」「背景形状」を用いた映像検索
検索クエリ
検索対象動画
3つの特徴量
背景の形状
物体の形状
物体の動き
検索ランキングの作成
8
2012/11/19
提案手法の概要
提案手法の概要
9
2012/11/19
移動物体候補領域の推定
小領域ごとにそれぞれのベクトルを比較
OpticalFlow
(BlockMatchig法)
•候補領域
ロバスト推定法
(LMedS)
候補領域の条件(AND)
1. 2つのMVの方向と大きさが一致
しない
2. 上下左右のいずれかに類似した
MVが存在
カメラによる背景の動き
10
2012/11/19
移動物体候補領域の推定
移動物体領域の決定
• 前フレーム中の移動物体領域をテンプレートとして、現フレー
ム中の移動物体候補領域に対してマッチング処理
11
2012/11/19
特徴抽出
• 物体形状、動き、背景形状を抽出する
映像の特徴量
物体形状特徴量 Fm
動き特徴量 Vm
•フレーム画
像
•移動物体領
域
背景形状特徴量 Bm
•背景領域
形状特徴
• エッジ画素を用いて特徴量抽出を行う
12
2012/11/19
大橋らの形状特徴量



画像全体のエッジの位置関係を256次元のヒストグラム化
描画位置、大きさに不偏
移動物体と背景、それぞれの領域ごとに、各フレームで特徴量を
求める
 Fm = {Fm1,Fm2,…,Fmi}
 Bm = {Bm1, Bm2, …, Bmj}
大橋らのエッジ形状特徴量の計算
注目エッジ画素
その他のエッジ画素
次の画素へ
00000101 = 5
カウント
正規化
2値化
2進数⇒10進数
ヒストグラム
eラーニング推進機構eラーニング授業設計支援室
•※大橋,長島,望月,下平, “エッジ形状に基づいた手書きスケッチ画像検索”,
映像
ランチョンセミナー
25
メディア学会誌,Vol.56, No.4, pp.653-658(2002)
動き特徴量(Vm)


平均ベクトルの連続データ
カメラによる動きの影響を受けない
 Vm ={Vm1, Vm2, …, Vmk}
動き特徴
各フレームにおける平均ベクトル
・・・・・
①オプティカルフロー
②背景の動き
(ロバスト推定)
動き特徴量Vm
・・・・
①-②のベクトル差
平均ベクトル Vmk
13
2012/11/19
マッチング
(C=0.5)
※ 経験的に決
定
映像とクエリ
の距離
動き特徴量
の距離
物体形状特徴量
の距離
背景形状特徴量
の距離
背景形状特徴量抽出
動き特徴量抽出
物体形状特徴量抽出
•クエリ例
形状特徴の距離
映像の形状特徴量 Fm
物体形状特徴量の距離DF
クエリの形状特徴量 Fq
Fm0
•k:ヒストグラムのビン数
•i:フレーム数
背景形状特徴量の距離DB
Fm1
k:ヒストグラムのビン数
j:フレーム数
※ 一つの物体に対してフレーム数分のヒストグラム特徴が
算出されるが、それらの中で距離が最小のものを採用する
最も近いもの
との距離を
採用
eラーニング推進機構eラーニング授業設計支援室
ランチョンセミナー
・・
・
FmI
28
14
2012/11/19
動き特徴の距離
・・・・・
一定ストロークで分割
動き特徴量Vm
・・・・
部分分割した動き特徴量Vmpart
・・・
動き特徴量Vq
DPマッチング
で比較
N:Vm もしくは Vmpart のデータ長
M:Vqのデータ長
w:warping path
検索結果例
15
2012/11/19
検索結果例
1位
目的映像
2位
3位
クエリ
検索結果例
1位
2位
目的映像
3位
クエリ
16
2012/11/19
検索結果例
1位
2位
目的映像
3位
クエリ
(おまけ)戸田の自己紹介
•
•
•
•
•
1993年 東京大学工学部計数工学科卒業
1998年 北海道大学大学院電子情報工学専攻修了
1998年~2001年 セコム株式会社IS研究所
2001年~2012年 公立はこだて未来大学
2012年~
熊本大学総合情報基盤センター
• 専門
– コンピュータビジョン、画像計測
– ウェアラブルコンピューティング、生体計測
– 教育情報システム
17
2012/11/19
環境センシング
産業向け計測
海洋計測
ヒト・センシング
生体計測
インタラクション
アーカイブ/記録
ウェアラブル
生物計測
18
Fly UP