2016年度研究室紹介Visual班資料

by user

on 28 марта 2017

Category: Documents

>> Downloads: 4

views

Report

Comments

Description

Download 2016年度研究室紹介Visual班資料

Transcript

2016年度研究室紹介Visual班資料

Multimedia(Visual)班
早稲田大学基幹理工学部
情報通信学科甲藤研究室
1
Visual班とは
• 画像処理の研究を扱っています
• 主な研究分野
▫ 動画像圧縮符号化
▫ 圧縮動画像の画質推定
▫ 画像認識
▫ 車載画像処理
• 画像信号処理からコンピュータビジョンまで、動画像に
関する研究を幅広く扱っています
▫ 動画像に関係するものであれば、何でも研究できる！
2
動画像圧縮符号化
• 符号化とは
▫ 情報をデジタル化し、データの圧縮を行う技術のこと
▫ 現行の方式として、MPEG-2（地上デジタル放送）や、
H.264/AVC（インターネット動画共有サービス、ブ
ルーレイディスク）等がある
MPEG-2方式
746Mbps ⇒ 20Mbps
約1/40に圧縮！
東京タワー
H.264/AVC方式
746Mbps ⇒ 10Mbps
約1/80に圧縮！
ブルーレイディスクレコーダ
3
動画像圧縮符号化
• 最新の動画圧縮符号化方式 → H.265/HEVC
▫ 2013年1月に国際規格として承認された
▫ H.264/AVCの約2倍の圧縮効率を実現している
▫ 4Kや8K（2020年本放送）等の、高解像度動画像の圧
縮に対応地上デジタル放送の16倍の解像度
【H.264/AVC】
【H.265/HEVC】
引用：https://www.ntt-at.co.jp/product/rfs_hevc_sdk/detail.html
4
動画像圧縮符号化
• 甲藤研の研究内容
▫ H.265/HEVCの性能をさらに改善する手法の提案
▫ H.265/HEVCに対し、最新の8K動画像をテスト動画
として使用しながら研究しています！
• 甲藤研における研究例
▫ 奥行き情報を用いて、圧縮による画質劣化が起こりや
すい部分（オクルージョン領域）を検出、劣化を防止
▫ 動き予測が当たりにくい動きを予め検出し、対策する
原画像
符号化ブロック分割画像
フレーム間・内予測画像
動きベクトル画像
5
動画像圧縮符号化
• 画像局所特徴量を用いたH.265/HEVCの符号化
▫ 外部処理を用いて、適切な符号化手法を決定
▫ SURF特徴量のマッチングを2フレーム間で使用
入力例
6
圧縮動画像の画質推定
• 画質推定
▫ 動画像を圧縮すると、様々なノイズが発生
▫ 人間が画質の劣化を判別するのは簡単だが、機械には
高度な技術となる
• PSNR（Peak signal-to-noise ratio）
▫ 原画像と圧縮画像の画素値を比較することで、圧縮画
像の劣化度を評価する指標
▫ PSNRの計算には、原画像が必要となってしまう
格子状のノイズが
発生！
7
圧縮動画像の画質推定
• 甲藤研の研究内容
▫ 原画像を用いずに、圧縮画像のみから画質（PSNR）
を推定する手法の提案
▫ あらかじめ様々な圧縮動画とそのPSNRをSVMに学習
させておくことで、与えられた動画のPSNRを推定
テスト動画
学習動画＋PSNR
テスト動画の
PSNRを推定
8
圧縮動画像の画質推定
• 甲藤研の研究内容（画質推定の応用）
▫ BM3Dによる圧縮動画像の画質改善
 BM3D → 似たブロックを集め、3次元変換によりノ
イズを除去するフィルター
Original Video
Compressed Video
(3500kbps)
(A)
(B)
(C)
(D)
(E)
(F)
Frame of Compressed Video Applied by BM3D
with Input Sigma(a)5(b)10(c)25(d)30(d)35(e)40(f)50
9
画像認識
• 画像認識（コンピュータビジョン）とは
▫ 人間が当たり前に行っている視覚の機能を、なんとか
コンピュータに持たせようという研究分野
• 甲藤研における研究例
▫ KinectとPCLを用いたindoorの3Dレジストレーション
▫ 低出生体重児・新生児・乳児の身長推定
▫ 温度情報を用いた、画像内の人物検出の精度改善
？？？
女の人だ！
人間
コンピュータ
10
画像認識
• KinectとPCLを用いたindoorの3Dレジストレーション
▫ Kinectで部屋を撮影し、Point Cloudを作成
▫ レジストレーション（位置合わせ）により合成
▫ 合成する際のレジストレーション精度には問題点が多
く、その改善を目指す
KINECT
11
画像認識
• 低出生体重児・新生児・乳児の身長推定
▫ 新生児・乳児の身長発育データは重要だが、幼児と異
なり、身長の測定に手間がかかる
▫ そこで、画像・映像から正確な身長測定法を提案する
 Kinect により被写体を撮影し、寝ている状態で身長
を推定する
12
画像認識
• 温度情報を用いた、画像内の人物検出の精度改善
▫ 人物検出の一般的な手法である『HOG特徴量を用いた人物検出』は
完全ではなく、誤検出を伴うことがある
▫ 少しでも誤検出を減らすため、温度情報や類似度を利用して、条件
を満たさない検出結果を除去し、検出精度を上げる
原画像(可視光画像)
原画像(赤外線熱画像)
透視投影変換適用後の赤外
線熱画像
類似度の例
人物検出結果
(参考)従来手法による人物
検出結果
13
車載画像処理
• 自動車、鉄道の車載カメラによる画像を用いた処理
▫ GPSデータ等、他のセンサ情報を用いることも
▫ 自動車・列車の走行改善と、走行データから新たなも
のを生み出すという、2通りのアプローチがある
• 甲藤研における研究例
▫ 自動車の車載画像処理
 道路交通標識の自動認識
 パノラマ画像の生成
 道路案内標識の文字抽出
▫ 鉄道の車載画像処理
 レールの検出
 黄色い線の検出
14
車載画像処理
• 道路交通標識の自動認識
道路画像から標識を自動認識する処理の流れ
道路画像入力
円形部分抽出
特徴点抽出
特徴点のマッチング
15
車載画像処理
• パノラマ画像の生成（イメージモザイキング）
▫ 複数の画像を合成し、1枚の画像を生成
特徴点の検出と記述
特徴点のマッチング
画像変換行列を求め、投影
16
車載画像処理
• 道路案内標識の文字抽出
▫ 自動運転システム、地図の自動更新などに利用可能
入力画像
青色・標識座標抽出
文字抽出
標識抽出
文字認識
17
車載画像処理
• レールの検出
▫ エッジの探索により、曲線を含むレールを検出
マスク処理、平滑化
エッジ抽出
レール検出
18
車載画像処理
• 車載カメラ映像における人物検出
▫ HOG特徴量による人物検出は、フレーム単位の処理では誤検出
が多く、検出精度が低い
▫ 誤検出を削減するためにフレームの連続性を利用し、オプティカ
ルフロー推定を用いることで検出精度の向上を図る。
元画像
提案手法
19
いざ、Visual班へ！
• Visual班で学べること
▫ 画像処理プログラミング：Matlab、C、C++
▫ 画像処理・機械学習等の知識
 技術研究所や学会で、最先端の画像処理を学べる
• 外部機関との連携
▫ 日本放送協会（NHK）
 符号化に関するインターンシップ
▫ サムスン電子
 画質推定に関する共同研究
▫ グローバル・サーベイ株式会社
 自動車車載画像処理に関するデータ提供
▫ 情報通信研究機構（NICT）
 鉄道車載画像処理に関する共同プロジェクト
20
いざ、Visual班へ！
• 主な就職先
▫ 日本放送協会（NHK）
▫ TBSテレビ
▫ NTTコミュニケーションズ
▫ KDDI株式会社
▫ パナソニック
• 画像処理は、今後も大きな需要がある分野
▫ 解析のためのツールやデータも充実しており、実験結
果が可視化できるため、取り組みやすい
画像処理の最先端を、一緒に研究しよう！
21