...

研究紹介ポスター - 中山英樹研究室

by user

on
Category: Documents
18

views

Report

Comments

Transcript

研究紹介ポスター - 中山英樹研究室
中山 英樹 研究室 Nakayama Lab.
情報理工学系研究科
創造情報学専攻
Machine Perception Group http://www.nlab.ci.i.u-tokyo.ac.jp/
膨大かつ多様なマルチメディアデータを柔軟に認識・活用し、
世界を理解する知能コンピュータシステムを目指して
人間は、視覚・聴覚・触覚などのさまざまな感覚情報を瞬間的に処理し、内容を認識理解することができますが、
その
情報処理の仕組みはほとんど解明されていません。
コンピュータの計算能力は飛躍的に進歩している一方、
このような
認識能力では未だ人間には遠く及ばないのが現状です。
中山研究室では、
これを実現する技術の確立を目指し、
コアとなる数理手法とアプリケーションの両面から研究を進め
ています。
この分野はまだまだ発展途上であり、未解決の課題が山積みになっています。しかしそれだけに研究対象とし
て非常に魅力的であり、多くのチャンスが眠っていると感じます。世界中で激しい研究開発競争が続いている分野です
が、意欲とアイデアに れた学生さんの参加を心待ちにしています。
数理的コア技術
実世界・Web応用システム
ウェアラブルインタフェース
超多クラスパターン認識
数千・数万クラスに及ぶ物体・シーン認識を実現するために、
機械学習の手法開発や並列分散処理およびGPU実装など、
ソフトウェア・ハードウェアの両面から研究を進めています。
ヒューマンインタフェース・ロボティクスなどを軸に、
コンピュータと実世界をより強力に結びつける革新的な
実世界アプリケーションの実現を目指しています。
Head Mount Display
Training Dataset
1
3
2
1
5
4
bear
brown
grass black
bear
river
2
6
3
shows annotation and retrieval
results to the user
5
white
fox
grass
bear
river snow brown bird
sky
fox
flight
white
4
6
image feature space
Camera
extracts images of
the user’ s view
labels feature space
PCCA
mountains
travel
vacation
snow
lake
night
fireworks
party
firework
fire
Tablet PC
Latent Space
fox
river
brown
travel
italy
europe
london
vacation
sunset
sunrise
sky
beach
clouds
Testing Queries
scuba
australia
underwater
fish
coral
flower
red
nature
macro
plant
recognizes what is the image
and stores them with labels
装着者の見ている映像を認識・記録し続け、言葉による検索を可能とする
人工知能ゴーグルシステム
詳細画像識別
深層学習 (deep learning)
深層学習とは、大規模なニューラルネットワークを生のセンサ
データに直接適用し、識別のために最適な構造を学習する方
法論です。
さまざまな分野で驚異的な性能を発揮することが
分かり注目を浴びていますが、計算コストが非常に大きいこ
とや、チューニングが難しいことが課題となっています。研究
室では、独自の定式化によるシンプルかつ高速高精度なネッ
トワーク学習手法の開発を行っています。
Yellow
throated
Vireo
Leaf
Flower
Fruit
Stem
携帯のカメラから数百種類の
動植物の種類識別を行うなど、
対象に関する詳細な知識を
画像から検索します。 Entire
Kaki
Persimmon
w
Silver
birch
Boxelder
mapple
…
…
…
…
Layer 0
(Raw image)
OUTPUT
Layer 4
Layer 3
ImageCLEF 2013 (画像認識の国際コンペティション) で世界第一位を獲得
Layer 2
Layer 1
Pooling
w ΣBw
w T ΣW w
T
arg max
w
Conv. 1
Conv. 2
Conv. 3
Conv. 4
Σ B w = λ ΣW w
k-means filter
転移学習
Webに れる大量の画像は認識システム構築のための有力
な手がかりですが、実世界の画像とは性質が異なるためその
ままでは使えません。
これを解決するため、マルチモーダル情
報を用いた教師なし知識転移手法の研究に注目しています。
Webマルチメディアデータマイニング
Web上の大量のデータから
価値のある構造を自動的に
発見していきます。
現在、動画像からの視聴者
層推定・推薦など、幅広い応
用先を見据えて研究を開始
しています。
その他のトピック
高速類似検索、リコメンデーション、感性情報処理、
音楽音声認識・検索、
ライフログ、マルチモーダル
Fly UP