Comments
Description
Transcript
研究紹介ポスター - 中山英樹研究室
中山 英樹 研究室 Nakayama Lab. 情報理工学系研究科 創造情報学専攻 Machine Perception Group http://www.nlab.ci.i.u-tokyo.ac.jp/ 膨大かつ多様なマルチメディアデータを柔軟に認識・活用し、 世界を理解する知能コンピュータシステムを目指して 人間は、視覚・聴覚・触覚などのさまざまな感覚情報を瞬間的に処理し、内容を認識理解することができますが、 その 情報処理の仕組みはほとんど解明されていません。 コンピュータの計算能力は飛躍的に進歩している一方、 このような 認識能力では未だ人間には遠く及ばないのが現状です。 中山研究室では、 これを実現する技術の確立を目指し、 コアとなる数理手法とアプリケーションの両面から研究を進め ています。 この分野はまだまだ発展途上であり、未解決の課題が山積みになっています。しかしそれだけに研究対象とし て非常に魅力的であり、多くのチャンスが眠っていると感じます。世界中で激しい研究開発競争が続いている分野です が、意欲とアイデアに れた学生さんの参加を心待ちにしています。 数理的コア技術 実世界・Web応用システム ウェアラブルインタフェース 超多クラスパターン認識 数千・数万クラスに及ぶ物体・シーン認識を実現するために、 機械学習の手法開発や並列分散処理およびGPU実装など、 ソフトウェア・ハードウェアの両面から研究を進めています。 ヒューマンインタフェース・ロボティクスなどを軸に、 コンピュータと実世界をより強力に結びつける革新的な 実世界アプリケーションの実現を目指しています。 Head Mount Display Training Dataset 1 3 2 1 5 4 bear brown grass black bear river 2 6 3 shows annotation and retrieval results to the user 5 white fox grass bear river snow brown bird sky fox flight white 4 6 image feature space Camera extracts images of the user’ s view labels feature space PCCA mountains travel vacation snow lake night fireworks party firework fire Tablet PC Latent Space fox river brown travel italy europe london vacation sunset sunrise sky beach clouds Testing Queries scuba australia underwater fish coral flower red nature macro plant recognizes what is the image and stores them with labels 装着者の見ている映像を認識・記録し続け、言葉による検索を可能とする 人工知能ゴーグルシステム 詳細画像識別 深層学習 (deep learning) 深層学習とは、大規模なニューラルネットワークを生のセンサ データに直接適用し、識別のために最適な構造を学習する方 法論です。 さまざまな分野で驚異的な性能を発揮することが 分かり注目を浴びていますが、計算コストが非常に大きいこ とや、チューニングが難しいことが課題となっています。研究 室では、独自の定式化によるシンプルかつ高速高精度なネッ トワーク学習手法の開発を行っています。 Yellow throated Vireo Leaf Flower Fruit Stem 携帯のカメラから数百種類の 動植物の種類識別を行うなど、 対象に関する詳細な知識を 画像から検索します。 Entire Kaki Persimmon w Silver birch Boxelder mapple … … … … Layer 0 (Raw image) OUTPUT Layer 4 Layer 3 ImageCLEF 2013 (画像認識の国際コンペティション) で世界第一位を獲得 Layer 2 Layer 1 Pooling w ΣBw w T ΣW w T arg max w Conv. 1 Conv. 2 Conv. 3 Conv. 4 Σ B w = λ ΣW w k-means filter 転移学習 Webに れる大量の画像は認識システム構築のための有力 な手がかりですが、実世界の画像とは性質が異なるためその ままでは使えません。 これを解決するため、マルチモーダル情 報を用いた教師なし知識転移手法の研究に注目しています。 Webマルチメディアデータマイニング Web上の大量のデータから 価値のある構造を自動的に 発見していきます。 現在、動画像からの視聴者 層推定・推薦など、幅広い応 用先を見据えて研究を開始 しています。 その他のトピック 高速類似検索、リコメンデーション、感性情報処理、 音楽音声認識・検索、 ライフログ、マルチモーダル