...

情報化社会におけるデータ解析 - 名古屋大学工学部・大学院工学研究科

by user

on
Category: Documents
18

views

Report

Comments

Transcript

情報化社会におけるデータ解析 - 名古屋大学工学部・大学院工学研究科
情報化社会におけるデータ解析
名古屋大学大学院 工学研究科計算理工学専攻
古橋研究室
背景
企業A
現場の人間 大規模データ
商品
消費者
• SNS,IoTなどの情報・通信サービス/産業の拡大 求められる能力
膨大なデータの蓄積!!
• 解析は容易でなく,多くの企業で宝の持ち腐れに…
現場に見える解析が求められている.
統計解析,多変量解析
機械学習,etc.
データ解析の難しさ
様々なデータ形式+異なる現場のニーズ
時系列
多変数
テキスト
アンケート
・・・
人手では把握困難な膨大な情報 + 解析を難しくしている諸問題
ノイズ
ゴミデータ
非正規性
スパース性
・・・
それぞれに適した,データ管理,前処理,解析手法,結果の解釈が必要
我々の取り組み
データ管理
企業(メーカー5社,インフラ2社)との共同研究
前処理
解析
・大規模データの体系的 ・フィルタリング
・ブランクへの対処
管理・縮約
結果提供
・手法の選択,改良
・可視化
・何をどう見せるかの検討 ・ツール化
現場の納得のために 1.全工程,綿密な意見交換 2.結果は見える形で
多変量解析による傾向把握
2.5
イベントと変数の因果関係
7
250
6
全体
2
A国
因子1
1.5
0
0.2
0.4
0.6
0.8
1
1.2
B社
C社
対応
保証
1
3
100
0
A社
1.5
4
150
0.5
2
5
200
1
話題の評点への影響力
300
0.5
2
50
1
0
0
0
‐0.5
動作
速さ
コスト
1.4
因子2
手法ごとの
断片情報
‐1
多変量解析
統計解析
可視化
テキスト解析
機械学習
新たな知見
の獲得
テキストデータの解析技術
名古屋大学計算理工学専攻
古橋 武、吉川 大弘
新規性・独創性
研究開発の概要
膨大なテキストデータを効率良く
解析し,聴衆に分かりやすく提示
したい.
見える化によりグラフ
上での掘り下げ解析を
可能としている.
HK Graph (Hierarchical Keyword Graph)
辞書による
集約
概
念
N‐gram
シソーラス
表記による
集約
特徴分析
類義語の集約(概念化)
見える化
分析・解析
特徴分析
N-gram
(Cabocha)
評判情報
語句の見える化
属性の見える化
共起関係の見える化
原文参照
掘り下げ
類義語の集約
(概念化)
シソーラス
属性データ
形態素解析
文章データ
HK Graph
語句に
分割
時系列分析
評判分析
評判分析
注目分析
時系列分析
内容把握
多変量解析
注目分析・多変量解析
企業への期待
テキストデータをお持ちの方は当研究室にデータ解析をお任せください.
Fly UP