Comments
Description
Transcript
ジニアス錠 - Microsoft
The Microsoft Conference 2014 ROOM D アジェンダ • マシーンラーニングとは • Contoso ドラックの課題 • Azure Machine Learning の紹介 • モデルの開発・学習・評価・配置 • 料金体系 2 セッションの目的とゴール 3 4 架空の企業: Contoso ドラッグ 登場人物 松村 健 (40 歳) 平井 昌人 (0x32 歳) 神奈川県の 5 店舗を管理する エリア マネージャー Contoso ドラッグに勤務する 天才エンジニア • 経理部として県内の複数店舗を担当 後、昨年からエリア マネージャーに 昇格 • 店舗に対する情報提供、売上増加の ための改善提案を担当 • Contosoドラッグのデータ分析を担 当しており、経営陣や各店舗のマ ネージャから色々と無理難題を押し 付けられ、苦悩する毎日。 5 改善のための要件: エリア マネージャー 村松健の場合 マイクロソフトのソリューションとその効果 神奈川県の 5 店舗を管理する エリア マネージャー 課題 来店者数の回復 売上向上 (客単価向上) 改善方法 店舗ごとの顧客属性分析 商品ごとの販売予測 来店者数の把握と予測 来店頻度の高い顧客の創造 クラウド 来店頻度の高い顧客の 創出と客単価の向上 Azure Machine Learning 高速 DWH の構築 SQL Server 2014 更新可能な列ストア インデックス 簡単な販売予測 Power BI for Office 365 エリアマネージャー 自身による 自由なデータ分析 Power BI 客単価の向上 他店舗成功例をもとにした 棚割り改善提案 6 改善のための要件: ソリューション マシーンラーニング(機械学習)を利用してクラウドベースの サービスとして構築する • 顧客属性分析 • 来店者数の把握と予測 • レコメンデーション • クレジットカード不正検出 7 分析スペクトラム Descriptive 記述 Diagnostic 診断 Predictive 予測 Prescriptive 規範 何が起こっている? なぜそうなった? これからどうなる? どうすべきなのか? Traditional BI : データの可視化 Information Worker IT Professionals 定型レポート (SSRS) セルフ サービス BI (Power BI, SSAS) Deployed ML : 将来の予測 Data Scientists マシーンラーニング (Azure ML, R) 8 What is "Machine Learning" ? • 機械学習(Machine Learning) • 人工知能における研究課題の一つで人間が自然に行っている学習能力 と同様の機能をコンピューターで実現しようとする技術・手法のこと • 機械学習を利用している代表例 • • • • • • • • • • • スパムフィルター 音声認識・画像認識・顔認識・文字認識(OCR) 漢字変換の入力予測・翻訳エンジン 検索エンジン・結果ランキング 天気予報・渋滞予測 リコメンデーション DNA 解析・病気の予測診断 保険・証券取引 チェス・将棋などのゲーム 鉄道ダイヤのスケジューリング エレベータの挙動制御 9 マシーンラーニングの必要性 • Contoso ドラッグ – オンライン・ストア • 「ジニアス錠」を買う人に「ビタミンX」「ビタミンY」「ビタミンZ」から 最適なリコメンド商品を提示せよ • • • • • • • 「ジニアス錠」を買った人の多くは「ビタミンX」も買っている(60%) 「ビタミンX」はよく売れている(3000個) 「ビタミンY」を買った人は、ほぼ「ジニアス錠」も買っている(95%) 「ビタミンY」を買っている人は少ない(300個) 「ジニアス錠」と「ビタミンZ]を一緒に買った人は非常に少ない(5%) 「ジニアス錠」とよく似た「じにらす錠」と「ビタミンZ」は多くの人が一緒に購入している(80%) 「ビタミンZ」はそこそこ売れている(1500個) 商品は10万点 複雑すぎ データ多すぎ ? 10 Azure Machine Learning(Azure ML) • マシーンラーニングを行う Azure のサービス • 環境構築のための時間は不要 • 高品質な機械学習アルゴリズムを従量課金で提供 • ブラウザーベースの GUI ツール(ML Studio)でデータの抽出からクリーニング、 前処理、トレーニングなどすべての操作が可能 • 複数のメンバーで共同開発することも可能 • R 言語をサポート • Web サービスとして公開・配置が容易 • 独自のモジュール(アルゴリズム)を開発することも可能 11 ML Studio • Azure ML で作業するブラウザベースの分析フロー管理ツール(GUI) プロパティ (パラメータ) エクスペリメント (分析フロー) メニュー アイテム (部品) 12 Azure Machine Learning でのフロー 1 1. 目的の定義 • 何の目的で何を分析・予測したいのか 2. トレーニングデータの準備 • 結果を含むトレーニングデータを用意 • クレンジング、Feature 選択、スプリット 5 2 3. モデル開発と学習 Business Insights • 分析フォローの作成 4. モデルの評価 • 最適なアルゴリズムの選択 • パラメータの調整(Sweeping) 4 3 5. モデルの配置・API の公開 • Web サービスのテスト • 公開・配置 13 R 言語対応 • R script using R 3.1.0 • R ライブラリの zip ファイルをデータセットとして登録・利用 • 既存の R スクリプトやライブラリを組み合わせて生産性を向上 • Execute R Script モジュール • R スクリプトの記述と実行を制御する Azure ML のモジュール • Plot したグラフなども表示可能 登録済の 既存Rライブラ リを Drag & Drop 14 SDK – Azure ML モジュール開発 • Experiment 上で利用可能な独自のモジュールを開発 • 現在、Private Preview • Visual Studio にテンプレート が入る(C#) 15 Machine Learning • 料金の詳細 プレビュー の料金 ML Studio Service ML API Service 実行時間 ¥38.76 / 1時間 ¥76.50/ 1時間 実行回数 無料 ¥18.36 / 1,000 回 • プレビュー期間中のストレージは米国中南部にプライマリが格納されます • ML Studio Service で格納したデータ サイズに応じて Azure Storage (GRS: ページ BLOB) の費用とストレー ジ トランザクションの費用が別途発生します • ML Studio に格納されているデータをダウンロードする場合にはデータ転送料金が別途発生します • サポートおよび SLA • プレビュー期間中は SLA は提供されません • ご利用可能な地域 • 米国 - 米国中南部(South Central US) 16 Contoso ドラッグの Azure ML コスト(月額) • モデルの作成&メンテナンス • ML Studio の実行時間 • 初期開発: 200 時間 × @38.76 ≒ 7,752円 • 月次メンテ: 6 時間 × @38.76 ≒ 233円 • 日々の分析処理 • 200 店舗が 1 日に 1 回呼び出して 1 回の平均処理時間が 3 分として30日 イニシャルコスト ランニングコスト ¥7,752 ¥233 ML API ¥0 ¥22,968 Storage (¥2,587) ¥2,587 ML Studio 合計 ¥7,752 ¥25,788 • 回数:200店舗 × 30日 × @0.01836 ≒ 18円 • 時間:200店舗 × 0.05時間 × 30日 × @76.5 ≒ 22,950円 • ストレージ料金 • 200 店舗の全データサイズが 500 GB で 月あたり 20 GB のダウンロードが発生 • ストレージ代金: 500 GB × @4.82 ≒ 2,410円 • データ転送量: 20 GB × @8.88 ≒ 177円 17 TAP & Preview Customers • 検索エンジン • 医療診断(デジタル病理学) • スパムメール検出 • マルウェアのアラート • 画像処理・顔認識 • 金融市場の予測 • DNA 配列の分類 • 音声認識や文字認識 • ゲーム戦略 • データベース容量の需要予測 • クレジットカード不正使用の検出 • 解約の可能性の高いユーザー抽出 • 顧客セグメンテーション • ダウンタイム予測 • 部品・器機の故障予測 etc. 18 リファレンス • Machine Learning センター • http://azure.microsoft.com/ja-jp/documentation/services/machine-learning/ • Machine Learning 料金体系 • http://azure.microsoft.com/ja-jp/pricing/details/machine-learning/ • ML Studio ヘルプ • https://studio.azureml.net/Help/html/96b39d63-f6dd-4461-a244-b90ab3891cda.htm • チュートリアルとガイド • http://azure.microsoft.com/ja-jp/documentation/services/machine-learning/tutorials/ • ML Studio モジュール・リファレンス • https://studio.azureml.net/Help/html/C72A3E1A-29CF-46C1-BF98-BD3D30D62C96.htm 19 参加資格 3,000円に付き1回 賞品 2,500円分の Contoso ポイント ルール Wrap Up マシーンラーニングをクラウドで! 数多くのアルゴリズムを提供! 簡単作成&デプロイメント 超低コストで高度な分析・予測システムを! 誰でもデータサイエンティスト 21 Azure Machine Learning をお試し下さい http://azure.microsoft.com/ja-jp/services/machine-learning/ 22