Comments
Description
Transcript
Apache* Hadoop* を使用した状況認識型レコメンデーション
IT@Intel ホワイトペーパー インテル IT 部門 ビッグデータ 2014 年 2 月 Apache* Hadoop* を使用した状況認識型 レコメンデーション・システム 概要 CARS はレコメンデーション・ エンジンが処理する 膨大な量のデータを管理し、 その場の具体的な状況を表す コンテキスト・パラメーターを インテリジェンスとして付加します。 ビッグデータの予測分析には、増大し続けるデータ・ウェアハウス、常に変化するコンテキスト・ パラメーター、反応スピードの確保といった課題があります。インテル IT 部門ではこうした課題へ の対処が可能な、状況認識型レコメンデーション・システム(Context-Aware Recommender System; CARS)を開発しました。 CARS は、レコメンデーション・エンジン(製品 やサービスの評価を予測する情報フィルタリン グ・システム)が処理する膨大な量のデータを 管理し、日時、場所、天候など、その場の具体 的な状況を表すコンテキスト・パラメーターを インテリジェンスとして付加します。これにより ユーザーには、ユーザー自身の過去の選好と コンテキスト・パラメーターとの組み合わせに 基づいた、より適切なレコメンデーションが提 示されます。 CARS の構 築に Apache* Hadoop* 対 応 インテル ® ディストリビューション(インテル ® Oren Razon インテル IT 部門 テクニカルリード れられる確率が高まり、より効率的な事業 展開が可能となり、収益の増加につながり ます。 • 再利用可能なレコメンデーション・エンジン を構築:最初のインフラストラクチャーの構 築には数カ月がかかりました。しかし、それ が完成した現在では、わずか 4 ∼ 6 週間で CARS を他のビジネス部門向けに再利用で きるようになりました。 最初の CARS アーキテクチャーは、位置情報 ディストリビューション)を利用したことにより、 を活用したサービスを提供するビジネス部門 きました。 ケーションを使用する顧客に対して、お勧めの インテル IT 部門は以下の成果を得ることがで Yonatan Dolan インテル IT 部門 プロジェクト・マネージャー うになることで、レコメンデーションが受け入 • 開発にかかる時間を短縮:製品レベルの インテル ® ディストリビューション環境は、必 要なサポートを提供するだけでなく、本稼動 用のサービスレベル・アグリーメント (SL A) や運用要件も満たします。インテル® ディスト リビューションには、認証や権限の管理機能 に加えて包括的なシステム監視やログ記録 のツールも付属しているため、独自に開発す ることなく既存の機能をそのまま使用できま す。また、実行の最適化やチューニングも可 能であり、多くの労力を費やすことなく、最 大限のパフォーマンスを得ることができます。 • 増収チャンスを拡大:ビジネス部門では、よ り適切なレコメンデーションを提供できるよ 向けに構築しました。これは、モバイル・アプリ クーポンを提示するというものです。8 週間の パイロット・プロジェクトを実施しましたが、この ソリューションを使用した顧客グループは、位 置情報のみに基づいてクーポンを受け取った 比較対照のグループよりも 45% も多くのクー ポンを交換しました。 最初のパイロット・プロジェクトの成功後、この CARS はセールス・マーケティングのビジネス 部門向けに再利用されました。彼らも、適切な 製品を適切な顧客に、 適切なタイミングで提案 するための支援を必要としていました。CARS は柔軟性に富み、多様な利用用途に応用でき るため、他のビジネス部門でも、ビッグデータ の予測分析機能の有効活用に CARS を利用 する方法を模索しています。 IT@Intel ホワイトペーパー Apache* Hadoop* を使用した状況認識型レコメンデーション・システム 目 次 概 要................................ 1 背 景................................ 2 ソリューション. . . . . . . . . . . . . . . . . . . . . . . . 3 顧客側のユーザー体験 . . . . . . . . . . . 3 システム・アーキテクチャー . . . . . . . 4 データフロー . . . . . . . . . . . . . . . . . . . . . 5 パイロット・プロジェクト . . . . . . . . . . . 6 背景 レコメンデーション・エンジンは、ユーザー の過去の行動や、明示的または非明示的な フィードバックに基づいてユーザーの選好を 予測することを目的としています。このエン ジンを利用することで、アプリケーションは ユーザーに最適な情報(製品やサービスの一 覧など)を提示することが可能になります。位 置情報を活用したサービスを提供する部門や セールス・マーケティング部門など、インテル の多くのビジネス部門ですでにレコメンデー CARS を再利用する . . . . . . . . . . . . . . . . 6 まとめ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 関連情報 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 協力者 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 略 語 ............................... 7 る必要があることが分かりました。コンテキス ト情報を使うことによって、過去の行動から読 み取られる傾向に沿ったレコメンデーションを 提供することが可能になります。コンテキスト す。広告、クーポン、プロモーション、リマイン 化データを使用可能な情報と知識に変換する ダー、製品、アラートなど、どのような内容のレ コメンデーションであっても、この点は変わりま 使うことを考えました。ただし、天候や時間な は、多様なソースの数テラバイト単位の構造 作業が必要になります。 せん。状況認識型(context-aware) レコメン インテル IT 部 門では、もう 1 つの目 標とし ションのランク付けに当たってコンテキスト・パ インテルの他のビジネス部門も利用できる汎用 特性など) も考慮します。CARS を活用するこ た。例えば、インテルのセールス・マーケティン デーション・システム(CARS)は、レコメンデー ラメーター(時間、場所、天候、季節、デバイス て、レコメンデーション・エンジンを活用する 的なソリューションを開発することを目指しまし とで、組織は市場での競争を優位に進めるこ グ・グループでも、適切な製品を適切なタイミン めには数テラバイト (TB)のデータを処理し、 いました。 とができますが、CARS が適切に機能するた 作成したモデルをほぼリアルタイムで利用可能 グで顧客に提供するための支援を必要として CARS の開発に取り組み始めてから、次のよ このため、CARS の構築は非常にハードルの うな課題に直面しました。 インテル IT 部門は、位置情報を活用したサー • 位置情報サービス部門の収益増を確保する ために、短期間で開発しなければならない。 近に行った選択に関して最も適切なクーポン を提供できる CARS の開発を求められまし た。このビジネス部門は、有料の企業間取引 (B2B)モデルを無料の企業対消費者間取引 (B2C)モデルに転換したモバイル・アプリケー ションを運用していました。しかし、手数料収 入が得られないと判断したこのビジネス部門 では、それに代わる新しい収入源として、位置 情報を活用した広告をクーポンという形で配 www.intel.co.jp/itatintel めの取り組みを通じて、標準的なレコメンデー ション・エンジンをコンテキスト情報で強化す ど、その他のパラメーターを組み込むために ビスを提供するビジネス部門から、顧客が直 2 まり、顧客が行動を起こす可能性を高めるた ユーザーに適切なレコメンデーションを提供す 高いものとなっています。 IT@Intel は IT プロフェッショナル、マネー ジャー、エグゼクティブが、インテル IT 部 門のスタッフや数多くの業界 IT リーダー を通じ、今日の困難な IT 課題に対して成 果を発揮してきたツール、手法、戦略、ベ スト・プラクティスについて詳しく知るため の情報源です。詳細については、http:// www.intel.co.jp/itatintel / を参照し てください。あるいはインテルまでお問い 合わせください。 レコメンデーションの妥当性を高めるため、つ の手掛かりとしては、位置情報以外の情報も にする複合的なアーキテクチャーが必要です。 IT@Intel 増大に直結しています。 ション・エンジンが活用されています。 るには、コンテキスト (状況情報)は不可欠で 他の利用用途に 割合)の向上に役立つ CARS ソリューションで した。引換率の向上は、クーポン広告収入の 信することにしました。そこで必要となったの が、引換率(顧客に提示されたクーポン数に 対して、顧客が行動を起こしたクーポン数の • レコメンデーションの要求と応答を、複数の ソースに分散するコンテキスト・データを参 照しつつ、1 秒未満で処理しなければなら ない。 • データ・ウェアハウス、データ処理アルゴリズ ム、モバイル配信システムを含む複合的なシ ステム統合を行わなければならない。 Apache* Hadoop* を使用した状況認識型レコメンデーション・システム IT@Intel ホワイトペーパー ソリューション Apache* Hadoop*対応インテル® ディストリビューション インテル IT 部門では、特定の利用用途(今 導入、構成、監視、 アラート、 セキュリティー 回は、モバイル・クライアントに配信されたクー ポンの引換率の向上)に対応する CARS の 開発からスタートしました。その設計では、 ビッ グデータの予測分析を利用する他の利用用 途にも応用できるシステムを目指しました。そ Oozie インテ ル ® ディストリビューション( 図 1)を CARS インフラストラクチャーに統合することに より、当面の利用用途に対して適切に機能す ることはもちろん、将来の利用用途にも応用で Pig* スクリプト処理 Mahout* 機械学習 Hive* SQLクエリー データ交換 ZooKeeper* こで CARS の 土 台とした の が、Apache* Hadoop* 対 応インテル ® ディストリビュー ション(インテル ® ディストリビューション)で す。これには、巨大なデータセットを多数の コンピューター・クラスターで並列分散処理す る機能があります。 ワークフロー Sqoop* 調整 HBase* 列指向 ストレージ MapReduce 分散処理フレームワーク Flume* ログ収集 Hadoop* 分散ファイルシステム インテルの独自開発 オープンソースを基にインテルが機能強化に貢献 変更なしで組み込まれたオープンソース・コンポーネント 図 1. Apache* Hadoop* 対応インテル® ディストリビューション(インテル ® ディストリビューション)のコンポーネント。 インテル ® ディストリビューションにより、CARS をインテル内のさまざまな利用用途に再利用、再構成することが可能 になります。 きるシステム・アーキテクチャーとデータフロー を実現することができました。 顧客側のユーザー体験 CARS は、ビジネス部門の顧客に情報を提 供する無料のモバイル・ナビゲーション・アプリ ケーション(図 2)に統合されました。そのビジ ネス部門では、位置情報に基づく広告を使っ て収益を最大化するために、アプリケーション 内で行われているナビゲーションを妨げること なくクーポンを配信し、その引換率を高めるこ とを目指しました。この目標を達成するため、 CARS は顧客のナビゲーション・ルートまたは 1 行検索(SLS) キーワードに基づいてクーポン を配信するようにしました。1 ナビゲーション・ルート クーポンが提示される。 クーポンの詳細が表示される。 クーポンが取得される。 図 2. CARS で顧客にクーポンを配信するモバイル・ナビゲーション・アプリケーションの例。 顧客が目的地に向かって移動するときに、近 くのレストランや店舗などの注目地点(Point Of Interest; POI)から提供されているクー ポンがビジネス部門によって収集されます。 1 顧客のプライバシーを保護するため、顧客の身元が 分かるような個人情報は隠しました。しかし、過去の ナビゲーションなど、アプリケーション内で行われた 行動は利用しました。こうした情報は、より適切なレ コメンデーションを作成するために不可欠でした。 www.intel.co.jp/itatintel 3 IT@Intel ホワイトペーパー Apache* Hadoop* を使用した状況認識型レコメンデーション・システム CARS は利用可能なクーポンの一覧にアクセ 要求 ナビゲーション・ ルートを設定 応答 POIからのサービスが デバイスに配信される 負荷分散 Webサーバー1 データの前処理と分析はオフラインプロセスで ポンの価値、時間、天候の条件とを照合し のデータを集積して、オンラインプロセスが使 における過去の選好、想定される迂回路、クー ます。CARS はこうした情報をすべて処理し、 演算層 … Webサーバーn NoSQL 分散ストレージシステム 妥当性の高い順にランク付けしたクーポンの 一覧を出力し、顧客のルート上の移動に合わ オフライン タ・ウェアハウスで行われます。このデータ・ウェ たリストの提示まで)は 1 秒以内に行われま す。顧客はルート上を移動しながらクーポンを るかを決定します。顧客に提示されるクーポン 前処理 データ・ウェアハウス 予測モデル Apache* Mahout* インテル® ディストリビューション 図 3. CARS のアーキテクチャー。オフラインプロセス には、データの前処理とデータの分析が含まれます。 オンラインプロセスは、結果を解釈して最終的なレコ メンデーションの一覧を作成する処理を行います。 データを統合します。データの前処理はデー アハウスはリレーショナル・データベースに保 管された大量の構造化データを処理すること ができるシェアード・ナッシングの超並列処理 (MPP)アーキテクチャー上に構 築されてい ます。内部データソースと外部データソースの 併用によって、ユーザーの過去の行動、クー が多くなりすぎないようにするため、ルートはビ ポンデータ、地理空間情報、郵便番号、社会 分割されます。顧客には、各区間内で最も適 リングのために提供されました。 1 回の移動で最大 3 個のクーポンが表示され データの 分 析は、高 度な 分 析 処 理を含 む ジネス部門によっていくつかの地理的区間に データの分析 データの前処理では、各種ソースからデータ こうした一連の処理(クーポンの収集から、他 ためにクーポンを保存するか、あるいは無視す データ 用する機械学習モデルを生成します。 を収集し、必要に応じて変換を行い、収集した 見て、その地点まで迂回するか、後で使用する オンライン 行われます。これは、週次で実行され、すべて せてそれらを提示します。 のコンテキスト情報との照合、ランク付けされ カスタムのJava*ベースローダー オフラインプロセス スし、その一覧と、その顧客の同じような状況 切なクーポンだけが表示されます。実際には るように設定しました。 1 行検索(SLS)オプション 経済学的特性、日時、天候情報がデータモデ バッチ処理として行われます。今回のソリュー ションは、データ量の 増 加に合わせて線 形 に拡 大するように設 計されました。このソ 顧客が住所や POI を見つけるために検索フ リューションの基盤として使用されているのが ゲーション・ルートの場合と変わりませんが、 ムです。これは MapReduce プログラミング・ レーズを入力した場合、データフローはナビ CARS は、コンテキスト分析やクーポンのラン ク付けにおいて、その SLS キーワードも考慮 に入れます。そして、顧客には、最も適切なクー ポンの一行バナーが他の検索結果と一緒に 表示されます。 システム・アーキテクチャー CARS は、データの前処理、データの分析、 結果の解釈というフェーズで構成されるデー タ・マイニング・プロセスの実用例の 1 つです。 データの前処理と分析はオフラインのバッチ インテル® ディストリビューション・プラットフォー パラダイムを使用し、巨大なデータセットを複 数のコンピューター・クラスターで並列分散処 理することができます。位置情報サービス部門 には 6TB 超のデータがありましたが、顧客層 の拡大に伴ってデータがさらに増えることと、 データソース自体も増えることを計画しておく 必要がありました。 CARS インフラストラクチャーにインテル ® ディ ストリビューションを使用することの利点はこ れだけではありません。例えば、インテルのセ キュリティー管理とのシームレスな統合、オー 処理で行うことができますが、結果の解釈(最 プンソース・コミュニティーとの緊密な関係、 処理)は、顧客のナビゲーション・ルートまたは リットも得られました。これらによって、機械学 としてオンラインで行われる必要があります。 ました。 インのプロセスにどのように分割したかを示し データの分析では、前処理フェーズからの膨 終的なレコメンデーションの一覧を作成する SLS キーワードごとに生成される要求の一部 図 3 に、各コンポーネントをオフラインとオンラ ます。 インテル ® テクノロジー向けの最適化などのメ 習アルゴリズムの実行を高速化することができ 大な量のデータに対して Apache* Mahout* を使用する高度なアルゴリズムを実行する必 要があります。そのために、データベースには 大量のメモリーとストレージが必要とされます。 4 www.intel.co.jp/itatintel Apache* Hadoop* を使用した状況認識型レコメンデーション・システム IT@Intel ホワイトペーパー Mahout* には、レコメンデーション・エンジン、 分類、クラスタリングのコア・アルゴリズムが、 すぐに使えるスケーラブルな Java* ベース・ラ イブラリーとして含まれています。 モデルには、数多くの手法を検証した長期の 調査フェーズを経て、協調フィルタリングやコン テンツベース・フィルタリングなどが使用されま した。協調フィルタリングは、多数の顧客の選 択や好みの情報を累積し、それを基に特定の の上層には負荷分散機能を設定し、ワーク ロードを均等に分散します。最終的なランク 付けされたクーポンの一覧は、JavaScript* Object Notation(JSON)メッセージとして 配信されます。 データフロー 図 4 は、事前フィルタリング、モデリング、事 ローを示しています。アプリケーションによる 奨されるアイテムの特性に基づきます。これら 覧を作成するところから始まります。今回の例 の計算の結果はすぐに使用できるモデルテー ブルとして完成され、後でオンラインプロセス によって使用されます。 オンラインプロセス 顧客サービスは、レコメンデーション候補の一 最終的にレコメンデーションを提供するには、 が含まれます。 ポンを事前に入手しておく必要があります。こ 1 秒以内に要求に対する応答を返します。こ 特定のルート上の使用可能なすべてのクー のような候補となるクーポンは、顧客がアプ リケーションを起動した後、ルートのナビゲー ションまたは 1 行検索の操作を通じて、複数 のデータソースからビジネス部門によって集め られます。候補となるクーポンが収集された ら、CARS は、コンテキスト情報も考慮した知 CANDIDATE CANDIDATE CANDIDATE CANDIDATE 候補 ランク付けされた候補 事後フィルタリング 調整ルール:クーポンの有用性、 最少の迂回と最少の遅延(MDMD)、および追加の ルールに基づくレコメンデーション・リストの調整 最終的なランク付け 候補1 候補2 候補3 候補4 図 4. データフロー。CARS には、事前フィルタリング、 モデリング、事後フィルタリングという 3 つのデータ加 工層が含まれます。 識ベースのビジネス・ルール・エンジンを使用 してフィルタールールを適用します。そのフィル タールールによって、適切なパラメーターに一 致しないクーポンは結果セットから除外されま す。必要であれば、これらのルールを素早く調 整することで、さまざまなビジネス要件に対応 することも可能です。 モデリング モデリング層は、オフラインプロセスで計算さ れた 2 つの機械学習アルゴリズム(協調フィ ルタリングとコンテンツベース・フィルタリング) の合成として構成されます。この 2 つのアル ゴリズムを併用することにより、協調フィルタ リング・モデルとコンテンツベース・フィルタリン グ・モデルの両方の結果を組み合わせて 1 つ の予測モデルを作ることができます。これによ のために必要とされる高い可用性とパフォー り、CARS の予測性能を最大限まで高め、ベ バーを置くことで実現しました。Web サーバー 補の一覧を生成します(モデリング・アーキテ マンスは、演 算 層に 3 つの専 用 Web サー モデリング 加工手法:協調フィルタリングと コンテンツベース・フィルタリング 強い、ランク付けされたクーポンの一覧が生成 事前フィルタリング 演算層は、図 3 に示す予測フローを実行して、 フィルターされた候補 好とコンテキスト・パラメーターとの関連性の ベースローダーと Not only SQL(NoSQL) NoSQL 分散ストレージシステムには、カスタ ム Java* ベースローダーを使ってデータを読 み込みます。独自開発したローダーは、シス テム内のデータを更新するだけでなく、バー ジョン管理メカニズムによってデータ読み取り の完全な一貫性を保持します。ローダーが処 理するデータセットは、データ分析の週次の結 果と、オフライン・データベースで直近に更新 された顧客トランザクション・ログの 2 つです。 CANDIDATE CANDIDATE CANDIDATE CANDIDATE 候補 がシステムで処理されることにより、顧客の嗜 す。これには、データ取得(カスタムの Java* NoSQL 分散ストレージシステムは、膨大な量 の構造化データを多数の市販サーバーに拡 散して管理します。このシステムは、一貫性レ ベルが調整可能で、単一障害点を持たない 高可用性サービスも備えています。このデー タソースには、増大し続けるユーザーデータと クーポンデータが含まれるだけでなく、オフラ インプロセスのデータ分析モジュールで計算さ れたモデルも含まれます。 フィルタールール:コンテンツおよび コンテキスト・ルールに基づくフィルターオプション メンデーションの候補です。これらのクーポン されます。 分散ストレージシステム)、演算層、標準 API 事前フィルタリング (知識ベースのビジネスルール) では、ビジネス部門が収集したクーポンがレコ ランク付けされた最終的なレコメンデーション の一覧作成は、オンラインプロセスで行われま レコメンデーション候補 後フィルタリングの 3 層を通過するデータのフ 顧客の嗜好の暗黙的な予測を自動的に行い ます。コンテンツベース・フィルタリングは、推 CANDIDATE CANDIDATE CANDIDATE CANDIDATE CANDIDATE CANDIDATE CANDIDATE CANDIDATE CANDIDATE CANDIDATE CANDIDATE CANDIDATE 候補 候補 候補 ストマッチのアイテムを基にランク付けした候 www.intel.co.jp/itatintel 5 IT@Intel ホワイトペーパー Apache* Hadoop* を使用した状況認識型レコメンデーション・システム CARS レコメンデーションの 引換率の比較 クチャーの詳細については、 「システム・アーキ テクチャー」のセクションを参照してください)。 ランク付けされた候補は、次に事後フィルタ リング層で処理されます。 引換率 事後フィルタリング 増加 位置情報と想定される 迂回路に基づく レコメンデーションを受け取った 比較対照グループ CARS レコメンデーション を受け取ったグループ 図 5. CARS レコメンデーションを受け取ったグループ の引換率は、比較対照グループの引換率より 45% 高 くなりました。 パイロット期間の中間日から終了までの間に 引換率が 4% 向上したことも分かりました。こ れは、現在のコンテキストに基づいてスコアを を導入することが承認されました。 ポンの最終的なランク付けが行われ、顧客に また、顧客がモバイル・ナビゲーション・アプリ パイロット・プロジェクト う目標も達成できました。さらに、この CARS 提示するクーポンが決定されます。 26.8% 45% 高かったことが分かりました(図 5 を参 照)。また、システムの学習機能を確認すると、 のような具体的な数値を根拠として、位置情 調整するために行います。これによって、クー 18.5% ループの引換率は、比較対照のグループより CARS は、ランク付けされた候補に対し、知識 ベースのビジネスルールを追加適用します。こ 45% と、CARS レコメンデーションを受け取ったグ 複合アーキテクチャーを構築し、機械学習ア ルゴリズムに適切なチューニングを行った後、 報サービス部門では顧客ベース全体に CARS ケーションを起動してから 1 秒以内にランク付 けしたクーポンの完全な一覧を提供するとい は 8 カ月足らずで市場投入されました。これ だけ複雑なソリューションの導入期間として は、異例とも言える速さです。インテル ® ディス システムの有効性を評価するため英国でパイ トリビューションとオープンソース・テクノロジー 強力な顧客ベースが存在し、ナビゲーション・ 既存のコンポーネントを活用でき、今回の利 ロット・プロジェクトを実施しました。英国には アプリケーションで配信されるタイプのクーポン の市場が成熟していたこともあり、熱心な参 加者から貴重な定性的フィードバックを得るこ とができました。参加者は、定量的フィードバッ を使用したことで、可能な限り多くの方面で 用用途に合わせた調整も容易でした。その結 果、時間のかかるカスタム開発の量を減らすこ とができました。 クを提供する 1,100 人の一般顧客と、直接 的なフィードバックを口頭で提供するフォーカ スグループとして 100 人のインテル従業員で 構成され、均等に 2 つのグループに分割され ました。 • 最初のグループは、CARS が提供するレコ メンデーションを受け取ります。 成しているので、それを他の利用用途に応用 することは容易であり、時間もかかりません。 適切なデータソースを特定し、それらのソー スを考慮して機械学習モデルを再構成し、知 ぐに再利用できます。最初の開発には数カ このパイロット・プロジェクトは、十分なデータ 週間で別の利用用途に再利用することがで 識ベースのビジネスルールを更新すれば、す 月がかかりましたが、現在は、わずか 4 ∼ 6 を収集する時間と、CARS の機械学習コン きます。 自らのパフォーマンスを改善する時間を確保す 最近では、インテルのセールス・マーケティング 結果 して、売上と収益を増大させました。他のビジ るため、8 週間にわたって実施されました。 パイロット・プロジェクトの期 間 中、顧 客は、 17,000 回以上のナビゲーションを実行し、 CARS は 25,000 個以上のクーポンを提示 しました。2 つのグループの引換率を比較する www.intel.co.jp/itatintel 現在は、CARS インフラストラクチャーが完 • もう一方の比較対照のグループは、位置情 報と想定される迂回路のみに基づくレコメン デーションを受け取ります。 ポーネントが実際のフィードバックに基づいて 6 他の利用用途に CARS を再利用する 部門が CARS を応用することにより、チャネル 顧客向けの製品購入レコメンデーションを改善 ネス部門も、ソフトウェアによって複数の選択 肢から 1 つのレコメンデーションをユーザーに 提供するような場面で、ビッグデータの予測分 析を有効活用する方法を探求しています。 Apache* Hadoop* を使用した状況認識型レコメンデーション・システム IT@Intel ホワイトペーパー まとめ 関連情報 インテル IT 部門では、ビッグデータの予測分 関 連トピックの 情 報 に つ い ては、http:// 協力者 www.intel.co.jp/itatintel/ を参照してく ださい。 Chen Admati インテル IT 部門 高度分析、プログラム・マネージャー •「 C re a t i n g B u s i n e s s Va lu e t h ro u g h Context-Aware Computing」 Moty Fania インテル IT 部門 高度分析、プリンシパル・エンジニア この CARS を他の事業の利用用途にも数週 •「インテルのビッグデータ環境に Apache* Hadoop* を統合」 Abraham Israeli インテル IT 部門 高度分析、データ・サイエンティスト インテル ® ディストリビューションが提供する、 •「Integrating Data Warehouses with Data Virtualization for BI Agility」 略 語 析を利用してレコメンデーションの妥当性を 高める CARS を作成しました。これにより、満 足度の高いユーザー体験を提供すると同時 に、インテルのビジネス部門による売上目標 の迅速な達成を支援することができました。こ のインフラストラクチャーが完成されたことで、 間で応用することができるようになりました。 巨大なデータセットを多数のコンピューター・ クラスターで並列分散処理する機能が、今回 の CARS 構築の成功に大きく貢献しました。 インテル ® ディストリビューションはインテル ® テクノロジーに最適化されているため、機械学 CARS •「Using Big Data Predictive Analy tics to Optimize Sales」 習アルゴリズムを高速に実行することにおい ても貢献しました。もしもインテル ® ディストリ ビューションなしで位置情報サービスのビジネ ス部門を支援するソリューションを開発したな ら、開発はかなり長期化し、他の利用用途に インフラストラクチャーを再利用する際の俊敏 性も実現することはできなかったでしょう。 JSON JavaScript* Object Notation MDMD Minimal Detour, Minimal Delay (最少の迂回と最少の遅延) MPP Massively Parallel Processing(超並列処理) NoSQL Not only SQL (非リレーショナル・モデルの データベースの総称) POI SL A SL S インテル IT 部門のベスト・プラクティスの詳細については、 http://w w w.intel.co.jp/itatintel/ を参照してください。 Context-Aware Recommender System (コンテキスト認識型 レコメンデーション・システム) TB Point Of Interest (注目地点) サービスレベル・ アグリーメント Single Line Search (1 行検索) テラバイト www.intel.co.jp/itatintel 7 本書に記載されている情報は一般的なものであり、具体的なガイダンスではありません。推奨事項(潜在的なコスト削減など)はインテルの経験に基づいて おり、概算にすぎません。インテルは、他社でも同様の結果が得られることを一切保証いたしません。 本資料に掲載されている情報は、インテル製品の概要説明を目的としたものです。本資料は、明示されているか否かにかかわらず、また禁反言によるとよ らずにかかわらず、いかなる知的財産権のライセンスも許諾するものではありません。製品に付属の売買契約書『Intel's Terms and Conditions of Sale』に規定されている場合を除き、インテルはいかなる責任を負うものではなく、またインテル製品の販売や使用に関する明示または黙示の保証(特定目 的への適合性、商品適格性、あらゆる特許権、著作権、その他知的財産権の非侵害性への保証を含む)に関してもいかなる責任も負いません。 Intel、インテル、Intel ロゴ、Look Inside.、Look Inside. ロゴは、アメリカ合衆国および / またはその他の国における Intel Corporation の商標です。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 インテル株式会社 〒 100-0005 東京都千代田区丸の内 3-1-1 http://www.intel.co.jp/ ©2014 Intel Corporation. 無断での引用、転載を禁じます。 2014 年 8 月 329828-001JA JPN/1408/PDF/SE/IT/TC