...

Apache* Hadoop* を使用した状況認識型レコメンデーション

by user

on
Category: Documents
17

views

Report

Comments

Transcript

Apache* Hadoop* を使用した状況認識型レコメンデーション
IT@Intel ホワイトペーパー
インテル IT 部門
ビッグデータ
2014 年 2 月
Apache* Hadoop* を使用した状況認識型
レコメンデーション・システム
概要
CARS はレコメンデーション・
エンジンが処理する
膨大な量のデータを管理し、
その場の具体的な状況を表す
コンテキスト・パラメーターを
インテリジェンスとして付加します。
ビッグデータの予測分析には、増大し続けるデータ・ウェアハウス、常に変化するコンテキスト・
パラメーター、反応スピードの確保といった課題があります。インテル IT 部門ではこうした課題へ
の対処が可能な、状況認識型レコメンデーション・システム(Context-Aware Recommender
System; CARS)を開発しました。
CARS は、レコメンデーション・エンジン(製品
やサービスの評価を予測する情報フィルタリン
グ・システム)が処理する膨大な量のデータを
管理し、日時、場所、天候など、その場の具体
的な状況を表すコンテキスト・パラメーターを
インテリジェンスとして付加します。これにより
ユーザーには、ユーザー自身の過去の選好と
コンテキスト・パラメーターとの組み合わせに
基づいた、より適切なレコメンデーションが提
示されます。
CARS の構 築に Apache* Hadoop* 対 応
インテル ® ディストリビューション(インテル ®
Oren Razon
インテル IT 部門
テクニカルリード
れられる確率が高まり、より効率的な事業
展開が可能となり、収益の増加につながり
ます。
• 再利用可能なレコメンデーション・エンジン
を構築:最初のインフラストラクチャーの構
築には数カ月がかかりました。しかし、それ
が完成した現在では、わずか 4 ∼ 6 週間で
CARS を他のビジネス部門向けに再利用で
きるようになりました。
最初の CARS アーキテクチャーは、位置情報
ディストリビューション)を利用したことにより、
を活用したサービスを提供するビジネス部門
きました。
ケーションを使用する顧客に対して、お勧めの
インテル IT 部門は以下の成果を得ることがで
Yonatan Dolan
インテル IT 部門
プロジェクト・マネージャー
うになることで、レコメンデーションが受け入
• 開発にかかる時間を短縮:製品レベルの
インテル ® ディストリビューション環境は、必
要なサポートを提供するだけでなく、本稼動
用のサービスレベル・アグリーメント
(SL A)
や運用要件も満たします。インテル® ディスト
リビューションには、認証や権限の管理機能
に加えて包括的なシステム監視やログ記録
のツールも付属しているため、独自に開発す
ることなく既存の機能をそのまま使用できま
す。また、実行の最適化やチューニングも可
能であり、多くの労力を費やすことなく、最
大限のパフォーマンスを得ることができます。
• 増収チャンスを拡大:ビジネス部門では、よ
り適切なレコメンデーションを提供できるよ
向けに構築しました。これは、モバイル・アプリ
クーポンを提示するというものです。8 週間の
パイロット・プロジェクトを実施しましたが、この
ソリューションを使用した顧客グループは、位
置情報のみに基づいてクーポンを受け取った
比較対照のグループよりも 45% も多くのクー
ポンを交換しました。
最初のパイロット・プロジェクトの成功後、この
CARS はセールス・マーケティングのビジネス
部門向けに再利用されました。彼らも、適切な
製品を適切な顧客に、
適切なタイミングで提案
するための支援を必要としていました。CARS
は柔軟性に富み、多様な利用用途に応用でき
るため、他のビジネス部門でも、ビッグデータ
の予測分析機能の有効活用に CARS を利用
する方法を模索しています。
IT@Intel ホワイトペーパー Apache* Hadoop* を使用した状況認識型レコメンデーション・システム
目 次
概 要................................ 1
背 景................................ 2
ソリューション. . . . . . . . . . . . . . . . . . . . . . . . 3
顧客側のユーザー体験 . . . . . . . . . . . 3
システム・アーキテクチャー . . . . . . . 4
データフロー . . . . . . . . . . . . . . . . . . . . . 5
パイロット・プロジェクト . . . . . . . . . . . 6
背景
レコメンデーション・エンジンは、ユーザー
の過去の行動や、明示的または非明示的な
フィードバックに基づいてユーザーの選好を
予測することを目的としています。このエン
ジンを利用することで、アプリケーションは
ユーザーに最適な情報(製品やサービスの一
覧など)を提示することが可能になります。位
置情報を活用したサービスを提供する部門や
セールス・マーケティング部門など、インテル
の多くのビジネス部門ですでにレコメンデー
CARS を再利用する . . . . . . . . . . . . . . . . 6
まとめ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
関連情報 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
協力者 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
略 語 ............................... 7
る必要があることが分かりました。コンテキス
ト情報を使うことによって、過去の行動から読
み取られる傾向に沿ったレコメンデーションを
提供することが可能になります。コンテキスト
す。広告、クーポン、プロモーション、リマイン
化データを使用可能な情報と知識に変換する
ダー、製品、アラートなど、どのような内容のレ
コメンデーションであっても、この点は変わりま
使うことを考えました。ただし、天候や時間な
は、多様なソースの数テラバイト単位の構造
作業が必要になります。
せん。状況認識型(context-aware)
レコメン
インテル IT 部 門では、もう 1 つの目 標とし
ションのランク付けに当たってコンテキスト・パ
インテルの他のビジネス部門も利用できる汎用
特性など)
も考慮します。CARS を活用するこ
た。例えば、インテルのセールス・マーケティン
デーション・システム(CARS)は、レコメンデー
ラメーター(時間、場所、天候、季節、デバイス
て、レコメンデーション・エンジンを活用する
的なソリューションを開発することを目指しまし
とで、組織は市場での競争を優位に進めるこ
グ・グループでも、適切な製品を適切なタイミン
めには数テラバイト
(TB)のデータを処理し、
いました。
とができますが、CARS が適切に機能するた
作成したモデルをほぼリアルタイムで利用可能
グで顧客に提供するための支援を必要として
CARS の開発に取り組み始めてから、次のよ
このため、CARS の構築は非常にハードルの
うな課題に直面しました。
インテル IT 部門は、位置情報を活用したサー
• 位置情報サービス部門の収益増を確保する
ために、短期間で開発しなければならない。
近に行った選択に関して最も適切なクーポン
を提供できる CARS の開発を求められまし
た。このビジネス部門は、有料の企業間取引
(B2B)モデルを無料の企業対消費者間取引
(B2C)モデルに転換したモバイル・アプリケー
ションを運用していました。しかし、手数料収
入が得られないと判断したこのビジネス部門
では、それに代わる新しい収入源として、位置
情報を活用した広告をクーポンという形で配
www.intel.co.jp/itatintel
めの取り組みを通じて、標準的なレコメンデー
ション・エンジンをコンテキスト情報で強化す
ど、その他のパラメーターを組み込むために
ビスを提供するビジネス部門から、顧客が直
2
まり、顧客が行動を起こす可能性を高めるた
ユーザーに適切なレコメンデーションを提供す
高いものとなっています。
IT@Intel は IT プロフェッショナル、マネー
ジャー、エグゼクティブが、インテル IT 部
門のスタッフや数多くの業界 IT リーダー
を通じ、今日の困難な IT 課題に対して成
果を発揮してきたツール、手法、戦略、ベ
スト・プラクティスについて詳しく知るため
の情報源です。詳細については、http://
www.intel.co.jp/itatintel / を参照し
てください。あるいはインテルまでお問い
合わせください。
レコメンデーションの妥当性を高めるため、つ
の手掛かりとしては、位置情報以外の情報も
にする複合的なアーキテクチャーが必要です。
IT@Intel
増大に直結しています。
ション・エンジンが活用されています。
るには、コンテキスト
(状況情報)は不可欠で
他の利用用途に
割合)の向上に役立つ CARS ソリューションで
した。引換率の向上は、クーポン広告収入の
信することにしました。そこで必要となったの
が、引換率(顧客に提示されたクーポン数に
対して、顧客が行動を起こしたクーポン数の
• レコメンデーションの要求と応答を、複数の
ソースに分散するコンテキスト・データを参
照しつつ、1 秒未満で処理しなければなら
ない。
• データ・ウェアハウス、データ処理アルゴリズ
ム、モバイル配信システムを含む複合的なシ
ステム統合を行わなければならない。
Apache* Hadoop* を使用した状況認識型レコメンデーション・システム IT@Intel ホワイトペーパー
ソリューション
Apache* Hadoop*対応インテル® ディストリビューション
インテル IT 部門では、特定の利用用途(今
導入、構成、監視、
アラート、
セキュリティー
回は、モバイル・クライアントに配信されたクー
ポンの引換率の向上)に対応する CARS の
開発からスタートしました。その設計では、
ビッ
グデータの予測分析を利用する他の利用用
途にも応用できるシステムを目指しました。そ
Oozie
インテ ル ® ディストリビューション( 図 1)を
CARS インフラストラクチャーに統合することに
より、当面の利用用途に対して適切に機能す
ることはもちろん、将来の利用用途にも応用で
Pig*
スクリプト処理
Mahout*
機械学習
Hive*
SQLクエリー
データ交換
ZooKeeper*
こで CARS の 土 台とした の が、Apache*
Hadoop* 対 応インテル ® ディストリビュー
ション(インテル ® ディストリビューション)で
す。これには、巨大なデータセットを多数の
コンピューター・クラスターで並列分散処理す
る機能があります。
ワークフロー
Sqoop*
調整
HBase*
列指向
ストレージ
MapReduce
分散処理フレームワーク
Flume*
ログ収集
Hadoop* 分散ファイルシステム
インテルの独自開発
オープンソースを基にインテルが機能強化に貢献
変更なしで組み込まれたオープンソース・コンポーネント
図 1. Apache* Hadoop* 対応インテル® ディストリビューション(インテル ® ディストリビューション)のコンポーネント。
インテル ® ディストリビューションにより、CARS をインテル内のさまざまな利用用途に再利用、再構成することが可能
になります。
きるシステム・アーキテクチャーとデータフロー
を実現することができました。
顧客側のユーザー体験
CARS は、ビジネス部門の顧客に情報を提
供する無料のモバイル・ナビゲーション・アプリ
ケーション(図 2)に統合されました。そのビジ
ネス部門では、位置情報に基づく広告を使っ
て収益を最大化するために、アプリケーション
内で行われているナビゲーションを妨げること
なくクーポンを配信し、その引換率を高めるこ
とを目指しました。この目標を達成するため、
CARS は顧客のナビゲーション・ルートまたは
1 行検索(SLS)
キーワードに基づいてクーポン
を配信するようにしました。1
ナビゲーション・ルート
クーポンが提示される。
クーポンの詳細が表示される。
クーポンが取得される。
図 2. CARS で顧客にクーポンを配信するモバイル・ナビゲーション・アプリケーションの例。
顧客が目的地に向かって移動するときに、近
くのレストランや店舗などの注目地点(Point
Of Interest; POI)から提供されているクー
ポンがビジネス部門によって収集されます。
1
顧客のプライバシーを保護するため、顧客の身元が
分かるような個人情報は隠しました。しかし、過去の
ナビゲーションなど、アプリケーション内で行われた
行動は利用しました。こうした情報は、より適切なレ
コメンデーションを作成するために不可欠でした。
www.intel.co.jp/itatintel
3
IT@Intel ホワイトペーパー Apache* Hadoop* を使用した状況認識型レコメンデーション・システム
CARS は利用可能なクーポンの一覧にアクセ
要求
ナビゲーション・
ルートを設定
応答
POIからのサービスが
デバイスに配信される
負荷分散
Webサーバー1
データの前処理と分析はオフラインプロセスで
ポンの価値、時間、天候の条件とを照合し
のデータを集積して、オンラインプロセスが使
における過去の選好、想定される迂回路、クー
ます。CARS はこうした情報をすべて処理し、
演算層
… Webサーバーn
NoSQL
分散ストレージシステム
妥当性の高い順にランク付けしたクーポンの
一覧を出力し、顧客のルート上の移動に合わ
オフライン
タ・ウェアハウスで行われます。このデータ・ウェ
たリストの提示まで)は 1 秒以内に行われま
す。顧客はルート上を移動しながらクーポンを
るかを決定します。顧客に提示されるクーポン
前処理
データ・ウェアハウス
予測モデル
Apache* Mahout*
インテル®
ディストリビューション
図 3. CARS のアーキテクチャー。オフラインプロセス
には、データの前処理とデータの分析が含まれます。
オンラインプロセスは、結果を解釈して最終的なレコ
メンデーションの一覧を作成する処理を行います。
データを統合します。データの前処理はデー
アハウスはリレーショナル・データベースに保
管された大量の構造化データを処理すること
ができるシェアード・ナッシングの超並列処理
(MPP)アーキテクチャー上に構 築されてい
ます。内部データソースと外部データソースの
併用によって、ユーザーの過去の行動、クー
が多くなりすぎないようにするため、ルートはビ
ポンデータ、地理空間情報、郵便番号、社会
分割されます。顧客には、各区間内で最も適
リングのために提供されました。
1 回の移動で最大 3 個のクーポンが表示され
データの 分 析は、高 度な 分 析 処 理を含 む
ジネス部門によっていくつかの地理的区間に
データの分析
データの前処理では、各種ソースからデータ
こうした一連の処理(クーポンの収集から、他
ためにクーポンを保存するか、あるいは無視す
データ
用する機械学習モデルを生成します。
を収集し、必要に応じて変換を行い、収集した
見て、その地点まで迂回するか、後で使用する
オンライン
行われます。これは、週次で実行され、すべて
せてそれらを提示します。
のコンテキスト情報との照合、ランク付けされ
カスタムのJava*ベースローダー
オフラインプロセス
スし、その一覧と、その顧客の同じような状況
切なクーポンだけが表示されます。実際には
るように設定しました。
1 行検索(SLS)オプション
経済学的特性、日時、天候情報がデータモデ
バッチ処理として行われます。今回のソリュー
ションは、データ量の 増 加に合わせて線 形
に拡 大するように設 計されました。このソ
顧客が住所や POI を見つけるために検索フ
リューションの基盤として使用されているのが
ゲーション・ルートの場合と変わりませんが、
ムです。これは MapReduce プログラミング・
レーズを入力した場合、データフローはナビ
CARS は、コンテキスト分析やクーポンのラン
ク付けにおいて、その SLS キーワードも考慮
に入れます。そして、顧客には、最も適切なクー
ポンの一行バナーが他の検索結果と一緒に
表示されます。
システム・アーキテクチャー
CARS は、データの前処理、データの分析、
結果の解釈というフェーズで構成されるデー
タ・マイニング・プロセスの実用例の 1 つです。
データの前処理と分析はオフラインのバッチ
インテル® ディストリビューション・プラットフォー
パラダイムを使用し、巨大なデータセットを複
数のコンピューター・クラスターで並列分散処
理することができます。位置情報サービス部門
には 6TB 超のデータがありましたが、顧客層
の拡大に伴ってデータがさらに増えることと、
データソース自体も増えることを計画しておく
必要がありました。
CARS インフラストラクチャーにインテル ® ディ
ストリビューションを使用することの利点はこ
れだけではありません。例えば、インテルのセ
キュリティー管理とのシームレスな統合、オー
処理で行うことができますが、結果の解釈(最
プンソース・コミュニティーとの緊密な関係、
処理)は、顧客のナビゲーション・ルートまたは
リットも得られました。これらによって、機械学
としてオンラインで行われる必要があります。
ました。
インのプロセスにどのように分割したかを示し
データの分析では、前処理フェーズからの膨
終的なレコメンデーションの一覧を作成する
SLS キーワードごとに生成される要求の一部
図 3 に、各コンポーネントをオフラインとオンラ
ます。
インテル ® テクノロジー向けの最適化などのメ
習アルゴリズムの実行を高速化することができ
大な量のデータに対して Apache* Mahout*
を使用する高度なアルゴリズムを実行する必
要があります。そのために、データベースには
大量のメモリーとストレージが必要とされます。
4
www.intel.co.jp/itatintel
Apache* Hadoop* を使用した状況認識型レコメンデーション・システム IT@Intel ホワイトペーパー
Mahout* には、レコメンデーション・エンジン、
分類、クラスタリングのコア・アルゴリズムが、
すぐに使えるスケーラブルな Java* ベース・ラ
イブラリーとして含まれています。
モデルには、数多くの手法を検証した長期の
調査フェーズを経て、協調フィルタリングやコン
テンツベース・フィルタリングなどが使用されま
した。協調フィルタリングは、多数の顧客の選
択や好みの情報を累積し、それを基に特定の
の上層には負荷分散機能を設定し、ワーク
ロードを均等に分散します。最終的なランク
付けされたクーポンの一覧は、JavaScript*
Object Notation(JSON)メッセージとして
配信されます。
データフロー
図 4 は、事前フィルタリング、モデリング、事
ローを示しています。アプリケーションによる
奨されるアイテムの特性に基づきます。これら
覧を作成するところから始まります。今回の例
の計算の結果はすぐに使用できるモデルテー
ブルとして完成され、後でオンラインプロセス
によって使用されます。
オンラインプロセス
顧客サービスは、レコメンデーション候補の一
最終的にレコメンデーションを提供するには、
が含まれます。
ポンを事前に入手しておく必要があります。こ
1 秒以内に要求に対する応答を返します。こ
特定のルート上の使用可能なすべてのクー
のような候補となるクーポンは、顧客がアプ
リケーションを起動した後、ルートのナビゲー
ションまたは 1 行検索の操作を通じて、複数
のデータソースからビジネス部門によって集め
られます。候補となるクーポンが収集された
ら、CARS は、コンテキスト情報も考慮した知
CANDIDATE
CANDIDATE
CANDIDATE
CANDIDATE
候補
ランク付けされた候補
事後フィルタリング
調整ルール:クーポンの有用性、
最少の迂回と最少の遅延(MDMD)、および追加の
ルールに基づくレコメンデーション・リストの調整
最終的なランク付け
候補1
候補2
候補3
候補4
図 4. データフロー。CARS には、事前フィルタリング、
モデリング、事後フィルタリングという 3 つのデータ加
工層が含まれます。
識ベースのビジネス・ルール・エンジンを使用
してフィルタールールを適用します。そのフィル
タールールによって、適切なパラメーターに一
致しないクーポンは結果セットから除外されま
す。必要であれば、これらのルールを素早く調
整することで、さまざまなビジネス要件に対応
することも可能です。
モデリング
モデリング層は、オフラインプロセスで計算さ
れた 2 つの機械学習アルゴリズム(協調フィ
ルタリングとコンテンツベース・フィルタリング)
の合成として構成されます。この 2 つのアル
ゴリズムを併用することにより、協調フィルタ
リング・モデルとコンテンツベース・フィルタリン
グ・モデルの両方の結果を組み合わせて 1 つ
の予測モデルを作ることができます。これによ
のために必要とされる高い可用性とパフォー
り、CARS の予測性能を最大限まで高め、ベ
バーを置くことで実現しました。Web サーバー
補の一覧を生成します(モデリング・アーキテ
マンスは、演 算 層に 3 つの専 用 Web サー
モデリング
加工手法:協調フィルタリングと
コンテンツベース・フィルタリング
強い、ランク付けされたクーポンの一覧が生成
事前フィルタリング
演算層は、図 3 に示す予測フローを実行して、
フィルターされた候補
好とコンテキスト・パラメーターとの関連性の
ベースローダーと Not only SQL(NoSQL)
NoSQL 分散ストレージシステムには、カスタ
ム Java* ベースローダーを使ってデータを読
み込みます。独自開発したローダーは、シス
テム内のデータを更新するだけでなく、バー
ジョン管理メカニズムによってデータ読み取り
の完全な一貫性を保持します。ローダーが処
理するデータセットは、データ分析の週次の結
果と、オフライン・データベースで直近に更新
された顧客トランザクション・ログの 2 つです。
CANDIDATE
CANDIDATE
CANDIDATE
CANDIDATE
候補
がシステムで処理されることにより、顧客の嗜
す。これには、データ取得(カスタムの Java*
NoSQL 分散ストレージシステムは、膨大な量
の構造化データを多数の市販サーバーに拡
散して管理します。このシステムは、一貫性レ
ベルが調整可能で、単一障害点を持たない
高可用性サービスも備えています。このデー
タソースには、増大し続けるユーザーデータと
クーポンデータが含まれるだけでなく、オフラ
インプロセスのデータ分析モジュールで計算さ
れたモデルも含まれます。
フィルタールール:コンテンツおよび
コンテキスト・ルールに基づくフィルターオプション
メンデーションの候補です。これらのクーポン
されます。
分散ストレージシステム)、演算層、標準 API
事前フィルタリング
(知識ベースのビジネスルール)
では、ビジネス部門が収集したクーポンがレコ
ランク付けされた最終的なレコメンデーション
の一覧作成は、オンラインプロセスで行われま
レコメンデーション候補
後フィルタリングの 3 層を通過するデータのフ
顧客の嗜好の暗黙的な予測を自動的に行い
ます。コンテンツベース・フィルタリングは、推
CANDIDATE
CANDIDATE
CANDIDATE
CANDIDATE
CANDIDATE
CANDIDATE
CANDIDATE
CANDIDATE
CANDIDATE
CANDIDATE
CANDIDATE
CANDIDATE
候補
候補
候補
ストマッチのアイテムを基にランク付けした候
www.intel.co.jp/itatintel
5
IT@Intel ホワイトペーパー Apache* Hadoop* を使用した状況認識型レコメンデーション・システム
CARS レコメンデーションの
引換率の比較
クチャーの詳細については、
「システム・アーキ
テクチャー」のセクションを参照してください)。
ランク付けされた候補は、次に事後フィルタ
リング層で処理されます。
引換率
事後フィルタリング
増加
位置情報と想定される
迂回路に基づく
レコメンデーションを受け取った
比較対照グループ
CARS レコメンデーション
を受け取ったグループ
図 5. CARS レコメンデーションを受け取ったグループ
の引換率は、比較対照グループの引換率より 45% 高
くなりました。
パイロット期間の中間日から終了までの間に
引換率が 4% 向上したことも分かりました。こ
れは、現在のコンテキストに基づいてスコアを
を導入することが承認されました。
ポンの最終的なランク付けが行われ、顧客に
また、顧客がモバイル・ナビゲーション・アプリ
パイロット・プロジェクト
う目標も達成できました。さらに、この CARS
提示するクーポンが決定されます。
26.8%
45% 高かったことが分かりました(図 5 を参
照)。また、システムの学習機能を確認すると、
のような具体的な数値を根拠として、位置情
調整するために行います。これによって、クー
18.5%
ループの引換率は、比較対照のグループより
CARS は、ランク付けされた候補に対し、知識
ベースのビジネスルールを追加適用します。こ
45%
と、CARS レコメンデーションを受け取ったグ
複合アーキテクチャーを構築し、機械学習ア
ルゴリズムに適切なチューニングを行った後、
報サービス部門では顧客ベース全体に CARS
ケーションを起動してから 1 秒以内にランク付
けしたクーポンの完全な一覧を提供するとい
は 8 カ月足らずで市場投入されました。これ
だけ複雑なソリューションの導入期間として
は、異例とも言える速さです。インテル ® ディス
システムの有効性を評価するため英国でパイ
トリビューションとオープンソース・テクノロジー
強力な顧客ベースが存在し、ナビゲーション・
既存のコンポーネントを活用でき、今回の利
ロット・プロジェクトを実施しました。英国には
アプリケーションで配信されるタイプのクーポン
の市場が成熟していたこともあり、熱心な参
加者から貴重な定性的フィードバックを得るこ
とができました。参加者は、定量的フィードバッ
を使用したことで、可能な限り多くの方面で
用用途に合わせた調整も容易でした。その結
果、時間のかかるカスタム開発の量を減らすこ
とができました。
クを提供する 1,100 人の一般顧客と、直接
的なフィードバックを口頭で提供するフォーカ
スグループとして 100 人のインテル従業員で
構成され、均等に 2 つのグループに分割され
ました。
• 最初のグループは、CARS が提供するレコ
メンデーションを受け取ります。
成しているので、それを他の利用用途に応用
することは容易であり、時間もかかりません。
適切なデータソースを特定し、それらのソー
スを考慮して機械学習モデルを再構成し、知
ぐに再利用できます。最初の開発には数カ
このパイロット・プロジェクトは、十分なデータ
週間で別の利用用途に再利用することがで
識ベースのビジネスルールを更新すれば、す
月がかかりましたが、現在は、わずか 4 ∼ 6
を収集する時間と、CARS の機械学習コン
きます。
自らのパフォーマンスを改善する時間を確保す
最近では、インテルのセールス・マーケティング
結果
して、売上と収益を増大させました。他のビジ
るため、8 週間にわたって実施されました。
パイロット・プロジェクトの期 間 中、顧 客は、
17,000 回以上のナビゲーションを実行し、
CARS は 25,000 個以上のクーポンを提示
しました。2 つのグループの引換率を比較する
www.intel.co.jp/itatintel
現在は、CARS インフラストラクチャーが完
• もう一方の比較対照のグループは、位置情
報と想定される迂回路のみに基づくレコメン
デーションを受け取ります。
ポーネントが実際のフィードバックに基づいて
6
他の利用用途に
CARS を再利用する
部門が CARS を応用することにより、チャネル
顧客向けの製品購入レコメンデーションを改善
ネス部門も、ソフトウェアによって複数の選択
肢から 1 つのレコメンデーションをユーザーに
提供するような場面で、ビッグデータの予測分
析を有効活用する方法を探求しています。
Apache* Hadoop* を使用した状況認識型レコメンデーション・システム IT@Intel ホワイトペーパー
まとめ
関連情報
インテル IT 部門では、ビッグデータの予測分
関 連トピックの 情 報 に つ い ては、http://
協力者
www.intel.co.jp/itatintel/ を参照してく
ださい。
Chen Admati
インテル IT 部門
高度分析、プログラム・マネージャー
•「 C re a t i n g B u s i n e s s Va lu e t h ro u g h
Context-Aware Computing」
Moty Fania
インテル IT 部門
高度分析、プリンシパル・エンジニア
この CARS を他の事業の利用用途にも数週
•「インテルのビッグデータ環境に Apache*
Hadoop* を統合」
Abraham Israeli
インテル IT 部門
高度分析、データ・サイエンティスト
インテル ® ディストリビューションが提供する、
•「Integrating Data Warehouses with
Data Virtualization for BI Agility」
略 語
析を利用してレコメンデーションの妥当性を
高める CARS を作成しました。これにより、満
足度の高いユーザー体験を提供すると同時
に、インテルのビジネス部門による売上目標
の迅速な達成を支援することができました。こ
のインフラストラクチャーが完成されたことで、
間で応用することができるようになりました。
巨大なデータセットを多数のコンピューター・
クラスターで並列分散処理する機能が、今回
の CARS 構築の成功に大きく貢献しました。
インテル ® ディストリビューションはインテル ®
テクノロジーに最適化されているため、機械学
CARS
•「Using Big Data Predictive Analy tics
to Optimize Sales」
習アルゴリズムを高速に実行することにおい
ても貢献しました。もしもインテル ® ディストリ
ビューションなしで位置情報サービスのビジネ
ス部門を支援するソリューションを開発したな
ら、開発はかなり長期化し、他の利用用途に
インフラストラクチャーを再利用する際の俊敏
性も実現することはできなかったでしょう。
JSON
JavaScript* Object
Notation
MDMD Minimal Detour,
Minimal Delay
(最少の迂回と最少の遅延)
MPP
Massively Parallel
Processing(超並列処理)
NoSQL Not only SQL
(非リレーショナル・モデルの
データベースの総称)
POI
SL A
SL S
インテル IT 部門のベスト・プラクティスの詳細については、
http://w w w.intel.co.jp/itatintel/ を参照してください。
Context-Aware
Recommender System
(コンテキスト認識型
レコメンデーション・システム)
TB
Point Of Interest
(注目地点)
サービスレベル・
アグリーメント
Single Line Search
(1 行検索)
テラバイト
www.intel.co.jp/itatintel
7
本書に記載されている情報は一般的なものであり、具体的なガイダンスではありません。推奨事項(潜在的なコスト削減など)はインテルの経験に基づいて
おり、概算にすぎません。インテルは、他社でも同様の結果が得られることを一切保証いたしません。
本資料に掲載されている情報は、インテル製品の概要説明を目的としたものです。本資料は、明示されているか否かにかかわらず、また禁反言によるとよ
らずにかかわらず、いかなる知的財産権のライセンスも許諾するものではありません。製品に付属の売買契約書『Intel's Terms and Conditions of
Sale』に規定されている場合を除き、インテルはいかなる責任を負うものではなく、またインテル製品の販売や使用に関する明示または黙示の保証(特定目
的への適合性、商品適格性、あらゆる特許権、著作権、その他知的財産権の非侵害性への保証を含む)に関してもいかなる責任も負いません。
Intel、インテル、Intel ロゴ、Look Inside.、Look Inside. ロゴは、アメリカ合衆国および / またはその他の国における Intel Corporation の商標です。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
インテル株式会社
〒 100-0005 東京都千代田区丸の内 3-1-1
http://www.intel.co.jp/
©2014 Intel Corporation. 無断での引用、転載を禁じます。
2014 年 8 月
329828-001JA
JPN/1408/PDF/SE/IT/TC
Fly UP