Comments
Description
Transcript
OLAP の分析手法
BIO for Retail related column: Vol.002 OLAP の分析手法 2003.6.6 山本 泰史 日本 NCR 株式会社 テラデータ事業本部 流通事業部 マーケティング担当 ■ご利用にあたって 本ドキュメントの著作権に関して 登録商標及び商標 本ドキュメントの内容は著作権によって保護されており、これらは全て日本 NCR 株式会社 に帰属します。商用目的での無断転用、転載を禁じます。 MicroStrategy、MicroStrategy7 は米国 MicroStrategy Inc.の登録商標です。 目次 1.はじめに -OLAP とは何か …Page2 2.定型帳票とは何が違うのか …Page2 3.OLAP ツールにおけるデータの構造 …Page3 4.OLAP ツールの主な機能 …Page4 5.ドリルダウン/ドリルアップ …Page5 6.軸の切り替え …Page5 7.スライス&ダイス …Page5 8.クロスカラム/クロス行 …Page6 9.カラム/行の並び替え …Page7 10.OLAP ツールの付帯的な機能 …Page7 11.プロンプト機能 …Page8 12.グラフ/視覚化機能 …Page8 13.ビジネスインテリジェンスツール内での位置付け …Page10 14.OLAP の分析が向かないケース …Page11 15.おわりに …Page12 BIO: Business Improvement Opportunities for Retail Industry 関連ドキュメント 2:OLAP の分析手法 1.はじめに -OLAP とは何か このドキュメントでは、OLAP を利用した分析手法に関してご紹介をしていきます。何よりもまず、OLAP とは何かという部分につ いてご紹介するべきでしょう。OLAP は、On Line Analytical Processingの略称で、日本語では多次元分析ツールと呼ばれていま す。単純に言えば分析ツールで、データウェアハウスのフロント、つまり利用者がデータウェアハウスにアクセスする際のツール の一つとして利用されるものです。元々は、OLTP: On Line Transaction Processing、つまりコンピュータの処理形態の一つである 取引更新処理に対比して表現する形で、この OLAP は位置付けられています。OLAP ツール以外にもデータウェアハウスに対 して分析を行う為のツールというのは幾つか存在しますが、これは本ドキュメントの目的からは若干外れる為、最後の章でご紹 介することにしましょう。小売業が保持しているデータを店、商品、そして日といった 3 次元のルービックキューブのような構造体 でデータを想像される方は多いと思います。また、実際には顧客、取引先、商品のカラーやサイズといった形でデータのバリエ ーション、つまり次元は多岐に渡ります。また商品分類、時間の階層、店舗階層といった形で、それぞれの情報は、階層的に保 持されています。これらのデータを多次元に分類し、データの分析を行う利用者が仮説を検証したり、問題点を発見し、原因を 追求することを可能とするのが、多次元分析ツール、つまり OLAP ツールです。 2.定型帳票とは何が違うのか 図 1:定型帳票の例 4月度売上粗利実績 店舗 店舗A 店舗 店舗B 店舗 店舗C 店舗 店舗D 店舗 店舗E 店舗 店舗F 店舗 店舗G 店舗 合計 部門 部門A 部門 計画 売上 売上 粗利 金額 金額 金額 999,999 888,888 444,444 999,999 888,888 444,444 999,999 888,888 444,444 999,999 888,888 444,444 999,999 888,888 444,444 999,999 888,888 444,444 999,999 888,888 444,444 6,999,993 6,222,216 3,111,108 部門B 部門 計画 売上 売上 粗利 金額 金額 金額 999,999 888,888 444,444 999,999 888,888 444,444 999,999 888,888 444,444 999,999 888,888 444,444 999,999 888,888 444,444 999,999 888,888 444,444 999,999 888,888 444,444 6,999,993 6,222,216 3,111,108 部門C 部門 計画 売上 売上 粗利 金額 金額 金額 999,999 888,888 444,444 999,999 888,888 444,444 999,999 888,888 444,444 999,999 888,888 444,444 999,999 888,888 444,444 999,999 888,888 444,444 999,999 888,888 444,444 6,999,993 6,222,216 3,111,108 部門D 部門 計画 売上 売上 粗利 金額 金額 金額 999,999 888,888 444,444 999,999 888,888 444,444 999,999 888,888 444,444 999,999 888,888 444,444 999,999 888,888 444,444 999,999 888,888 444,444 999,999 888,888 444,444 6,999,993 6,222,216 3,111,108 合計 計画 売上 売上 金額 金額 3,999,996 3,555,552 3,999,996 3,555,552 3,999,996 3,555,552 3,999,996 3,555,552 3,999,996 3,555,552 3,999,996 3,555,552 3,999,996 3,555,552 27,999,972 24,888,864 粗利 金額 1,777,776 1,777,776 1,777,776 1,777,776 1,777,776 1,777,776 1,777,776 12,444,432 上記のようなレポートを常日頃、プリントアウトしてご利用している方も多くいらっしゃることと思います。言わば管理用の定型帳 票です。細か過ぎてご覧になれないかもしれませんが、まあ気にしないで下さい。仮に紙でこのような帳票が配布されていて、 ここから自店の問題点を把握しなければならないとすると、この帳票ではちょっと無理があります。計画を達成しているか、粗利 を稼げているかどうか等の”結果”しか判断できません。管理、実績の把握という観点からは、これで問題ないかもしれません が、”原因”を追求するにはちょっと無理があります。この”原因”を追求するというのが、分析の大きな動機です。多角的な見方、 より詳細なレベルでの見方へと人を駆り立てる根本的な理由となります。そして、人間は”原因”を追求することにより、何をする べきかが明確になります。意思決定がなされ、行動へと連繋していきます。”結果”を把握する事に意味が無いということではあり ません。昨日の売上がどうだったかを知りたくない小売業の方はいらっしゃらないと思います。しかしここで扱っているテーマは、 結果がわかって”それからどうするのか?”ということです。複数の”結果”をつなげて文脈として理解することによって、原因を理 解し、やるべきこと、そして時にはやるべきではないことが明確となり、弛み無い自信に満ちた行動へとつなげることが重要とな ります。そして、その為のツールが OLAP ツールであるという事です。仮説を持った利用者、または原因を追求していきたい利 用者が、多角的な見方、より詳細なレベルでの見方を通じて、仮説の検証、または原因の追求をする為のツールです。 データウェアハウスの構築を支援していく中で、定型帳票を既存システムから移行したいという要望を良く伺います。今まで他の システムで出力してきた情報と同じ帳票を出して欲しいという要望です。それをすることに問題があると言うつもりは有りません。 しかしながら、同じ帳票が出てきて意味があるかどうかは利用する側が考えなければなりません。既存の定型帳票を移行するの みで違う見方、より詳細な見方ができないということは、価値的には今までのシステムと比較して何の進化も存在しないという事 Page 2 of 12 BIO: Business Improvement Opportunities for Retail Industry 関連ドキュメント 2:OLAP の分析手法 になります。システムを切りかえる意味があるのかを考えなければならないでしょう。何よりも、”管理”目的の定型帳票を利用して、 日々のデータを管理するだけでは効果は生まれません。原因を追求して、行動へつなげてこそ、効果が導き出されます。 3.OLAP ツールにおけるデータの構造 以降の章では、OLAP ツールの利用方法、つまり機能と、これを利用することによってどのように原因追求、仮説検証をしていく かをご紹介していきたいと思いますが、その前にこの章で、前提となる条件をご紹介していきたいと思います。”利用者がパソコ ンの画面を前にして何らかの質問を実施する、そしてコンピュータが答えを返す”。これを繰り返すのがほとんどの場合における 分析のスタイルであると言えるでしょう。この際にデータウェアハウスと利用者の間を取り持ってくれるのが、OLAP ツールです。 この際に利用者は、コンピュータの画面に、あるデータを表示して欲しいという事になります。ほとんどの OLAP ツールでは、こ のデータを 3 つのデータタイプとして分類しています。ここでは MicroStrategy 社の OLAP ツール、MicroStrategy7 を例に挙げ て流用していきますが、他のツールでも言葉こそ違えど、同じようにデータを類別しているはずです。1 つ目は、”フィルタ”と呼 ばれるものです。これは、どの範囲のデータを見たいのかという事を指し示します。以下の図 2 の例では、特定店舗、特定の月 に絞りこんでいます。これが、フィルタです。そして 2 つ目は、何のデータを見たいのかという事です。これは”メトリック”と呼ばれ ます。売上数量や売上金額、粗利金額等がこれに該当します。日本語に置きかえれば指標値と言えるでしょう。またはデータウ ェアハウス上の実績データそのもの、もしくはその計算結果を指し示します。例えば、売上金額と売上原価の実績データがあれ ば、”粗利金額”というメトリックを算出することが可能です。3 点目は、”アトリビュート”です。日本語では属性を意味し、商品分類 や商品名称、顧客名称等がこれに該当します。データウェアハウス上のマスタデータを指し示し、指標値を分類する為の区分 であり、どのようにデータを見たいのかはここで決定されます。ほとんどのアトリビュートは、コード体系化されています。これ以 外の補足的な表示や表現として合計や平均値を表示させたり、グラフで視覚的に表示させたりする方法がありますが、これらは 装飾であり、上述した 3 つのデータ分類が基礎となり、利用者がデータを見るセットであるレポートが構築されます。 図 2:フィルタ、メトリック、アトリビュート 店舗=店舗A 月=2003年4月 フィルタ メトリック 部門 部門A 部門 部門B 部門 部門C 部門 部門D 部門 部門E 部門 メトリック 売上数量 売上金額 粗利金額 1,000 100,000 50,000 1,000 100,000 50,000 1,000 100,000 50,000 1,000 100,000 50,000 1,000 100,000 50,000 アトリビュート 1.フィルタ:絞り込みの条件、データウェアハウス内のどの範囲のデータを見たいか 例:全店、三軒茶屋店のみ、3 月のみ、売上金額上位 10%の顧客のみ、商品分類 A 及び B のみ、 商品 A を購入しているが B は購入していない顧客のみ… 2.メトリック:指標値、データウェアハウス上の実績データもしくはその計算値、何のデータを見たいか 例:売上金額、粗利金額、在庫数量… 3.アトリビュート:属性、データウェアハウス上のマスタデータ、どのようにデータを見たいか 例:月、週、商品分類、商品、カラー、サイズ、店舗、地域、顧客、顧客郵便番号… 図 2 においては、アトリビュートが縦軸に、メトリックが横軸に表現されていますが、これは逆でも構いません。また、複数のアトリ Page 3 of 12 BIO: Business Improvement Opportunities for Retail Industry 関連ドキュメント 2:OLAP の分析手法 ビュート、複数のメトリックを一緒に表示しても構いません。一般的な形は縦軸にアトリビュートを、横軸にメトリックを配置する形 です。第一印象は定型帳票とほとんど変わりありません。定型帳票との違いは次章以降でご説明をしていきますが、縦軸や横 軸を変更したり、違うアトリビュートや違うメトリックに切りかえる、またよりフォーカスを絞ったフィルタ条件に絞りこむといった形で 何度もデータウェアハウスとやりとりを繰り返していくことによって、原因追求することが可能となります。データウェアハウスとイン タラクティブな質疑応答を実施し、結果を積み重ねて行く中でどうしてそうなったのかという文脈を理解し、原因へとたどり着き、 行動へとつなげるという事になります。そういった意味では、それぞれのレポートは分析のある段階におけるスナップショットで あるという事ができるでしょう。 読者の皆様の知識的な背景によっては若干専門的になるかもしれませんが、データウェアハウスに対する問い合わせには、専 門の言語で問い合わせをする必要があります。これには SQL という言語を利用します。当然ながら一般にデータ分析をする利 用者は、この言語を理解していませんし、理解する必要も有りません。OLAP ツールは、利用者の質問を理解し、上述した 3 つ のデータ分類を組み立ててインスタントに SQL を作成し、利用者に代わってデータウェアハウスに質問します。そして返ってき た結果を利用者の画面に提供するサービスをつかさどります。その際に欠くことができない 3 つの要素が”フィルタ”、”メトリッ ク”、”アトリビュート”です。 4.OLAP ツールの主な機能 OLAP ツールには、以下のような機能が利用者のデータ分析機能として提供されています。以下の 5 つの機能は標準的な機能 であり、各 OLAP ツールによって、利用者の利便性を確保する為に様々な機能が追加されています。これらの機能は OLAP ツ ールの本質的な利用目的である、情報を類別し、理解するべき原因にいち早くたどり着くという事を実現しています。またパソコ ンの画面から、これらの機能を利用して対話的にコンピュータとやり取りすることによって、利用者の思考に従順な、言い換えれ ば文脈に沿った分析を可能とします。 -ドリルダウン/ドリルアップ -軸の切り替え -スライス&ダイス -クロスカラム/クロス行 -カラム/行の並び替え Page 4 of 12 BIO: Business Improvement Opportunities for Retail Industry 関連ドキュメント 2:OLAP の分析手法 5.ドリルダウン/ドリルアップ 表示しているアトリビュート、つまり軸もしくは階層から下位の階層へと絞りこんだり、上位の階層に上がったりすることが出来ま す。例えば月度のレポートから週のレベルへのドリルダウンを実施したり、四半期や年のレベルへドリルアップすることが可能で す。 図 3:ドリルダウンの例 店舗=店舗A 月=2003年4月 部門 部門A 部門 部門B 部門 部門C 部門 部門D 部門 部門E 部門 合計 メトリック 売上数量 売上金額 粗利金額 粗利率 1,000 100,000 30,000 30.0% 1,000 100,000 50,000 50.0% 1,000 100,000 50,000 50.0% 1,000 100,000 50,000 50.0% 1,000 100,000 50,000 50.0% 5,000 500,000 230,000 46.0% 店舗=店舗A 月=2003年4月 部門=部門A ドリルダウン クラス メトリック 売上数量 売上金額 粗利金額 粗利率 200 20,000 5,000 25.0% クラスAA クラス クラスAB 200 20,000 5,000 25.0% クラス 200 20,000 5,000 25.0% クラスAC クラス クラスAD 200 20,000 5,000 25.0% クラス クラスAE 200 20,000 10,000 50.0% クラス 合計 1,000 100,000 30,000 30.0% この機能を利用することによって、例えば、特定の商品分類の粗利率が悪かった際に、より詳細な商品レベルにドリルダウンし ていくことによって、どの商品が足を引っ張っているのかを認識することが可能となります。このように鳥の目から虫の目に視点 を降ろしていくことによって、改善を必要とする商品とそうでない商品を選り分けることが可能となります。 6.軸の切り替え 表示している軸から別の軸へ切り替えることができます。例えば月度のレポートから商品分類別のレポートに切り替えることが可 能となります。 図 4:軸の切り替え例 店舗=店舗A 月=2003年4月 部門 部門A 部門 部門B 部門 部門C 部門 部門D 部門 部門E 部門 合計 メトリック 売上数量 売上金額 粗利金額 粗利率 1,000 100,000 30,000 30.0% 1,000 100,000 50,000 50.0% 1,000 100,000 50,000 50.0% 1,000 100,000 50,000 50.0% 1,000 100,000 50,000 50.0% 5,000 500,000 230,000 46.0% 店舗=店舗A 月=2003年4月 軸の切り替え 顧客ランク ランクA ランク ランクB ランク ランクC ランク ランクD ランク 非会員 合計 メトリック 売上数量 売上金額 粗利金額 粗利率 2,000 200,000 100,000 50.0% 1,000 100,000 50,000 50.0% 800 80,000 40,000 50.0% 200 20,000 10,000 50.0% 1,000 100,000 30,000 30.0% 5,000 500,000 230,000 46.0% この機能を利用することによって、同じデータの集合を、全く違う切り口で見ることが可能となります。例えば、特定の商品分類を アトリビュートとしてリストしているレポートから、顧客ランクに軸を切りかえることによって、商品分類間の構成と顧客ランク間の構 成を比較することが可能となります。 7.スライス&ダイス スライスはページバイ(タブやプルダウン)を用いて、レポートを三次元的に表示する機能です。ダイスは表示している横軸(カラ ム)と縦軸(行)を、まるでさいころを転がすように入れ換えて表示する機能です。例えば月度のトレンドレポートを見ている際に、 トレンドを縦軸にも横軸にも、また三次元(奥行き)としても把握することが可能です。 Page 5 of 12 BIO: Business Improvement Opportunities for Retail Industry 関連ドキュメント 2:OLAP の分析手法 図 5:スライスの例 店舗A 店舗B 店舗 月=2003年4月 月=2003年4月 部門 部門A 部門 部門B 部門 部門C 部門 部門D 部門 部門E 部門 合計 メトリック 売上数量 売上金額 粗利金額 粗利率 1,000 100,000 30,000 30.0% 1,000 100,000 50,000 50.0% 1,000 100,000 50,000 50.0% 1,000 100,000 50,000 50.0% 1,000 100,000 50,000 50.0% 5,000 500,000 230,000 46.0% スライス(タブ) 部門 部門A 部門 部門B 部門 部門C 部門 部門D 部門 部門E 部門 合計 店舗C 店舗D 店舗E 合計 メトリック 売上数量 売上金額 粗利金額 粗利率 100 10,000 5,000 50.0% 100 10,000 5,000 50.0% 100 10,000 5,000 50.0% 100 10,000 5,000 50.0% 100 10,000 5,000 50.0% 500 50,000 25,000 50.0% スライスの機能を利用することによって、利用者はあたかも同じフォーマットで、違う条件のレポートを実行しているかのように、 データを比較することが可能となります。上述の例のように、各店舗の実績を比較する際に、タブ、もしくはプルダウンを操作す ることによって比較が可能となります。 図 6:ダイスの例 月=2003年4月 ページバイ:売上金額 週 部門 部門A 部門B 部門C 部門D 部門 部門 部門 部門 1,000 1,000 1,000 1,000 月第1週 4月第 月第 週 月第2週 4月第 2,000 1,000 500 800 月第 週 月第3週 3,000 1,000 1,000 700 4月第 月第 週 月第4週 4月第 3,500 1,000 1,500 600 月第 週 ダイス 月=2003年4月 ページバイ:売上金額 部門 週 4月第 月第1週 月第2週 月第3週 月第4週 月第 週 4月第 月第 週 4月第 月第 週 4月第 月第 週 1,000 2,000 3,000 3,500 部門A 部門 部門B 1,000 1,000 1,000 1,000 部門 部門C 部門 1,000 500 1,000 1,500 部門D 1,000 800 700 600 部門 またダイスの機能を利用することによって、利用者は見たいフォーマットに変更することが可能となります。例えば、縦軸に指定 していた商品分類を、週のトレンドに軸変換したとしましょう。トレンドを横軸に見たい場合には、これを横軸に置くことによって、 トレンドを右から左へという流れで見ることが可能です。 8.クロスカラム/クロス行 複数のカラムヘダー、行ヘダーを表示させます。これにより月毎-商品分類毎の売上レポートといった複数の集計基準に基づい た表示が可能です。但し、メトリックを縦軸と横軸の両方に配置することはできません。論理的に無茶なのはお分かり頂けると思 います。 図 7:クロスカラム/クロス行の例 複数のアトリビュートをクロスで表示することが可能 月=2003年4月 メトリック 売上金額 仕入金額 粗利金額 カラー ホワイト ベージュ M L M サイズ L 1,000,000 5,000,000 300,000 500,000 1,200,000 6,000,000 600,000 1,000,000 500,000 2,500,000 100,000 200,000 複数のメトリック表示は可能だが、メトリック同士のクロス表示は不可能 月=2003年4月 メトリック 売上金額 仕入金額 粗利金額 店舗 店舗A 店舗B 店舗 店舗 メトリック 売上数量 仕入数量 売上数量 仕入数量 ??? ??? ??? ??? ??? ??? ??? ??? ??? ??? ??? ??? この機能を利用することによって、例えばカラーサイズの組合せ毎の構成比を把握したいといった、複数のアトリビュートを組み 合わせてデータ構造を理解することが可能となります。 Page 6 of 12 BIO: Business Improvement Opportunities for Retail Industry 関連ドキュメント 2:OLAP の分析手法 9.カラム/行の並び替え 降順/昇順といった形でカラム/行の値に基づいて並び替えることが可能です。例えば部門毎のレポートを見ている際に一番大 きな売上を構成する部門から順に並び替えることが可能となります。 図 8:行の並び替えの例 月=2003年4月 部門 部門A 部門 部門B 部門 部門C 部門 部門D 部門 部門E 部門 合計 月=2003年4月 メトリック 売上数量 売上金額 粗利金額 粗利率 売上金額を 部門 1,000 100,000 50,000 50.0% 基準に並び替え 部門C 部門 部門B 2,000 200,000 100,000 50.0% 部門 1,000 300,000 150,000 50.0% 部門E 部門 部門A 1,000 50,000 25,000 50.0% 部門 部門D 部門 1,000 120,000 60,000 50.0% 合計 6,000 770,000 385,000 50.0% メトリック 売上数量 売上金額 粗利金額 粗利率 1,000 300,000 150,000 50.0% 2,000 200,000 100,000 50.0% 1,000 120,000 60,000 50.0% 1,000 100,000 50,000 50.0% 1,000 50,000 25,000 50.0% 6,000 770,000 385,000 50.0% 図 9:カラムの並び替えの例 売上金額の位置を変更 月=2003年4月 部門 部門A 部門 部門B 部門 部門C 部門 部門D 部門 部門E 部門 合計 月=2003年4月 メトリック 計画売上金額 売上金額 粗利金額 仕入金額 100,000 100,000 50,000 100,000 250,000 200,000 100,000 300,000 290,000 300,000 150,000 320,000 60,000 50,000 25,000 70,000 100,000 120,000 60,000 150,000 800,000 770,000 385,000 940,000 部門 部門C 部門 部門B 部門 部門E 部門 部門A 部門 部門D 部門 合計 メトリック 計画売上金額 粗利金額 仕入金額 売上金額 100,000 50,000 100,000 100,000 250,000 100,000 300,000 200,000 290,000 150,000 320,000 300,000 60,000 25,000 70,000 50,000 100,000 60,000 150,000 120,000 800,000 385,000 940,000 770,000 この機能を利用することによって考えられるメリットは二つです。一つは、アトリビュートを特定メトリックの値に基づいて並び替え ることによって、アトリビュート内の項目で特筆するべきポイントに目線をフォーカスする、または各項目の順位を理解することが 可能になるという点です。そしてもう一点は、メトリックの順番を入れかえることによって、例えば、売上金額を、計画売上金額の 隣に持ってきて、二つの値を比較することも可能ですし、その後、売上金額を仕入金額と比較する為に、隣に持ってくることも可 能でしょう。比較したい二つもしくはそれ以上のメトリックを並べることによって、比較を行いやすくなります。 10.OLAP ツールの付帯的な機能 前章までで基本的な機能をご紹介してきましたが、付帯的に活用可能な機能とその利用のメリットをご紹介していきます。付帯 的という意味は、重要ではないという意味では有りません。上述した基本的な機能をより使いやすくする為の機能として存在して います。 -プロンプト機能 -グラフ/視覚化機能 また、以下の機能も付帯的な機能です。これらに関しては、説明が不要と思われる為、割愛します。 -ピボッティング機能 -軸の折畳み、展開の機能 -合計、平均等の演算機能 Page 7 of 12 BIO: Business Improvement Opportunities for Retail Industry 関連ドキュメント 2:OLAP の分析手法 -スプレッドシートや CSV 形式等へのエクスポート機能 -印刷形式へのフォーマッティング機能 また機能とは若干違いますが、特筆するべき点は、ほとんどの OLAP ツールはこれらの機能を Web ブラウザ上で実行可能であ るという点です。これにより、インターネットブラウジングの操作レベルのリテラシーを持つ利用者であれば基本的に利用可能と なりますし、利用者のパソコンには、ブラウザが存在すれば利用可能となる為、対象となる利用者への敷居を下げることになりま す。 11.プロンプト機能 プロンプトは、日本語で”促す”という意味を持ちます。文字通り、利用者に対して条件指定を促す機能です。レポートのフォー マットを用意しておき、利用者が分析をする際に、フィルタ条件を利用者が指定するとレポートが実行されるようになる機能を指 します。これによって、例えば各店の店長の売上実績レポートを作成する際に、1 つのレポートフォーマットを用意しておけば、 各店の店長は自店の店番、もしくは店名を指定すれば自分の店の売上実績を把握する事が可能になります。 図 10:プロンプト機能を利用したレポート例 店別売上実績レポート プロンプト条件: 店番を入力、もしくはプルダウンより店舗を指定して、実行ボタンを押してください。 実行 月=2003年4月 店舗=店舗A 部門 部門A 部門 部門B 部門 部門C 部門 部門D 部門 部門E 部門 合計 メトリック 売上数量 売上金額 粗利金額 粗利率 1,000 100,000 50,000 50.0% 2,000 200,000 100,000 50.0% 1,000 300,000 150,000 50.0% 1,000 50,000 25,000 50.0% 1,000 120,000 60,000 50.0% 6,000 770,000 385,000 50.0% ちなみに、定型レポート、非定型レポート(非定型分析、汎用分析、アドホッククエリー…)という表現が良く使われますが、定型レ ポートは一般的に、ボタンやアイコンをクリックすれば一発でレポートが出てくるものを指します。これに対して、上記のプロンプ トを利用して、フィルタ条件だけでなく、アトリビュートとメトリックも利用者が指定するケースを非定型レポートと言います。例えば 図10 のように、フィルタ条件のみをプロンプトさせ、レポートフォーマット、つまりアトリビュートとメトリックを固定させている場合は、 言うなれば半定型のレポートと表現すると的確でしょうか。当然ながら、このような形でいったん条件を指定してデータを表示さ せた後、上述してきたような OLAP の機能を利用できることが OLAP ツールの条件ということになります。 定型レポート=フィルタ、アトリビュート、メトリックの全てが固定 半定型レポート=フィルタはプロンプト機能により利用者が指定、アトリビュートとメトリックは固定 非定型レポート=フィルタ、アトリビュート、メトリックの全てをプロンプト機能により利用者が指定 12.グラフ/視覚化機能 データの視覚化機能、特にグラフの機能は実に豊富で様々な形があり、ここでは説明しきれませんので幾つか基本的なものに 絞ってご紹介していきます。目的としては、数値データを視覚的に表現することによって直感的な理解を得ることに有ります。し かしながらこれは数値データが存在しない限り視覚化することはできませんし、最終的な行動へ結び付けるには、やはり数値的 な理解に立ち帰る必要があります。 Page 8 of 12 BIO: Business Improvement Opportunities for Retail Industry 関連ドキュメント 2:OLAP の分析手法 グラフの機能 1:棒グラフ このグラフは、アトリビュート毎の値の大小を比較する為に用います。売上金額のような絶対値を比較する場合もありますし、粗 利率のような相対値を比較する場合にも利用されます。 グラフの機能 2:線グラフ このグラフは、主にトレンド等の推移を把握する為に用いられます。売上のパターンが、上昇であるか、下降であるか、フラットで あるか等を把握します。また急激なスパイクや、落ち込み、サイクリックに発生するパターンを認識することが可能です。 グラフの機能 3:円グラフ このグラフは、全体の中での構成比を理解する為に用いられます。特定商品分類の中で大きな構成比を占める配下の商品分 類は何か、逆に貢献度の少ない配下の商品分類は何か等を把握する事が可能です。 グラフの機能 4:プロッティング このグラフは、異なる二つのメトリックを縦軸と横軸に配置し、傾向が集中するポイントはどこかを理解する為に用いられます。以 下の例では、縦軸のメトリックに買上点数、横軸のメトリックに売上金額を置いて、バスケット、つまりそれぞれの取引をプロットし ています。ここから、この店舗における平均的な 1 取引あたりの購買ボリュームと最大、最小レンジを理解することが可能です。 図 11 グラフ化の例 売上金額 売上金額 350,000 部門A 300,000 250,000 部門B 200,000 売上金額 部門C 売上金額 150,000 100,000 50,000 部門D 0 0 50,000 100,000 150,000 200,000 250,000 300,000 第1週 第2週 売上金額構成比 第3週 第4週 バスケットID 12000 部門A 部門B 部門C 部門D 売上金額 10000 8000 6000 バスケットID 4000 2000 0 0 2 4 6 買上点数 Page 9 of 12 8 10 BIO: Business Improvement Opportunities for Retail Industry 関連ドキュメント 2:OLAP の分析手法 視覚化の機能 1:色分け表示 例えば、売上金額が計画対比 100%以上の商品分類は青、100%未満 90%以上は黄色、90%未満は赤といった形でルールに 基づいて色分けする機能を指し示します。この色分けは、カラムの色を変更する場合もありますし、文字の色を変更することもあ るでしょう。また太字にしたり、シンボルに置きかえるという事も可能です。これによって、ルールを逸脱した注目するべきポイント を目立たせ、直感的に問題のポイントを理解することが可能となります。ツールによって言葉は違いますが、敷居値、サーモカ ラーリング、アラーティング、ダッシュボード、スコアカード等と呼ばれる機能です。 図 12:色分け表示の例 しきい値をベースにしたカラーリング シンボルでの表示 月=2003年4月 月=2003年4月 部門 部門A 部門 部門B 部門 部門C 部門 部門D 部門 部門E 部門 合計 部門 部門A 部門 部門B 部門 部門C 部門 部門D 部門 部門E 部門 合計 メトリック 計画売上金額 売上金額 売上金額計画差額比 100,000 100,000 0.0% 250,000 240,000 -4.0% 290,000 300,000 3.4% 60,000 50,000 -16.7% 100,000 120,000 20.0% 800,000 810,000 2.8% メトリック 計画売上金額 売上金額 売上金額計画差額比 ◎ 100,000 100,000 △ 250,000 240,000 ◎ 290,000 300,000 60,000 50,000 × ◎ 100,000 120,000 800,000 810,000 2.8% 視覚化の機能 2:色分け表示の応用例 上述した色分けはレポート上に実施するものですが、同様のことを例えば地図イメージ上に実施することも可能ですし、売場イ メージ上に色分け実施することも可能でしょう。但し、地図や売場、棚等のスペースを定義するデータや表示するフォーマットが 定義される必要があります。また、反対に地図や売場、棚等のスペース上に数値を配置する、円グラフやプロット等のグラフを配 置するということもあるでしょう。但し、ツールによってはこれらの機能を実装する際にカスタマイズが必要となるケースがありま す。 このほか、商品画像とリンクさせることによって、例えば商品分析であれば当該商品がどんな商品であるかを理解させやすくす ることも可能ですし、ドキュメントファイルとリンクさせることによって、数値データ以外の情報と統合することも可能でしょう。商品 の詳細なスペックドキュメントとリンクさせれば、当該商品のデータ分析から、商品の詳細なスペックの把握へつなげることが可 能です。 13.ビジネスインテリジェンスツール内での位置付け OLAP ツールも含め、データウェアハウスに対して利用者の代わりにアクセスをするツールは”ビジネスインテリジェンスツール” と総称されています。一般的にビジネスインテリジェンスツールは以下に大別されます。利用方法や利用者に応じて、使い分け る必要があります。OLAP ツールに関しては重複する部分も有りますが、比較の意味で重ねて記載します。 -定型レポートツール -データアクセスツール -OLAP ツール -データマイニングツール Page 10 of 12 BIO: Business Improvement Opportunities for Retail Industry 関連ドキュメント 2:OLAP の分析手法 定型レポートツール 定型レポートツールは、データウェアハウスからフォーマットが事前定義されたレポートを表示させる為のツールです。通常利用 者は、ボタン一つでこれらのレポートにアクセスでき、全員が結果を共有したり、単純に定型化された結果の表示を求める場合 に最適です。対象となる利用者は組織階層の上下を問わず、利用も容易な為、広い範囲に及ぶ反面、結果を把握するのみで あり、詳細な原因の追求といった分析に結びつけることが出来ません。 データアクセスツール データアクセスツールは、コンピュータ言語等を理解していないビジネス利用者がデータウェアハウス内のデータにアクセスす る為のツールです。Visual Basic 等で構築されたアプリケーションも、これに該当します。特定の業務の流れに即したワークフロ ー的な画面を事前に構築することにより、利用者は業務の一環としてデータウェアハウスにアクセスし、データを活用することが 可能となります。構築したアプリケーションによっては業務が特定される為、利用者は利用する必然性がある方に限定されま す。 OLAP ツール OLAP ツールは、On Line Analytical Processingツールの略で、日本語では多次元分析ツールとも呼ばれます。利用者はデータ ウェアハウス上のデータをキューブ(立方体)を操作するように集計レベルや軸を切り替えながらアクセスすることが可能です。シ ステム的にはデータウェアハウス上のデータ項目をオブジェクト化し、これらを組み立てることによって SQL(データベースへの 問い合わせ言語)を作成し、利用者に代わってデータウェアハウス、または事前に作成された多次元データベースにアクセスし、 結果を表示します。データウェアハウスに対して直接アクセスする OLAP ツールを ROLAP(Relational-OLAP)、データウェアハ ウスからロードされた多次元データベースに対してアクセスする OLAP ツールをMOLAP(Multi Dimensional-OLAP)と呼びます。 これ以外にもクライアント側にある程度の多次元キューブをダウンロードするデスクトップ OLAP や、ROLAP と MOLAP の両方 を兼ね備えた Hybrid-OLAP 等もあります。利用者はある程度データウェアハウス内のデータ項目とその構造を理解する必要が あり、OLAP ツールの操作方法も含めて利用の能力が求められます。データウェアハウスとのインタラクティブな分析をサポート する為、結果から原因を追求する為の分析作業には最適です。 データマイニングツール データマイニングツールは、上述した 3 つのツールとは多少趣きが違います。上述した 3 つのツールは利用者がアクセスする データに関して何らかの仮説を持っている(仮説検証型)のに対して、データマイニングツールは、システムが大量のデータの 中からアルゴリズムを用いてデータ間の相関関係、因果関係等を発見してくれる(仮説発見型)ツールです。データマイニングツ ールを利用する利用者はビジネスインテリジェンスツールを利用する利用者の中でも一番高度な利用能力が求められます。デ ータウェアハウス内のデータ項目とその構造、またツールの操作方法に加えて、データマイニングツールに分析をさせるフロー をデザインする能力が必要となります。 14.OLAP の分析が向かないケース 上述したように、それぞれのツールには特性や目的がある為、OLAP ツールに向かないケースももちろん存在します。例えば、 本当に定型的なレポートを出すのであれば、利用者の質問内容に基づいて SQL(データベースへの問い合わせ言語)を組み 立てる OLAP ツールよりは、SQL を既に組み込んでいる定型レポートの方がふさわしいと言えるでしょう。また、多次元ツールと 称されている通り、次元(顧客、商品といった各アトリビュートと、部門-ライン-クラスといったアトリビュート間の関係や階層)に基づ いて分析を実施する為、これらを逸脱したアクロバティックな分析には向きません。例えば、ドリルダウンの流れを地域>地区>店 舗>部門>ラインといった具合にルールが存在しない方向にドリルダウンを実施していくことは不可能です。また、商品分類をドリ ルダウンしていく中で、部門とラインは[計画売上金額]を表示し、クラス、サブクラス、商品は[前年売上金額]を表示するといった Page 11 of 12 BIO: Business Improvement Opportunities for Retail Industry 関連ドキュメント 2:OLAP の分析手法 ことも不可能です。実際には軸の切り替えを実施するか、違うレポートを用いる等で対応することが可能である為、正確には不 可能ではありませんが、ドリルダウンというシンプルな流れの中で実施するべきことではありません。仮にドリルダウンというシン プルな流れの中で実施をする為には上述したような要件を定義し、必ずその見方をすることを前提としなければばなりません。 その為仮にこういったアクロバティックな見方をするのであれば、上述したデータアクセスツールの役割であると言えるでしょう。 また、レポートや画面の体裁に関しても、微細にこだわって表示させる場合には、相応のカスタマイズコストを考慮しなければな りません。これらのカスタマイズを実施していけばいくほど、データアクセスツールに近くなっていくと言えますし、画面そのもの を固定化すれば定型レポートツールに近くなっていくでしょう。 OLAP ツールを利用するメリットは、広範囲での様々な分析形態の大部分を、データアクセスツール、つまり一からの開発よりも 安価に、そして早く提供することにあります。注目するべき点は、データウェアハウスの利用者は数百から数千の利用者数となり、 それぞれの利用者が組織的な役割や違う業務を分担しており、結果的に実施したい分析は皆さん少しづつ異なってくるという 事です。また同じ利用者でも月初の分析と週初めの分析では分析方法が異なってきます。結果的に実施される分析は何万パ ターン、何十万パターンとなります。また、これを起点に実施される対話的な分析の方向を含めるとパターンは更に二次関数的 に増大します。これらの全てに対応する分析画面を全て一から構築する手間を回避したければ、OLAP ツールを利用するべき ですし、この手間をかけても微細にこだわるのであれば個別にデータアクセスツールを開発するべきでしょう。但し、米国の企 業において特に顕著に散見されるのは、微細にこだわらず、このような OLAP ツールをシンプルに導入し、利用することによっ てコストの低減と活用までの時間短縮を獲得するということが徹底していると言う点です。あるものを使い、利用者の利用能力を 高めることによってデータの活用を実施する企業と、微細に手を入れて、利用者の利用能力にツールを合わせることに多大な コストをかける企業が競争をした場合に、コストの観点からも、利用者の能力の観点からも、大きな差が出てしまうのではないで しょうか。現実的には本当に重要な業務やワークフローに限ってデータアクセスツール、つまりアプリケーション開発やパッケー ジアプリケーションにて提供し、それ以外の分析は OLAP ツール等で補う形が、あらゆる分析形態をカバーしつつ重要な業務 をぬかりなくサポートする上では一番良い形なのではと思います。 15.おわりに 以上、OLAP ツールとは何か、どのような機能を持っているのか、そしてその機能を利用することのメリットについてご紹介してき ました。まとめとして以下の 2 点を挙げたいと思います。 1.OLAP ツールは、データウェアハウスと対話的に分析を実施する為のツールである。 2.OLAP ツールを利用した対話的な分析により、原因を追求し、仮説を検証することが可能となる。 ここでは、極めてベーシックな部分に絞って記載してきましたが、専門書等からより詳細な情報に触れることも可能だと思います。 また、IT 部門においてシステム管理をなさる方には、バックエンドのシステムがどのようにあるべきか、また実際に運用をしてい く際に考慮するべきポイント等も導入にあたって把握する必要があるでしょう。このドキュメントでは、利用者に提供される機能と そのメリットに絞りました。データウェアハウスのフロントツールとして OLAP ツールを利用する、もしくは利用を計画している方の 参考になれば幸いです。/// Page 12 of 12