...

Oracle の 大規模データ・ウェアハウス 向けトップ 10 機能

by user

on
Category: Documents
1

views

Report

Comments

Transcript

Oracle の 大規模データ・ウェアハウス 向けトップ 10 機能
Oracle の
大規模データ・ウェアハウス
向けトップ 10 機能
W INTER C ORPORATION
Oracle の
大規模データ・ウェアハウス向け
トップ 10 機能
ROBERT DORIN
2007 年 3 月
411 WAVERLY OAKS ROAD, SUITE327
WALTHAM, MA 02452
781-672-0300
©2007 Winter Corporation, Waltham, MA. All rights reserved.
Winter Corporation の書面による許可なしに複製できません。
Oracle の大規模データ・ウェアハウス向けトップ 10 機能
3
WINTER CORPORATION ホワイトペーパー
エグゼクティブ・サマリー
多くの企業にとって、データ・ウェアハウスはもはや選択肢の 1 つではありません。データ・ウェア
ハウスは、競争上の優位性を維持することで生き残りを図るための必須条件となっています。かつて、
レポート作成や分析のような基本的に事後対応型の機能に限定されていたデータ・ウェアハウスは、
急速な発展を遂げ、新たな構想の推奨や実現を助ける事前対応型の予測機能を備えるまでになりまし
た。世界最大規模のデータ・ウェアハウスの急激な増大には、多くの要因が寄与しています。また、
企業のあらゆる部門でビジネス・インテリジェンス(BI)の利用が広まるにつれ、データ・ウェアハ
ウスのワークロードはその量と複雑さを増しています。こうした要因が複合し、今日のテラバイト規
模のデータ・ウェアハウスの基本インフラストラクチャを形成するプラットフォーム(ハードウェア、
データベース・ソフトウェア、アプリケーション・ソフトウェア)のテクノロジー・ベンダーが直面
する重大な課題が生まれました。
データ・ウェアハウスの戦略的意義とデータ・ウェアハウス業務の規模の拡大により、データ・ウェ
アハウス・プラットフォームの選択は企業のビジネスにおいて重要な意思決定事項となっています。
パフォーマンスとスケーラビリティが選択基準の上位を占めることは明らかですが、可用性、管理性、
ベンダー・サポート、そして当然ながらコストに関連するその他の要因も評価プロセスの一部となっ
ています。大規模データ・ウェアハウス(VLDW)の市場はオラクルをはじめとする大手データベー
ス・ベンダー全社にとって非常に重要です。オラクルはグリッド・コンピューティングへの取組みの
一環として、Oracle Database における製品開発の進歩を通じ、データ・ウェアハウス・プラットフォー
ム選択の鍵を握るスケーラビリティ面、可用性面、コスト面の多くに対処してきました。VLDW にお
けるオラクルの近年の成功は WinterCorp の調査結果にまとめられていますが、オラクルは VLDW 向け
製品を引き続き強化しています。
WinterCorp によるこのホワイトペーパーでは、VLDW 用プラットフォームの評価を行う顧客やデー
タ・ウェアハウスを実装済または実装中の顧客を対象とした WinterCorp のコンサルティング業務をも
とに、大規模データ・ウェアハウス向けの Oracle Database のトップ 10 機能について概説しています。
このコンサルティング経験に加え、WinterCorp は何百ものデータ・ウェアハウス・ユーザーに対して、
データ・ウェアハウスから享受した利点やデータ・ウェアハウスを支える基礎テクノロジーについて
の聞き取り調査を長年にわたり行ってきました。トップ 10 にあげられた機能は次のとおりです。
機能 1: パーティション化
機能 2: Real Application Clusters
機能 3: パラレル操作
機能 4: マテリアライズド・ビュー
機能 5: インテリジェントな最適化
機能 6: ビットマップ索引
機能 7: 表の圧縮
機能 8: Oracle Warehouse Builder
機能 9: オンライン分析処理
機能 10: データ・マイニング
最初の 7 つの機能は、VLDW における Oracle Database のパフォーマンス、スケーラビリティ、コスト・
パフォーマンスを強化します。後の 3 つの機能は、データ・ウェアハウス向けの統合された単一プラッ
トフォームを提供する Oracle の重要な統合コンポーネントです。これらの機能は、VLDW 市場へのオ
ラクルの取組みを反映したテクノロジーの幅広い印象的なコレクションとなっています。
©2007 Winter Corporation, Waltham, MA. All rights reserved. Winter Corporation の書面による許可なしに複製できません。
Oracle の大規模データ・ウェアハウス向けトップ 10 機能
4
WINTER CORPORATION ホワイトペーパー
目次
エグゼクティブ・サマリー................................................................................................................................. 3
目次 ........................................................................................................................................................................ 4
1
データ・ウェアハウスの業界トレンド..................................................................................................... 5
2
データ・ウェアハウス・プラットフォームの主な選択基準................................................................. 5
3
Oracle Data Warehousing のトップ 10 機能 ................................................................................................ 6
機能 1: パーティション化.......................................................................................................................... 6
機能 2: Real Application Clusters(RAC)* ............................................................................................... 7
機能 3: パラレル操作.................................................................................................................................. 9
機能 4: マテリアライズド・ビュー.......................................................................................................... 9
機能 5: インテリジェントな最適化........................................................................................................ 10
機能 6: ビットマップ索引........................................................................................................................ 10
機能 7: 表の圧縮.........................................................................................................................................11
機能 8: Oracle Warehouse Builder ...............................................................................................................11
機能 9: オンライン分析処理.................................................................................................................... 12
機能 10: データ・マイニング.................................................................................................................. 12
4
結論 .............................................................................................................................................................. 13
©2007 Winter Corporation, Waltham, MA. All rights reserved. Winter Corporation の書面による許可なしに複製できません。
Oracle の大規模データ・ウェアハウス向けトップ 10 機能
5
WINTER CORPORATION ホワイトペーパー
1 データ・ウェアハウスの業界トレンド
テラバイト規模のデータ・ウェアハウスは珍しくなくなりました。WinterCorp の調査では、最大規
模のデータ・ウェアハウスは 2001 年以来、2 年でサイズが 3 倍になるという急激な増大を続けて
いることが確認されています。データ・サイズは多くの理由で増大し続けており、次のようなトレン
ドから見てもこの増大はさらに続くと考えられます。
•
•
•
企業が迅速な対応によってマーケティング上の優位性を得ようと、ほぼリアルタイムのビジネ
スに移行した結果、データの遅延が減少した。
法規制へのコンプライアンス(バーゼル II、サーベンス・オクスリー法、グラム・リーチ・ブ
ライリー法など)のために、企業は詳細な履歴情報を収集し、保持する必要がある。
ストレージ集中型の新しいタイプの情報が新たなビジネス機会を生み出した。たとえば小売業
や製造業では、RFID テクノロジーを利用することで、より完全なサプライ・チェーン履歴情報
が得られる。
しかし、データ・ウェアハウスが増大しているのはサイズの面だけではありません。データ・ウェ
アハウスの機能が、従来のレポート作成や分析に加えて予測という高度なアプリケーションへと拡
大するにつれ、ユーザー数も増大し、アプリケーションが複数の部門間で共有、統合されることが
増えています。データ・ウェアハウスを企業内の営業部門、製造部門、財務部門、人事部門などで
共有するにとどまらず、多くの企業がデータ・ウェアハウスへの管理アクセスを顧客、取引先、仕
入先に開放しています。さらに、データ・ウェアハウスは高度なビジネス・インテリジェンス・ア
プリケーションにおける問合せの複雑化や分析の集中化に対応できるようになりました。
では、何十テラバイトものデータが格納され、複雑な分析問合せを実行する何千ものユーザーが処
理されるデータ・ウェアハウスの管理には、どのようなデータベース・エンジンが必要でしょうか。
スケール・ファクター(データ、ユーザー、複雑さ)は選択プロセスを複雑化させ、選択基準の重
要な要素となります。大規模なデータベース・プロジェクトは小規模なプロジェクトよりも格段に
困難です。それにもかかわらず、先進の企業は大規模なプロジェクトに着手し、以前は想像もでき
なったような機会を手にしています。
2 データ・ウェアハウス・プラットフォームの主な選択基準
データ・ウェアハウス・プラットフォームの選択は、早い時点でプロジェクトのリスクを低減する
大きな機会となります。データ・ウェアハウスの規模が大きい場合、パフォーマンス、スケーラビ
リティ、可用性、管理性、コストなどのリスクも増大します。ソフトウェア、ハードウェア、管理
作業といったデータ・ウェアハウスへの投資は、合計で数千万ドルに達することもあります。一般
にハードウェア・インフラストラクチャは少なくとも 2~3 年の使用を想定して選びますが、ソフ
トウェア・インフラストラクチャの切替えコストはそれを上回るのが通例です。
データ・ウェアハウス・プラットフォームを選択する際には、考慮すべき重要な基準が数多くあり
ます。WinterCorp のコンサルティング経験では、大規模データ・ウェアハウスを構築する先進の企
業に共通する最大の懸念はパフォーマンスとスケーラビリティに関するものです。パフォーマンス
とスケーラビリティの懸念は、突き詰めれば次の 2 つの疑問に要約されます。
•
•
現在合意されているパフォーマンス・サービス・レベルを満たすことができるのか。
今あるリソースの余裕は将来的になくなってしまうのか。
最初の問題は、合意済のパフォーマンス・レベルに基づいたデータのロード、定期的な更新の実行、
問合せの実行が可能かどうかということです。多くの場合、サービス・レベルは定期的な(通常は
毎日の)一連の操作(更新、問合せ、バックアップ、レポート、分析のロールアップ)を規定の時
間内に完了させなければならないと定めています。たとえば、前日の売上レポートを午前 7 時まで
に用意することと、ある種の複雑な問合せの結果を 1 分以内に得ることがサービス・レベル契約で
規定されている場合があります。
©2007 Winter Corporation, Waltham, MA. All rights reserved. Winter Corporation の書面による許可なしに複製できません。
Oracle の大規模データ・ウェアハウス向けトップ 10 機能
6
WINTER CORPORATION ホワイトペーパー
2 番目の問題は、今後 3~5 年間にわたり業務の大きな混乱を招くことなくデータ・ウェアハウス
のニーズを満たし続けることができるかという購買担当者の懸念に関するものです。許容範囲内の
コストでデータ量とワークロードの増大に対処しつつ、スループットとレスポンス時間の要件を絶
えず満たしていかなければなりません。
こうしたパフォーマンスとスケーラビリティに関する主な問題の他に、購買担当者はデータ・ウェ
アハウス・プラットフォームを選択する際に、可用性、管理性、ベンダー中心の問題(プラットフォー
ムの固定化や会社の存続可能性など)に関連した懸念も抱いています。評価全般を通じてコストの
懸念は消えませんが、エンタープライズ・データ・ウェアハウスから得られる見返りは非常に大き
いため、運用上の要件を満たすことができれば、コストは二の次になる場合もあります。
3 Oracle Data Warehousing のトップ 10 機能
ビジネス・インテリジェンスとデータ・ウェアハウスは、オラクルが長年にわたり焦点を当ててき
た重要なエンジニアリング分野ですが、その価値は高まり続けています。今やデータ・ウェアハウ
スは大規模なデータ集中型企業の情報統合戦略においてミッションクリティカルな中心的要素と
なっています。この後の各項では、Oracle の主なデータ・ウェアハウス機能について説明します。
以下のトップ 10 リストで Oracle の重要なデータ・ウェアハウス機能をすべて網羅することはでき
ません。たとえば、トランスポータブル表領域をトップ 10 の候補にあげる顧客もいるかもしれま
せんが、このリストは最も広範でより重大な影響を VLDW に与える製品機能を選ぶことを目的と
しています。
機 能 1: パ ー テ ィ シ ョ ン 化
最も重要な Oracle Data Warehousing 機能についての議論は、
必ずパーティション化から始まります。
最大規模の Oracle データ・ウェアハウス・ユーザーの 1 人はパーティション化のことをデータ・
ウェアハウス実装の「秘密の調味料」と呼んでいますが、パーティション化には秘密など何もあり
ません。パーティション化は、多くの大規模な Oracle データ・ウェアハウスで効果的なパフォー
マンスを実現するための基盤です。このトップ 10 機能のリストにあげられている他の機能は、パー
ティション化を利用して目標とする利点を達成
図 1: 単純なレンジ・パーティション化
する(パラレル操作など)か、パーティション化
の効果を拡大する(RAC や ASM など)かのいず
れかです。VLDW を配置する際には、必ずと言っ
ていいほどパーティションが重要になります。
パーティション化とは、データベース管理システ
ム(DBMS)がデータを別々のかたまりに分けて
処理を分散することにより、レスポンス時間の短
縮とスループットの改善を図る手法です。Oracle
は業界で最もバラエティに富んだ一連のパー
ティション化方式を提供しており、パーティ
ション化のメカニズムは自由に選択可能です。
•
•
レンジ・パーティショニングとリスト・パー
ティショニングは、Oracle における2つのデータ値パーティション化形式です。データを値別
にグループ化すると、パーティション・プルーニングによってパフォーマンスの大幅な向上を
実現でき、コストの高い I/O 操作が最小限に抑えられます。
バランスの取れたデータ分散パーティション化形式であるハッシュ・パーティショニングでは、
ワークロードのバランスを取ってスループットの改善を図るために、ハッシュ(ランダム化)
関数を使用してパラレル処理単位間で均一にデータを分散します。
©2007 Winter Corporation, Waltham, MA. All rights reserved. Winter Corporation の書面による許可なしに複製できません。
Oracle の大規模データ・ウェアハウス向けトップ 10 機能
7
WINTER CORPORATION ホワイトペーパー
•
コンポジット・パーティショニングは、複数のパーティション化メカニズムを組み合せたもの
です。たとえば、コンポジット・レンジ-ハッシュ・パーティショニングでは、最初に範囲でパー
ティショニングした後、各範囲をハッシュ(ランダム化)キーでさらにサブパーティショニン
グし、データをバランスよく分散します。Oracle では、他にも多くのコンポジット・パーティ
ショニング形式がサポートされています。
図 2: ハッシュ・サブパーティショニングを行った範囲(コンポジット・レンジ-ハッシュ)
顧客 ID のハッシュ
日付範囲
ハッシュ・パーティション 7
Oracle は、付加的なパフォーマンス最適化手法としてパーティション索引もサポートしています。
索引は、基礎となるデータ表と同じ方法でパーティション化する(ローカル索引)か、パーティ
ション化されているデータ表またはパーティション化されていないデータ表の異なるキーでパー
ティション化する(グローバル・パーティション索引)ことができます。
パーティション化を使用する第 1 の理由はパフォーマンスですが、パーティション化には他の利点
もあります。データを小さなかたまりに分けることで管理性が向上します。また、バックアップそ
の他のメンテナンス操作をパーティション・レベルでインクリメンタルに実行できます。パーティ
ション化により可用性も高まります。たとえば、表のパーティションの 1 つが使用できなくても、
同じ表内の他の情報へのアクセスは中断することなく継続されます。ストレージ・コスト管理の目
的で情報ライフサイクル管理(ILM)戦略を採用する顧客も、パーティション化の利点を享受でき
ます。時間ベースのパーティション化を行う場合に多いのは、頻繁に更新される(最新)データと
静的な(履歴)データを分離し、中間にさらに細かい揮発性レベルを設定する方法です。パーティ
ション化はますます ILM に組み込まれるようになっています。ホット(アクティブ・データの)
パーティションはハイ・パフォーマンスのストレージに配置され、クール(アクティブではない)
パーティションは比較的コストが低く処理の遅いディスクに、コールド(履歴)パーティションを
安価なアーカイブ・ストレージに配置されます。
パーティション化は VLDW の基本的な戦略であり、オラクルはパーティション化テクノロジーの
機能拡張を継続しています。オラクルの ILM Assistant は、ライフサイクル定義に基づいて表のパー
ティション化方法を推奨する機能を備えています。予定されている拡張の 1 つに、VLDW のパ
フォーマンスとスケーラビリティをさらに最適化するパーティション・アドバイザ機能があります。
機 能 2: R ea l A pp l ic ati o n C lu st er s( RAC) * 1
グリッド・コンピューティングは、オラクルがアプリケーション・アーキテクチャのスケールアウ
ト手法を推進する上での戦略的最優先事項です。グリッド・コンピューティングの利点は、VLDW
プラットフォームの主要目標のうち、スケーラビリティ、可用性、コストの 3 点に関係しています。
Oracle Database 10g は、エンタープライズ・グリッド・コンピューティングに特化した最初のイン
フラストラクチャ・ソフトウェアとして導入されました。サーバー・クラスタへの単一データベー
1
* ASM とグリッド
©2007 Winter Corporation, Waltham, MA. All rights reserved. Winter Corporation の書面による許可なしに複製できません。
Oracle の大規模データ・ウェアハウス向けトップ 10 機能
8
WINTER CORPORATION ホワイトペーパー
スの配置をサポートする Oracle Real Application Clusters(RAC)は、オラクルのデータベース・ア
プリケーション・グリッドのベースとなっています。RAC 自体はデータベースでもデータ・ウェ
アハウス機能でもありませんが、VLDW のプラットフォームとして Oracle を選ぶにあたっての主
な差別化要因として多くの顧客が RAC をあげています。
最近の Oracle OpenWorld ユーザー・カンファレンスで、グリッド・コンピューティングと RAC の
用途について話し合う顧客パネル・ディスカッションが開催されました。なお、RAC は Oracle の
新しい機能ではありません。2001 年 6 月に初めて Oracle9i Database に導入された機能であり、オラ
クルによると 10,000 社に上る顧客が RAC Pack に参加しています。このパネルでは、「安価なリニ
ア・スケーラビリティ」についての証言が、複数のデータ・マートやその他のサーバー(OLAP/
データ・マイニング用)を全社規模の 1 つの Oracle データ・ウェアハウスに統合した顧客の支持
を受けました。サーバーの統合は情報テクノロジー(IT)における大幅なコスト削減の源となりま
す。顧客からは、データ・マートの統合を可能にする機能として RAC の名前があがり、Oracle
Automatic Storage Manager(ASM)の利用についても、クラスタ全体のディスク・ストレージを管
理できるようになり、統合の簡素化につながるという意見が寄せられました。
クラスタ上で大規模なデータベースを稼働させている顧客のほとんどすべてが ASM を利用してい
ます。この条件に当てはまらないユーザーも ASM の利用を検討すべきです。ASM を利用すれば、
サード・パーティ製のクラスタ・ファイル・システムやボリューム・マネージャを購入する必要が
なくなり、クラスタ・ファイル・システムやボリューム・マネージャに比べて統合が容易になりま
す。RAC と同様に、ASM はデータ・ウェアハウス・アプリケーションのみを対象とした機能では
ありませんが、RAC を補完して VLDW における Oracle のスケーラビリティ、可用性(ストライプ
化とミラー化をともにサポート)、管理性を強化します。OpenWorld の RAC パネルに参加した顧客
は、ASM は非常にパフォーマンスが高く、OCFS(ASM の前身となる Oracle9i Database の機能)
から大幅に改善されていると指摘しています。ILM 戦略を実施している顧客は、ASM を利用して
複数のストレージ層を管理すれば十分な効果を得ることができます。RAC、ASM、Oracle Enterprise
Manager Grid Control はいずれも Oracle グリッド・コンピューティングの基盤となる要素です。
RAC の利点は VLDW におけるパーティション化の利点の多くに匹敵するものであり、RAC によっ
てデータ・パーティション化の機能と柔軟性がどのように強化されるかは容易に見てとれます。
データ量の増加に合せて、追加のパーティションに対応できるようにサーバーの能力を増強できま
す。あるデータ・ウェアハウス・ユーザーは、Oracle を選択した主な理由として RAC をあげまし
た。
「拡張がしやすくなりました。プラグを差し込むだけで準備完了です。」クラスタのノードの 1
つが一時的に停止している間もデータベースでは要求の処理が継続されるため、可用性が高まりま
す。管理性については、あるユーザーが統合作業を評して「クラスタを拡張した結果、レガシー・
データをデータ・ウェアハウスに統合する作業が他のソリューションよりも簡単に、かつ少ないコ
ストで行えました」と述べています。RAC クラスタ上の単一データベースで複数のアプリケー
ションが実行されることが多いため、RAC はプロビジョニングにも利用できます。たとえば、財
務を統合すると月末に必要とされるリソースが増えますが、その場合は他のアプリケーションから
処理能力をシフトできます。
RAC の重要な利点として最後にあげるのはコストの低減です。安価な市販のハードウェアをベー
スとしたスケールアウト・アーキテクチャでは、従来のスケールアップ方式の対称型マルチプロ
セッサ(SMP)アーキテクチャよりも、所有コストの面で大きな利点が得られる可能性があります。
データ・ウェアハウス・ユーザーは、安価なサーバーのクラスタが実はエンタープライズ・コン
ピューティングに求められるスケーラビリティと信頼性を実現できるということに気付きつつあ
ります。前回の WinterCorp TopTen Program(前述)では、調査の対象となった 10 種類の最大規模
のデータ・ウェアハウスのうち 2 つが、安価な市販のサーバーと Linux オペレーティング・システ
ムを利用した Oracle RAC プラットフォームで実行されていました。このような配置は、安価なデー
タ・ウェアハウス・グリッドの申し子と呼ぶことができます。
©2007 Winter Corporation, Waltham, MA. All rights reserved. Winter Corporation の書面による許可なしに複製できません。
Oracle の大規模データ・ウェアハウス向けトップ 10 機能
9
WINTER CORPORATION ホワイトペーパー
機 能 3: パ ラ レ ル 操 作
並列化はスケーラビリティを実現し、ひいては大規模なワークロードや大規模データベース、そして
言うまでもなく VLDW を可能にします。1980 年代のある時点で、ハードウェア設計者はプロセッサ
やメモリー、ディスクの高速化に主眼を置くことをやめ、大規模システムを真の大規模システムへと
転換する手段としての多重処理アーキテクチャや超並列処理(MPP)システムに目を向け始めました。
並列化なくしてシステムは拡張できません。また、パラレルに機能しなければならないのはシステム
のある一部(ハードウェアやソフトウェア)がだけではありません。ある意味では、すべての部分が
パラレルに機能する必要があります。というのも、シングル・スレッドのパスが 1 つでもあればシス
テムのスループットを妨げる可能性があり、スケーラビリティが制限されるからです。
並列化については、このホワイトペーパーで取り上げた他のいくつかの機能の中で説明しています。
パーティション化と RAC 機能の存在意義が Oracle での並列化の実現にあるのは明らかですが、効
率的な問合せ処理の鍵となるインテリジェントな最適化も、RAC、ASM、パーティション化によっ
て定義されたパラレル・リソースの最も効果的な活用を目的にしばしば利用されます。しかし、
Oracle の並列化の促進につながることの多いこうした物理設計上の選択肢の他にも、Oracle には並
列化について特筆すべき点があります。リソースを複数のコンピュータ・ノードに物理的に分散す
る必要のある MPP(シェアード・ナッシング)アーキテクチャとは異なり、Oracle の並列化は各
レベルでのリソースの分散を必要としません。
Oracle のようなシェアード・エブリシング・アーキテクチャでは、各問合せとその他のデータ操作
が、その時点で使用可能なパーティション、プロセッサ(RAC)、ストレージ(ASM)などの物理
リソース分散オプションを利用できるように解析されると、最適化と並列化が動的に実行されます。
処理単位の識別とタスクへの割当ても動的に行われます。Oracle のシェアード・エブリシング・アー
キテクチャは、データがパーティション化されているかどうかにかかわらず、データベースにおけ
るすべての操作が並列化の対象になるというパラレル・エブリシングの考え方と一致しています。
ほとんどの場合、動的並列化はシェアード・ナッシング・システムに匹敵するパフォーマンスを実
現でき、他のシステムでは不可能な並列化が Oracle では可能になるケースも数多く存在します。
問合せ間および問合せ内のパラレル処理に加え、Oracle では索引の(再)構築や中間ステージング
表の作成といった大規模オブジェクトの作成処理を並列化できます。大量の挿入、更新、削除も並
列化されます(ただし、これは VLDW 環境よりもトランザクション処理によく見られるケースで
す)。おそらく最も注目に値するのは、データのロードとバックアップ/リカバリを並列化できるこ
とです。1 日の終わりにデータのロードとバックアップができなければ、問合せのパフォーマンス
が高くても何の意味もありません。Oracle のアーキテクチャはこうした基本的なポイントをすべて
カバーしています。
機 能 4: マ テ リ ア ラ イ ズ ド ・ ビ ュ ー
複雑な問合せ処理はしばしばビジネス・インテリジェンス・アプリケーションのアキレス腱となり
ます。これは、大量のデータを分析し、複数の結合やデータ集計を含むことの多い問合せについて
特に言えることです。データベース管理者(DBA)は、結果を返さず、他の問合せのレスポンス時
間を低下させることの多いリソース集中型の問合せが与える影響を熟知しています。効果的な索引
付けやその他の最適化手法は、DBA がデータ・ウェアハウスを管理して許容できる問合せパフォー
マンスを得るためのトレードオフを提供します。マテリアライズド・ビューは、他の方法では不可
能な高度なデータ分析を大規模なデータ・セットに対して実行できるようにする強力な手法です。
ただし、DBA はビューが追加されるときの更新およびオプティマイザのオーバーヘッドを考慮す
る必要があります。他のベンダーはマテリアライズド・ビューのことをマテリアライズド問合せ表
や結合索引と呼ぶこともあります。
マテリアライズド・ビューでは、コストの高い結合や集計が問合せ実行前にあらかじめ計算されま
す。計算結果はデータベース内の独立した物理表に格納されますが、この表はユーザーに対して透
過的に管理されています。マテリアライズド・ビューを使用しなければ、必要とされる複雑なサマ
リーを生成するために大量の処理を結合と集計に割り当てなければなりません。よくあるのは、非
©2007 Winter Corporation, Waltham, MA. All rights reserved. Winter Corporation の書面による許可なしに複製できません。
Oracle の大規模データ・ウェアハウス向けトップ 10 機能
10
WINTER CORPORATION ホワイトペーパー
正規化された表を使用してパフォーマンス目標を達成したものの、複雑さが増し、データの一貫性
を損なう結果になるというケースです。マテリアライズド・ビューを使用した場合、論理設計と物
理実装は切り離され、DBA がどのマテリアライズド・ビューを作成したかをユーザーが知ってお
く必要はありません。ユーザーは論理的に設計された表やビューに対する問合せを作成するだけで
あり、物理な表の更新処理は Oracle に任せることができます。問合せは、マテリアライズド・ビュー
を使用できるように、問合せオプティマイザが必要に応じて自動的にリライトします。最も重要な
のは、各マテリアライズド・ビューのメンテナンスが Oracle で自動的に行われ、ビューの論理デー
タ・ソースが変更されるたびに物理表が更新されることです。多くの場合、マテリアライズド・
ビューはリソース集中型の問合せを強力な分析ツールに変えるために必要なパフォーマンス強化
を実現します。
機 能 5: イ ン テ リ ジ ェ ン ト な 最 適 化
Oracle データベースの主な強みの 1 つに、問合せパフォーマンスを高速化する索引付け、パーティ
ション化、その他の幅広いデータ・アクセス機能があります。これらの手法の価値は、高度な問合
せオプティマイザがなければ、著しく低下します。問合せオプティマイザとは、最適な方法を選択
して操作の順序を最適化する機能であり、データ・アクセス機能の効果的な利用に欠かせません。
最適化は科学というよりは芸術に近いものです。その手法は必ずしもアルゴリズム的ではなく、
往々にして発見的であり、最善の選択が行われるという保証もありません。データベースの問合せ
オプティマイザは長い時間をかけて進化するものであり、料理長の調理法のように、長年の経験を
もとに変更やコツが加えられた基本のレシピが存在します。Oracle のオプティマイザは 1992 年に
導入され、顧客の長年の経験を活かして Oracle のリリースのたびに強化されてきました。
オプティマイザがアクセス・パスの選択に使用する構造や手法はあまりに数が多く、ここに列挙す
ることはできません。Oracle のオプティマイザはコストベースのオプティマイザです。つまり、1
つの問合せに対して複数の実行計画が生成され、各計画の予想コストが計算されて、予想コストの
最も低い計画が選択されます。さらに、使用可能な CPU リソースやメモリー・リソースの制約を
考慮した調整など、実行に先立って計画することのできない動的なランタイム最適化も実行されま
す。Oracle における問合せ処理機能の多彩さと SQL 構文のバリエーションや複雑さを考えれば、
インテリジェントな最適化の機能は VLDW アプリケーションに不可欠です。Oracle のオプティマ
イザは業界のどのオプティマイザにも引けを取りません。また、最適化の継続的強化が必要な領域
を見出す経験においても他に類を見ません。
機 能 6: ビ ッ ト マ ッ プ 索 引
ビットマップ索引は、Oracle が培った包括的な索引付け手法の重要な機能であり、ある種の VLDW
問合せ処理ではきわめて強力です。たとえば、STATE=CA のビットマップ 01010001000101000001...
はレコード ID 1,3,7,11,13,19,...に指定の値があることを示します。
(ビットマップは、レコード 0 を
表すビット 0 で始まります。)ビットマップは、カーディナリティの低い列(人事データベースや
顧客データベースの性別、未婚/既婚の別、州など)で特に有効です。しかし、実際にはそれより
も多少複雑です。カーディナリティの低い単一列の値を検索する問合せでは、表のすべてのブロッ
クにアクセスする可能性が高いため、全表スキャンの方が効率はよくなります。しかし、ブール操
作(AND、OR、NOT)を複数のビットマップに対して実行する場合は、実際にアクセスするデー
タ・ブロックの数が比較的少なければ、検索のパフォーマンスは大幅に向上します。同様に、ブー
ルに一致する行数の生成も、ビットマップを使用すれば実際のデータ・アクセスが不要になるため、
きわめて効率的です。
ビットマップ索引を使用すると、従来の B*ツリー索引を使用する場合に比べ、多くの問合せで 10
倍以上のパフォーマンス向上が見られます。この優位性は、ビットマップ索引を圧縮するとさらに
拡大します。ビットマップ索引で得られる節約効果はデータベース設計の選択の影響を受けます。
また、特定の問合せで使用するビットマップ索引および B*ツリー索引を選ぶ際には、Oracle の問
合せオプティマイザの役割が重要になります。ビットマップの短所は更新の影響に関係しています。
挿入や削除を行うと、関連するすべての索引が更新されます。大規模なバッチ更新を行う際には、
©2007 Winter Corporation, Waltham, MA. All rights reserved. Winter Corporation の書面による許可なしに複製できません。
Oracle の大規模データ・ウェアハウス向けトップ 10 機能
11
WINTER CORPORATION ホワイトペーパー
バッチ実行前にビットマップ索引を削除して、実行後に再構築したほうがよい場合もあります。
ビットマップ索引は、非常に大きな表に対するマルチキー問合せ、つまり揮発性でない表データに
最も適しています。そして、これはまさに多くのデータ・ウェアハウス・ワークロードの特徴でも
あります。トランザクション・データベースではビットマップがしばしば興味深いトレードオフを
示すのに対し、トランザクション処理によくある更新の影響を受けないビジネス・インテリジェン
ス・アプリケーションではビットマップは重要なパフォーマンス最適化機能となります。
機 能 7: 表 の 圧 縮
前述のように、データ・ウェアハウスのサイズは業界全体に見られるいくつかのトレンド(セク
ション 1 を参照)を反映して急激に増大しています。ディスク領域節約のためのデータ圧縮は、必
要なストレージ容量の減少による明らかなコスト削減以外の理由でも魅力的な選択肢となります。
これまではデータ圧縮を行うと問合せパフォーマンスの低下が避けられませんでしたが、Oracle の
表圧縮機能を使用すれば、問合せのパフォーマンスに悪影響を与えることなく、重複したデータ値
を排除できます。事実、I/O に制約のある環境で圧縮された表に対して問合せを行う場合、圧縮さ
れていない表に対する問合せよりもアクセスするデータベース・ブロックの数が少なくなり、問合
せのパフォーマンスが著しく向上します。バックアップやリカバリなど、表全体の移動を必要とす
る操作のスピードも大幅な向上を示します。
圧縮の効果は表によって異なりますが、Oracle での圧縮率は 2:1 や 4:1、あるいはそれ以上になる
ことも珍しくありません。たとえば、オラクルはある大手テレコム企業の表の圧縮率を 12:1 であ
るとしています。同様に、圧縮が問合せパフォーマンスに与える効果も様々です。一般に、圧縮さ
れた表に対する物理的、論理的 I/O 操作が少なければ、結果セットの圧縮解除に必要な追加処理を
補ってあまりあるパフォーマンス上の利点を得ることができます。ただし、バルク・データ・ロー
ド操作では圧縮のオーバーヘッドは無視できません。バルク・データ・ロードは通常、圧縮によっ
て所要時間が増加する場合でも効果的にスケジュールできます。たとえば、ローリング・ウィンド
ウ方式でパーティション化された表は、表の総ワークロードに大きな影響を与えることなくバル
ク・ロード可能です。データの更新や挿入の頻度が高い場合はパフォーマンスへの影響がさらに増
えるため、データ圧縮が最も威力を発揮するのは大規模な読取り専用の表に対してです。更新デー
タや挿入データを圧縮する際のパフォーマンス・オーバーヘッドは、Oracle Database の今後の機能
強化で対処される予定です。
表の圧縮をデータ・ウェアハウス全体で一律に適用することはできないものの、データ・ウェアハ
ウスの消費ストレージ容量がますます増加し、何十テラバイトにも達する中で、圧縮は VLDW に
欠かせない重要な機能となりました。使用する際には慎重を期す必要がありますが、多くのウェア
ハウス・ユーザーにとって、圧縮はもはや「あれば便利な」機能ではなく、データ・ウェアハウス・
プラットフォームに必須の機能です。
機 能 8: O ra c le Wa reh ou se B u i ld er
多くの企業は複数の異なるデータベースを所有しており、その中にはレガシー・システム上で稼働
しているものもあります。こうしたシステムは情報を共有できないばかりか、データの形式や品質
に一貫性がないこともしばしばです。企業のビジネス・インテリジェンス目標を達成するためには、
この生データのすべてをデータ・ウェアハウス用に最適化された高品質の情報に変換する必要があ
ります。このデータ品質の問題が非常に面倒に思われるために、多くの企業は第一歩が踏み出せま
せん。包括的なデータ/メタデータ管理ツールである Oracle Warehouse Builder(OWB)は、エンター
プライズ・データ・ウェアハウスの実装とメンテナンスに必要な設計機能、ETL 機能、管理機能を
備えています。
©2007 Winter Corporation, Waltham, MA. All rights reserved. Winter Corporation の書面による許可なしに複製できません。
Oracle の大規模データ・ウェアハウス向けトップ 10 機能
12
WINTER CORPORATION ホワイトペーパー
エンタープライズ ETL は、構成やデータ環境、他システムへの接続が多岐にわたることから、きわ
めて複雑です。OWB の設計機能は、表、ディメンション、キューブ、ビュー、マテリアライズド・
ビューなど、ウェアハウスのあらゆるデータベース・オブジェクトをカバーします。OWB の ETL 機
能を使用すれば、複数のデータ・ソースからリレーショナル表や OLAP キューブに 1 回の自動処理
でデータを移入できます。OWB のメタデータ・サービスでデータの構造と依存性を管理し、ウェア
ハウスに不可欠なデータ品質オプションでデータのプロファイルを設定します。これにより、ビジネ
ス・ルールの識別、ルール逸脱の検出、修正と監査の実行が可能になります。さらに、OWB では SAP
や Oracle E-Business Suite などの各種データ・ソースから情報を容易にロードできます。
サード・パーティ製の他のツールにもこうした機能を実行するものは数多くありますが、多くの顧
客にとって、OWB はデータベース内のあらゆるデータおよびメタデータの管理を 1 つの環境で行
えるという大きな利点を有しています。OWB では、データのロードと問合せを同時に実行でき、
ソース・システムとターゲット・システムの間の遅延も低減されます。これは、データのクレンジン
グおよびロード用の環境が 1 つであるためです。Oracle の OLAP 機能やデータ・マイニング機能(こ
の後のセクションを参照)と同様に、OWB の圧縮機能はデータベースに完全に統合されます。
機 能 9: O LA P
あらゆる機会をとらえて競争上の優位性を獲得しようと各社が模索する中で、企業におけるビジネ
ス・インテリジェンスの利用は拡大を続けています。ビジネスの可視性を高める、つまり現在起こっ
ていることとその理由、そして今後何が起こるかを理解するために、ビジネス分析が導入されてい
ます。計画立案、予算編成、予測、販売、マーケティングなどのあらゆる部門が、既存のデータベー
スから抽出可能なナレッジの活用を望んでいます。
オラクルは、主要なスタンドアロン多次元データベースに匹敵する機能を備えた、完全に機能する
オンライン分析処理(OLAP)プラットフォームを提供しています。オラクルは、キューブ・テク
ノロジーの拡張とともにパフォーマンスの大幅な最適化によって OLAP 製品の強化と改善を続け
ていますが、多くの顧客にとって、あらゆる問合せ処理を 1 つのデータベース・プラットフォーム
で行えるという利点がそれ自体で Oracle の大きな差別化要因となっています。リレーショナル・
データ型と多次元データ型がともに同じ Oracle データベースに格納され、スタンドアロンの独自
OLAP サーバーのようにレプリケート・データやレプリケート・メタデータ、様々なスタイルのツー
ルなどが必要になることはありません。SQL 問合せと OLAP API 問合せのどちらも 1 つのデータ・
ストアに送られます。異なる環境間でデータを移動する必要がないため、BI ユーザーはデータ遅
延の減少による最新データへの高速アクセスという利点を享受でき、IT はコストと複雑さの低減
という利点を享受できます。
機 能 10: デ ー タ ・ マ イ ニ ン グ
OLAP と同様に、データ・マイニングにおいても履歴データの利用による戦略的優位性の獲得が模
索されています。しかし、OLAP アナリストが求めるのは「最も売上の高い地域に関する情報」な
どであることが多いのに対し、データ・マイニングの目的は大量のデータを取捨選択して隠れたパ
ターンを見つけることです。このようなパターンから、顧客の引き寄せとつなぎ止め、顧客および
仕入先との関係強化、新たな販売機会の特定、潜在的不正行為の特定などに必要な洞察を導くこと
ができます。その結果、顧客は統合ビジネス・インテリジェンス・ソリューションの価値を拡大す
る予測を立てることができます。データ・マイニングは、金融サービスやデータベース・マーケ
ティング、テレコム、規制、小売などの業界で成功裏に利用されているだけでなく、ライフ・サイ
エンスや医療業界の研究者も新たな対象への新たな薬剤や治療法の特定、そして臨床結果の向上に
役立てています。
Oracle Data Mining ソリューションの利点は、Oracle OLAP の利点に似ています。BI ユーザーの管
理する統合データベース・プラットフォームには「可動部分」が少なく、大規模なデータ・セット
を外部プログラムに移動する必要もありません。オラクルはあらゆるビジネス・データを格納、分
©2007 Winter Corporation, Waltham, MA. All rights reserved. Winter Corporation の書面による許可なしに複製できません。
Oracle の大規模データ・ウェアハウス向けトップ 10 機能
13
WINTER CORPORATION ホワイトペーパー
析、管理するための単一の場所を提供し、コストと複雑さの低減を実現しています。オラクルは他
の主要データ・マイニング・ソリューションとの競合に負けない優位性を維持すべく、新たなアル
ゴリズムや改良されたユーザー・インタフェースでデータ・マイニング機能の拡張を続けています
が、他の手法をしのぐ Oracle Data Mining の最大の利点は依然としてデータベースとの全面的な統
合です。データ・ウェアハウス、OLAP、データ・マイニングを 1 つの BI プラットフォームでサポー
トでき、レプリケーションや重複は発生しません。
4 結論
ビジネス・インテリジェンスとデータ・ウェアハウスの戦略的重要性はかつてないほどに高まって
います。CIO が IT に突きつける要求もこれまでに増して厳しいものとなっています。だからこそ、
データ・ウェアハウスの実装に成功した企業はかつてないほどの見返りを得ることができるのです。
オラクルはその BI 製品と VLDW 製品において著しい進歩を遂げてきました。現在もその進歩は続
いています。このホワイトペーパーで説明した Oracle データベースの 10 機能についての所見を簡
単にまとめると次のようになります。
•
•
•
•
•
パフォーマンスとスケーラビリティが鍵を握る。
並列化はスケーラビリティの基盤である。
グリッド・コンピューティング構想は可用性、管理性、コストに関する懸念を払拭する。
索引機能は Oracle の強みである。
統合された単一のプラットフォームから得られる利点がある。
Oracle データベースは VLDW 向けの非常に包括的なソリューションです。最も広く利用されてい
る VLDW プラットフォームである Oracle データベースは、複数のオペレーティング・システムを
サポートし、幅広い統合機能を備えています。このホワイトペーパーで説明した機能に加えて、最
高のコスト・パフォーマンスとスケーラビリティおよび可用性を実現するためのグリッド・コン
ピューティングへの取組み、そして VLDW 機能のたゆみない強化により、Oracle はデータ・ウェ
アハウスのあらゆる最終選考リストに名を連ねることでしょう。
©2007 Winter Corporation, Waltham, MA. All rights reserved. Winter Corporation の書面による許可なしに複製できません。
WinterCorp は、テラバイト規模、ペタバイト規模のデータ管理システムの
ライフサイクル全般におけるパフォーマンスとスケーラビリティを
専門とする独立系コンサルティング会社です。
弊社は 1992 年の創業以来、今日稼働している世界最大規模で
最も要件が厳しいデータベースの多くを設計してきました。
弊社のコンサルティング・サービスは、ビジネスに不可欠なデータベース・
ソリューションの定義、プラットフォームの選択、実装の設計、
成長の管理を支援して、ビジネス価値を最大限に高めます。
弊社は、大規模データベース実装における長年の経験とデータベース製品の
詳細な知識をもとに、成功を実現するパフォーマンスとテクノロジーの
妨げとなる問題に関して、比類のない洞察を提供します。
411 WAVERLY OAKS ROAD, SUITE327
WALTHAM, MA 02452
781-672-0300
www.wintercorp.com をご覧ください
©2007 Winter Corporation, Waltham, MA. All rights reserved.
Winter Corporation の書面による許可なしに複製できません。
Fly UP