...

重複排除ソリューションはすべて同じではない: Data

by user

on
Category: Documents
14

views

Report

Comments

Transcript

重複排除ソリューションはすべて同じではない: Data
Data Domain シリーズを選択する理由
すべての重複排除ソリューションが
同じではない。
Data Domain を選択する理由
Data Domain のビジネス バリュー
このホワイト ペーパーを読むメリット
•
•
•
•
•
•
•
•
•
•
バックアップの高速化(最大 31 TB/時を実現 - 最も近い競合製品よりも 3 倍高速)
バックアップのコストの削減(テープ インフラストラクチャの電源、冷却装置、テープ メデ
ィア、バックアップ アプリケーションのライセンス コストの削減または排除)
災害復旧対応の向上(テープベースの DR を帯域幅効率に優れたレプリケーションに置き換え、
DR テストの合理化によりパフォーマンスと信頼性を向上)
データの復旧可能性の確保(データ非脆弱性アーキテクチャは業界で最も優れたデータの整
合性の保護であり、最終手段としてのストレージにとって重要)
バックアップ/リカバリ業務の合理化(テープ カートリッジの排除と、最大 2 PB の有効容量
まで拡張するシステムにより、管理するストレージ デバイス数を削減)
バックアップおよびリカバリのリスクの低減(保存データおよび転送データの暗号化オプシ
ョンにより、物理テープを使用したバックアップでのセキュリティのリスクを排除)
貴重なフロア面積の節約(わずかフロア タイル 2 枚分の設置面積で 28.5 PB の論理バックアッ
プを保護)
バックアップおよびリカバリのサービス レベルの向上(パフォーマンスおよび信頼性の向上
により、成功率を最大化)
柔軟性の向上(バックアップおよびアーカイブ データを統合し、時間とともに変化する要件
に簡単に適応)
購入の意思決定の合理化(長年にわたり技術革新とリーダーシップを実証している明確な市
場のリーダーを選択することで、購入の意思決定に確信が持てる)
2014 年 4 月
Copyright © 2014 EMC Corporation. All Rights Reserved.
(不許複製・禁無断転載)
EMC Corporation は、この資料に記載される情報が、発行日時点
で正確であるとみなしています。この情報は通知なく変更され
ることがあります。
本文書に記載される情報は、「現状有姿」の条件で提供されて
います。EMC Corporation は、この資料に記載される情報に関す
る、どのような内容についても表明保証条項を設けず、特に、
商品性や特定の目的に対する適応性に対する黙示の保証はいた
しません。
本文書に記載される、いかなる EMC ソフトウェアの使用、複製、
頒布も、当該ソフトウェア ライセンスが必要です。
最新の EMC 製品名については、EMC の Web サイトで EMC
Corporation の商標を参照してください。
パーツ番号 H11534-J
Data Domain のビジネス バリュー
2
目次
エグゼクティブ サマリー .................................................................................................. 4
重複排除システムはすべて同じではありません ................................................................... 4
どこにでもあるソリューションか、一段上のソリューションか ...................................... 4
リーダー対追随者............................................................................................................... 4
はじめに ................................................................................................................................. 4
対象読者 ................................................................................................................................. 4
Data Domain を選択する理由。テクノロジーの差別化とリーダーシップ ....................... 5
Data Domain データ非脆弱性アーキテクチャ ........................................................................ 5
データ非脆弱性アーキテクチャのメリット ...................................................................... 6
Data Domain SISLTM(Stream Informed Segment Layout) ....................................................... 6
SISL のメリット .................................................................................................................. 6
EMC Data Domain BoostTM ソフトウェア ................................................................................. 6
Data Domain Boost のメリット ........................................................................................... 7
可変長の区分化 ...................................................................................................................... 8
可変長の区分化のメリット ................................................................................................ 8
インライン重複排除対ポスト プロセス重複排除................................................................... 9
Data Domain インライン重複排除のメリット .................................................................... 9
極めて高い拡張性 ................................................................................................................... 9
Data Domain の拡張性のメリット ...................................................................................... 9
災害復旧のための Data Domain ............................................................................................ 10
災害復旧における Data Domain のメリット ..................................................................... 10
安全なマルチ テナンシー ..................................................................................................... 11
安全なマルチ テナンシーのメリット............................................................................... 11
Oracle 向けに最適化された重複排除機能............................................................................. 11
Oracle 向けに最適化された重複排除機能のメリット ...................................................... 12
柔軟性 ................................................................................................................................... 12
Data Domain システムの柔軟性によるメリット .............................................................. 12
バックアップとアーカイブ用の統合プラットフォーム....................................................... 13
統合プラットフォームとしての Data Domain のメリット ............................................... 13
強化されたセキュリティ ...................................................................................................... 14
Data Domain の強化されたセキュリティのメリット ....................................................... 14
DD Boost ソリューションの統合 ..................................................................................... 14
結論 .................................................................................................................................. 16
Data Domain のビジネス バリュー
3
エグゼクティブ サマリー
重複排除システムはすべて同じではありません
すべての重複排除システムは同様に作られているという誤解があるため、現在、多く
の組織が、購買の意思決定を行う前に調査を行っています。重複排除ストレージ ソリ
ューションを調査する際には、確認すべきいくつかの重要なポイントがあります。こ
のホワイト ペーパーでは、その点について説明します。独自の地位を築いている Data
Domain は、これらの重要な機能により、極めて大きなビジネス バリューを提供します。
どこにでもあるソリューションか、一段上のソリューションか
すべての重複排除ソリューションは、ストレージとネットワークの要件を緩和できま
す。ただし、効率化と高速化の手法や、実際に重要なデータが信頼性の高い方法でリ
カバリできるどうかについては、大きな違いがあります。「一段上」のソリューショ
ンとは、単に重複排除ストレージがもたらす節約に焦点を当てるだけでなく、
お客様が必要とする規模、パフォーマンス、効率的なレプリケーションも提供し、
何よりもデータの整合性を保護することを最優先にするソリューションです。
リーダー対追随者
EMC は、専用バックアップ アプライアンス
市場をリードし続けており、全体の市場占
有率は 64.9%です。IDC によると、その市
場占有率は、最も近い競合企業の 6 倍を超
えています。現在 44,000 を超える Data
Domain システムが導入されており、Data
Domain テクノロジーを知れば知るほど、
お客様は導入を希望するようになると、
EMC は確信しています。
はじめに
このホワイト ペーパーでは、Data Domain テクノロジーのリーダーシップと差別化、
さらにそのことがお客様にとって重要な理由について焦点を当てて説明します。この
ホワイト ペーパーは、Data Domain システムがお客様の環境でのバックアップおよび
アーカイブにとって理想的である理由を、技術面と財務面から詳しく説明することを
目的としています。
対象読者
このホワイト ペーパーは、EMC のお客様、EMC セールス、EMC システム エンジニア、
EMC パートナー、さらには Data Domain システムの差別化テクノロジーとそれがバッ
クアップおよびアーカイブ データにもたらす独自の利点すべてについての詳細に興
味がある方々を対象としています。
Data Domain のビジネス バリュー
4
Data Domain を選択する理由。テクノロジーの差別化とリーダー
シップ
Data Domain データ非脆弱性アーキテクチャ
バックアップとアーカイブ データは最終手段としてのストレージであるため、これ
らを保護するプラットフォームでは、データの整合性の確保を最優先の課題とすべき
です。こうしたプラットフォームからデータをリカバリする際、多くの場合、そのプ
ラットフォームだけにデータが存在します。バックアップ/アーカイブ ソリューショ
ンを検討する場合、本当に必要なときにデータをリカバリすることができなければ、
他の特長や機能は何も意味がありません。1 つの保護メカニズムではあらゆる消失形
態からデータを保護することはできません。データ非脆弱性アーキテクチャには、次
のような 4 種類の保護メカニズムが含まれ、その連係によって、データの整合性とリ
カバリの問題に対して業界で最も優れた防御策を提供します。
•
エンド ツー エンドの検証。保存しているデータが正しいかどうかを確認する
最も良い方法は、データが書き込まれた後でデータを確認し、そのデータと
送信されたデータのチェックサムを比較することです。このことはバックア
ップの実行中インラインで行われるため、バックアップ ジョブを再開せずに、
検出されたエラーをすべて即座に修正できます。
•
障害回避と抑制。データが破損する最も一般的な状況の 1 つとして、データ
に新しいデータが追加されるときに、以前のデータを上書きする場合がある
ことが挙げられます。Data Domain システムは、新しいデータを既存のデータ
に追加しないため、このような可能性が発生することはありません。システ
ムには、NVRAM も搭載されているため、すべてのデータがディスクに書き込
まれる前に電源障害が発生した場合、データ消失から保護します。
•
障害検出と修復。いったん正しくデータを保存したら、そのデータが正常な
状態を保っていることをどのように確認すればよいでしょうか。時間が経過
するにつれて、ビットが反転したり、または読み取り不能となったりして、
ディスク ドライブが故障する可能性があります。どの Data Domain システム
でも、継続的なバックグラウンド処理により即座にエラーを自動的に検出、
修正し、問題になることを防ぎます。さらに、RAID 6 により、二重ドライブ
障害やドライブ故障時に誤ったディスクを取り外してしまうことから保護さ
れます。Data Domain システムでは、どのシェルフにもグローバル ホット ス
ペア ドライブを搭載しています。これらのホット スペア ドライブにより、自
動的に故障したドライブが置き換えられ、故障したドライブを交換するため
のサポート コールから EMC に依頼されます。
•
ファイル システムの復旧可能性。前述の保護がすべて備わっている場合でも、
重大な障害が発生する可能性は常にあります。多くの重複排除システムでは、
このようなタイプの障害は、部分的データ消失またはすべてのデータの消失
につながり、復旧に 1 週間以上かかる場合もあります。データの整合性を最
重要課題として設計された Data Domain システムでは、自己記述形式のメタ
データを使用しているため、このような最悪ケースのシナリオでも、24 時間
未満で完全にシステムを再構築できます。
Data Domain のビジネス バリュー
5
データ非脆弱性アーキテクチャのメリット
データ非脆弱性アーキテクチャにより、信頼性の高い方法で重要なデータをリカバリ
し、データが厳密に期待どおりの状態になることを確信できます。データの整合性に
これほど注意を払っているベンダーは EMC 以外にありません。Data Domain システム
により、送信済みデータに保存されたデータが確認されるため、データが正しく保存
されていることが保証されます。また、このシステムでは旧データに新しいデータを
追加することは絶対に避けるという既存データの廃棄予防措置を取っているため、デ
ータが上書きされることは絶対にありません。Data Domain システムでは、バックグ
ラウンドのデータ スクラビングと即座のエラー訂正により、電源障害、二重ディス
ク ドライブ障害、ビットの反転によるデータ消失に対する保護も行い、常にデータ
をリカバリ可能で正常な状態に保ちます。最後の特長として、ほとんどのベンダーと
違い、Data Domain システムは自己記述形式のメタデータを活用するという点が挙げ
られます。そのため、システムは妥当なタイム フレームでゼロから再構築可能であ
り、お客様はできるだけ早期に稼働状態に戻ることができます。このように、データ
の整合性の確保にコミットメントを示しているため、お客様は、Data Domain システ
ムを信頼してご使用頂き、他のどのベンダーよりも優れたデータ保護を実現できます。
Data Domain SISLTM(Stream Informed Segment Layout)
Data Domain の業界をリードするパフォーマンスの基盤は、SISL(Stream Informed
Segment Layout)拡張アーキテクチャです。SISL により、Data Domain システムは、
重複排除プロセスの 99%を CPU と RAM で実行することが可能となり、CIFS および
NFS のような非効率なプロトコルでも優れたパフォーマンスを実現します。SISL によ
り、Data Domain システムはパフォーマンスを向上させるためにディスクの数を増や
す必要がないので、他の重複排除プラットフォームとは違ってスピンドルに依存しま
せん。これが、Data Domain システムが、Intel プロセッサの各世代で継続してパフォ
ーマンスを劇的に向上させる理由です。Intel プロセッサが高速になるほど、Data
Domain も高速になります。
SISL のメリット
SISL には 2 つの重要なメリットがあります。それは、バックアップの高速化と投資保
護です。最も重要な点は、Data Domain システムが業界最高速であるため、データの
急増に直面した場合にも厳しいバックアップ ウィンドウに対応できるということで
す。次に重要なのは、Data Domain システムのパフォーマンスが、ムーアの法則に従
って Intel プロセッサのパフォーマンスとともに向上するという点です。つまり、新
しい Data Domain システムには今後開発される CPU が搭載されるため、Data Domain
システムの速度と拡張性は将来も大幅な向上を実現し続けるということです。新しい
テクノロジーが導入されると、多くの EMC システムでは、すべてのバックアップ デ
ータをイン プレースに維持したまま、コントローラーを次世代モデルにリプレース
することができます。この投資保護によって、システムの運用を中断することなくバ
ックアップのパフォーマンスと拡張性を大幅に向上させることが可能になります。
EMC Data Domain BoostTM ソフトウェア
EMC Data Domain Boost ソフトウェアを使用すると、重複排除プロセスの一部をバッ
クアップ サーバーまたはアプリケーション クライアントに分散して、Data Domain シ
ステムの能力を一意のデータの特定と新しいデータのディスクへの書き込みに集中さ
Data Domain のビジネス バリュー
6
せることができます。DD Boost では、一意のデータのみをバックアップ サーバーま
たはクライアントから Data Domain システムに送信する必要があります。また、DD
Boost は、レプリケーションに対する制御をバックアップ アプリケーションに渡しま
す。バックアップ組織の規模が大きいほど、このような分散は重要になってきます。
たとえば、5 台以上のバックアップ サーバーが存在するバックアップ組織では、5 台
のバックアップ サーバー リソースを用意し、それぞれが DD Boost を使用した重複排
除作業の一部を行うことができます。DD Boost を使用しない場合は、重複排除作業全
体が Data Domain システムにより実行され、すべてのデータをクライアントから
Data Domain システムに送信する必要があります。一部のバックアップ アプリケーシ
ョンでは、重複排除をクライアントにまで分散することができます。そのような場合、
分散によるメリットは 5(バックアップ サーバーの台数)対 1 ではなく、数百または
数千(クライアントの数)対 1 となる可能性があります。
Data Domain Boost のメリット
DD Boost は、既存のバックアップ サーバーとインフラストラクチャを変更しないで、
バックアップを 50%高速化します。まったく同じハードウェアを使用して、バック
アップを高速化できるので、これはとても素晴らしいことです。DD990 コントローラ
ー1 台だけで、最も近い競合製品の 3 倍高速なパフォーマンスを発揮し、最大 31 TB/
時というバックアップ速度を達成します。
DD Boost では、一意のデータのみをバックアップ サーバーまたはクライアントから
Data Domain システムに送信する必要があります。つまり、フル バックアップの場合
でも、ネットワーク上を移動する必要があるデータは最大 99%削減され、既存のリ
ソースをより効率的に使用できます。クライアントで DD Boost を活用できるアプリ
ケーション(EMC NetWorkerTM、EMC AvamarTM、Oracle RMAN、Dell NetVault)の場合、
このような帯域幅の削減を、クライアントから Data Domain システムに至るまで、バ
ックアップ パス全体にわたって行うことができます。
図 1: DD Boost による使用帯域幅の最小化の方法
Data Domain のビジネス バリュー
7
パフォーマンスの向上以外にも、重複排除プロセスの分散には直観的にわかりづらい
もう 1 つの利点があります。特に、バックアップ サーバーまたはクライアントが重
複排除プロセスの一部を実行している場合でも、DD Boost はバックアップ サーバー
またはクライアントによる CPU の利用率を実際に削減します。この結果、こうした
重複排除プロセスの一部を実行するために必要な CPU サイクルは、実際にはネット
ワーク上でフル バックアップをプッシュ配信する場合よりも少なくなります。これ
はとても優れた機能です。DD Boost では、バックアップの実行が高速化され、使用す
る帯域幅が少なくなり、バックアップ サーバーまたはクライアントのワークロード
を削減します。これは素晴らしいことです。しかし、これだけではありません。
DD Boost を使用すると、何千もの物理テープ カートリッジや仮想テープ カートリッ
ジを管理する必要もなくなり、日々の運用と災害復旧業務を大幅に簡素化し、テープ
カートリッジの取り扱いと管理に関する時間、労力、コストを大幅に削減します。
重複排除を使用しても、レプリケーションの管理は難しくなったり、DR テストが煩
雑になったりする場合があります。DD Boost と管理されたファイル レプリケーショ
ンを使用すると、Data Domain レプリケーションに対するバックアップ アプリケーシ
ョンの可視性と制御を実現することで、この状況を変えることができます。このこと
により、バックアップ アプリケーションは、すべてのローカル コピーと他のサイト
に送信されたコピーをカタログで完全に認識し、災害復旧の可能性に対する信頼を高
めます。
最後に、DD Boost は、すべての利用可能なパスに対して、バックアップ ワークロー
ドの自動ロード バランシングも可能にし、パフォーマンスと効率性を最大限に高め
ます。さらに、DD Boost は、自動パス フェイルオーバーにより、バックアップの信
頼性を高め、マウント ポイントを管理する必要性をなくします。これにより、パス
を失った場合にもバックアップを継続して確実に実行でき、その結果、バックアップ
完了の成功率が高まり、失敗したバックアップ ジョブの再実行に費やす労力を削減
できます。
可変長の区分化
Data Domain システムでは、可変長の区分化を使用して、データ ストリームを分割し、
重複排除率を最適化します。具体的には、Data Domain システムは、データを取り込
むときに、データのそのままの構造に基づいて、インテリジェントにストリームを分
割します。次に、システムは、各セグメントが一意であるかどうかを判断してから、
各セグメントを圧縮し、保存します。このようにすることで、通常、システムは、以
前検出した同じ論理セグメントのブレークポイントを検出します、結果として、より
多くの重複セグメントが識別され、重複排除率が向上します。これに対して、固定長
の重複排除を使用しているベンダーでは、事前に決定されたサイズに基づいて区分化
を行うため、重複セグメントを検出する可能性が低くなります。ベンダーによっては、
お客様を惑わそうとして、この機能を「可変」と呼んでいる場合さえありますが、実
際には、用意された「固定」長の値から、使用する値を選択する必要があります。
可変長の区分化のメリット
実環境の同じデータ セットで比較すると、可変長の重複排除のほうが、常に高い重
複排除率を達成します。このことが持つ意味は、どんなに強調しても、強調しすぎる
ことはありません。可変長の区分化とは、高い重複排除率と同じことであり、データ
を保護するために必要なストレージは少なくて済みます。さらに、これにより、単一
Data Domain のビジネス バリュー
8
のプール内でより効果的な拡張性も実現できるため、管理するデバイスの数が少なく
なります。最後に、可変長の重複排除が実現する高い重複排除率により、レプリケー
ションするデータが少なくなります。したがって、必要な WAN の帯域幅と DR サイト
のストレージが削減されます。このことはすべて、複雑性とコストの大幅な低減につ
ながります。
インライン重複排除対ポスト プロセス重複排除
Data Domain システムは、バックアップ ストリームを受信すると、インラインで重複
排除を実行し、ディスクに一意の要素のみを保存します。ポスト プロセス重複排除
のように、最初にデータをディスクに保存してから、別のプロセスとして後でデータ
の重複排除を行う必要はありません。
Data Domain インライン重複排除のメリット
インライン重複排除とは、Data Domain システムが、後で重複排除を行うためのバッ
クアップ データの一時保存先として、追加のストレージ容量を用意する必要がない
ことを意味します。このことにより、ストレージ容量、コスト、データセンターでの
設置面積を削減できます。何といっても、ストレージの設置面積の削減は、重複排除
を行う主な理由の 1 つです。
極めて高い拡張性
Data Domain システムは、単一システムのアクティブ階層の有効容量を最大 570 TB ま
で拡張可能な極めて高い拡張性を備えており、フロア タイルわずか 2 枚の設置面積
に収まり、最大 10 億個のファイルに対応します。このシステムでは、最大 28.5 PB
の論理バックアップ データをすべて単一の重複排除プールで保護することができま
す。システムのアクティブ階層は、2~3 台のディスクからなる最小構成から、24 台
までのシェルフからなる最大構成にまで拡張できます。Data Domain システムは、シ
ステムの実行中に追加のシェルフをオンラインで追加するだけで、運用を停止するこ
となくシームレスに拡張できます。モデルによっては、ストレージの第 2 階層を長期
バックアップ保管のために追加することができます。これにより、さらに拡張性が高
まり、単一のシステムで最大 2 PB の合計有効容量を構成する、または、合計 56 台ま
でのシェルフを使用して、合計で最大 100 PB の論理ストレージ容量を構成できます。
Data Domain の拡張性のメリット
極めて高い拡張性により、単一の重複排除プール内により多くのデータを保存できる
ため、管理するデバイスの数と必要なインフラストラクチャを削減し、高い重複排除
率を達成できます。他のベンダーが実現する拡張性は低く、多くのシステムの導入が
必要となる場合があります。つまり、複数の重複排除プールが必要となって複雑性が
増し、結果として全体的な重複排除の効率性が低下します。Data Domain システムで
は、システムの実行中にシェルフを追加できるため、システムを停止することなく規
模を拡張できます。このような極めて高い拡張性により、Data Domain システムはバ
ックアップとアーカイブ データを効率的に統合するために必要な容量を用意できま
す。拡張された保存オプションを使用すれば、この目的で物理テープを使用すること
で発生する問題、リスク、費用を排除することもできます。
Data Domain のビジネス バリュー
9
災害復旧のための Data Domain
テープベースの災害復旧では、多くのリスクとリカバリに伴う危険が潜んでいます。
たとえば、テープ メディアの破損、テープ メディアの紛失、テープ ドライブのハー
ドウェアの故障、テープ ストレージのリカバリの遅延などがあります。また、リカ
バリ サイトで利用できるテープ ドライブの数と速度に制限があることも、頻繁に見
られます。ほとんどのディスクベースのストレージ プラットフォームには、レプリ
ケーションが備わっていますが、重複排除なしでは、これらの代替策は、災害復旧の
目的には実用的ではなく、またコスト パフォーマンスに優れているとは言えません。
Data Domain Replicator ソフトウェアを搭載した Data Domain システムは、災害復旧
対応を改善することを目的としており、1 対 1、1 対多、多対 1、多対多、カスケー
ド レプリケーション トポロジーをサポートします。Data Domain の効率的なインラ
イン可変長重複排除は、コスト パフォーマンスに優れた「テープなし」の災害復旧
の手法を実現するテクノロジーとなります。特に、Data Domain Replicator を使用す
ると、Data Domain システムは、バックアップが実行中であっても、一意のデータの
みをリモート サイトに送信し、レプリケーションを開始します。
また、Data Domain システムでは、fastcopy と呼ばれる独自のスナップショット機能
を使用して、定期的な DR テストを容易かつ高速に行うこともできます。fastcopy は
メタデータの読み取り/書き込みスナップショットで、5 分足らずで作成して DR テス
トに使用できます。
災害復旧における Data Domain のメリット
Data Domain Replicator の最もわかりやすい第 1 のメリットは、物理テープをリプレ
ースし、物理テープに伴うすべての問題とリスクをなくすことができるという点です。
物理テープを取り寄せたり、待ったりする必要がありません。また、物理テープが破
損することもありません。さらには、物理テープを紛失することもありません。故障
したテープ ドライブを使ったために、バックアップ テープが壊れてしまうこともあ
りません。これらすべてにより、より信頼できるコスト パフォーマンスに優れた災
害復旧のためのインフラストラクチャを構築できます。DR サイトにある物理テープ
ドライブの数が少ないという状況や、実際にデータを読み取る前に各データ カート
リッジをロードし、マウントし、位置を合わせるという無駄な時間によって、リカバ
リが制限されることもなくなります。
Data Domain Replicator を使用すると、一意のデータのみを 1 つ以上のターゲット サ
イトに送信するネットワーク効率の高いレプリケーションを行うことが可能となり、
最短時間で DR の準備を整えることができます。このことにより、レプリケーション
の帯域幅コストは最小となり、災害復旧のためにデータにアクセスできるようになる
までの時間は短縮され、信頼性が高くなります。
Data Domain を CIFS、NFS、DD Boost と一緒に使用している場合は、不安のある仮想
テープ カートリッジを使用する必要もありません。さらに良いことに、DD Boost と
管理されたファイル レプリケーションでは、バックアップ カタログが DR サイトで利
用できるすべてのレプリケーションされたコピーをあらかじめ完全に認識できます。
Data Domain fastcopy を使用すると、プライマリ サイトからの本番レプリケーション
に影響を与えずに、DR テストをより迅速に、容易に行うことができます。fastcopy
は、既存の重複排除されたデータへのメタデータ ポインターを使用するため、DR サ
Data Domain のビジネス バリュー
10
イトの Data Domain システムで追加ストレージ容量をほとんど使用しません。DR テ
ストが完了すると、fastcopy のスナップショットは安全に、かつ簡単に削除できます。
安全なマルチ テナンシー
大規模なエンタープライズ環境のお客様やサービス プロバイダーにとっての Data
Domain システムは、安全なマルチ テナンシー機能を提供して、内部の事業部や部門、
個人のお客様が、安全なデータ分離、管理、レポート作成を実行できるようにします。
安全なマルチ テナンシーのメリット
安全なマルチ テナンシーは物理 Data Domain システムを共有する機能を提供しなが
ら、テナントや管理別の論理データ分離とテナント別のレポート分離を行います。こ
うすることで、より大きなストレージ統合を可能にして全体のコスト パフォーマン
スを向上させ、継続的な管理を簡素化し、ストレージ保護のチャージ バックのベー
スを提供します。
Oracle 向けに最適化された重複排除機能
重複排除の効率性は、日々ほとんど同じに見えるバックアップ ストリームによって
変わります。これは、通常、毎回同じポイントでバックアップが開始され、同じ順序
で進められて起こる結果です。Data Domain では、最も効率性の高い可変長の区分化
という手法を使用し、受信バックアップ ストリームを区分化する論理的な場所を決
定します。典型的な企業データと保存期間において、同じ場所で開始し、同じ順序で
進め、効率性の高い可変長の区分化を行うと、結果として、最大 30:1 という高い重
複排除率が達成されます。
物理テープによるバックアップの場合、多重化が一般的です。多重化では、複数のバ
ックアップ ストリームを単一のターゲット デバイスに送信し、バックアップ データ
を混在させて、物理テープ ドライブのテープ バッファーがいっぱいの状態を保ち、
できるだけ高速にテープ ドライブが機能するようにします。多重化は、通常バック
アップ アプリケーションの設定によって有効化されます。
また、Oracle データベースのバックアップでは、複数のチャネルを使用して全体的な
バックアップ パフォーマンスを高めることも、非常に一般的です。Oracle の
filesperset 値が 1 よりも大きく設定されている場合は、複数のチャネルが使用されま
す。実際には、これはバックアップを多重化する別の方法です。
残念ながら、重複排除の効率性は日々のバックアップ ストリームによって変わるた
め、上で説明した多重化の方法は、重複排除の効率性に悪影響を与えます。バックア
ップ データが 1 つの共通のストリームで混在すると、同じ場所から開始された場合
でも、データは毎日同じ順序になりません。結果として、重複排除の効率性が著しく
低下します。これは、どのベンダーの重複排除ソリューションにも当てはまります。
この理由のため、標準的な重複排除のベスト プラクティスでは、多重化をオフにし
て、Oracle で filesperset = 1 に設定します。今までは、高パフォーマンスまたは高い
重複排除の効率性のどちらかを選択しなければなりませんでした。Data Domain の
Oracle 向けに最適化された重複排除テクノロジーでは、Oracle DB バックアップ専用
の Data Domain システムについては、多重化を使用しても、重複排除の効率性を高め
ることができます。
Data Domain のビジネス バリュー
11
Oracle 向けに最適化された重複排除機能のメリット
Data Domain の Oracle 向けに最適化された重複排除テクノロジーでは、Oracle DB バ
ックアップ専用のシステムについては、速度または重複排除の効率性のどちらを最大
化するかについて選択を迫られることはなくなり、同時に両方を実現することができ
ます。複数の Oracle チャネルにより、データベースのバックアップ パフォーマンス
が最大化されます。重複排除率が高くなるほど、使用するストレージも削減され、使
用する帯域幅が少なくなるほど、結果としてコストと複雑性も低減されます。
柔軟性
ほとんどの場合、ソリューションを購入する際、1 つの方法に縛られたくはありませ
ん。Data Domain システムでは、投資保護のために、時間の経過とともに変化するバ
ックアップ要件に合わせて拡張できる柔軟性を提供します。すべての Data Domain シ
ステムには、1 G Ethernet ポートが搭載され、CIFS、NFS を NAS ターゲットとしてバ
ックアップを迅速に、かつ容易に実行できます。また、1 個以上のデュアル ポートの
8 GB ファイバー チャネル HBA をオプションで追加し、Data Domain システムを既存
の FC インフラストラクチャに接続して、多くの状況において、DD Boost の活用によ
り、テープ カートリッジを管理する必要性をなくすこともできます。別のオプショ
ンとして、クワッド ポートの 1 G またはデュアル ポートの 10 G Ethernet NIC を Data
Domain システムに追加し、Ethernet の追加の帯域幅に対応することもできます。
さらに、ファイバー チャネルと Ethernet 上で同時にバックアップを実行することが
できます。Data Domain システムのすべてのデータは、どのようにシステムによって
取り込まれたのかに関係なく、同じ重複排除プールの一部となっています。同時に複
数のバックアップ アプリケーションまたはアーカイブ アプリケーション、またはそ
の両方のターゲットとして Data Domain を使用し、各ワークロードに対して論理クォ
ータも設定できます。さらに、多くのモデルでコスト パフォーマンスに優れたコン
トローラーのアップグレード オプションを用意し、既存のストレージとバックアッ
プ データをそのまま残すことができます。
Data Domain は、EMC Avamar や EMC NetWorker など、あらゆる先進的なオープン シス
テムのバックアップ アプリケーションをサポートします。また、IBM i システムおよび
IBM zSeries メインフレーム システムと一緒に使用することもできます。
Data Domain システムの柔軟性によるメリット
Data Domain の柔軟な接続性により、既存のバックアップ プロセスをほとんど変更し
ないで、既存のインフラストラクチャにシステムを容易に組み込んで、瞬時に稼働す
ることができます。その後、時間をかけて、要件と環境の変更に応じて機能を追加で
きます。たとえば、変更を最小限に抑えるために、まずファイバー チャネル上で DD
VTL ソフトウェアを使用して、新しい Data Domain システムをインストールします。
その後、マルチポートの Ethernet NIC をインストールし、テープ カートリッジの使用
を停止することができます。またはマルチポートのファイバー チャネル HBA カード
をインストールし、DD Boost を使用してテープ カートリッジの使用を停止すること
ができます。
Data Domain システムは、複数のバックアップ アプリケーションおよびアーカイブ
アプリケーションで同時に共有することもできます。このことが最も適しているのは、
複数の異なるバックアップ アプリケーションがあり(買収などによる)、1 つのバッ
Data Domain のビジネス バリュー
12
クアップ アプリケーションから別のバックアップ アプリケーションに時間の経過と
ともに、システム停止を行わずに移行する場合です。さらに、バックアップ データ
とアーカイブ データを 1 つのシステムで統合することにより、ストレージのサイト
をなくし、TCO を削減できます。Data Domain システムは、現在 EMC 以外のバックア
ップ アプリケーションをサポートすることにより、投資保護も実現しています。最
適なパフォーマンスとエンド ツー エンドの統合を実現するために、後から EMC
Avamar または EMC NetWorker にアップグレードするオプションを用意します。
最後に、多くの Data Domain システムでは、コントローラーを新しいモデルでリプレ
ースし、既存のストレージ シェルフにすべての既存のバックアップ データをそのま
ま保つ、非破壊的アップグレードが可能です。データ移行が必要ないため、これは、
ストレージ シェルフへの初期投資を活用しながら、パフォーマンスと拡張性をアッ
プグレードするコスト パフォーマンスに優れた方法といえます。
バックアップとアーカイブ用の統合プラットフォーム
Data Domain システムは、業界をリードする専用バックアップ アプライアンスという
だけでなく、アーカイブ データ用にも理想的なプラットフォームです。Data Domain
システムは、EMC SourceOne、Symantec Enterprise Vault、IBM InfoSphere Optim
Archive など、多くの主要なアーカイブ アプリケーションをサポートします。これら
のファイル、メール、SharePoint、データベースのアーカイブ アプリケーションと統
合することで、Data Domain システムは、重複排除を使用した効率的なアーカイブ ス
トレージを提供します。
Data Domain Retention Lock Governance Edition は、ファイル レベルのロック機能が利
用できます。Data Domain オペレーティング システムにはデータのシュレッダ処理機
能が備わっています。Data Domain Retention Lock Compliance Edition は、ファイルお
よびメールのアーカイブに関して、米国および SEC 17a-4(f)などの国際的な標準を
満たす安全な方法でデータを保存します。
DD Retention Lock を使用すると、すべての Data Domain システムでアーカイブ データ
セットのガバナンスとコンプライアンスを同時にサポートできます。このため、さま
ざまなクラス(ガバナンスとコンプライアンス)のアーカイブ データに対してさま
ざまな保存期間を設定できるようになります。
さらに、Data Domain システムは、Data Domain Extended Retention ソフトウェア オプ
ションも提供しています。このオプションにより、問題が発生しやすい物理テープを
使用した長期バックアップ保管の必要性をなくすことができます。DD Extended
Retention では、長期バックアップ保管用に単一のシステムで最大 100 PB の論理容量
を使用できます。このソフトウェア オプションは、新規または既存の DD860 および
DD990 システムで提供されます。
統合プラットフォームとしての Data Domain のメリット
Data Domain システムは、ストレージのサイロをなくして全体的な TCO を削減するた
めに、バックアップ データとアーカイブ データを統合するのに最も適しています。
このため、両方のワークロードが重複排除ストレージとレプリケーションの効率性に
よるメリットを受けることができ、管理が必要なデバイスは 1 つのみになります。
さらに、DD Extended Retention では、長期バックアップ保管のために、物理テープに
代わるコスト パフォーマンスに優れた手段を提供し、何千ものテープ カートリッジ
Data Domain のビジネス バリュー
13
の取り扱い、保存、管理に関するリスクとコストを排除できます。必要な日常の注意
が最小限で済む Data Domain は、完全な統合プラットフォームとなります。
強化されたセキュリティ
Data Domain システムには、保存中およびレプリケーション中のデータを保護する重
要なセキュリティ機能が数多く備わっています。役割に基づいたアクセス制御では、
ユーザーが行う必要がある作業に基づいて Data Domain リソースへのアクセスを提供
します。これらの役割には、アドミニストレーター、バックアップ オペレーター、
ユーザー、データ アクセス、セキュリティ担当者があります。
Data Domain Replicator は、安全でネットワーク効率の良いレプリケーションを実現
するために、送信されるデータの一部または全部を暗号化します。データは Data
Domain システムに書き込まれる際に重複排除され、DD Replicator によってその重複
排除の内容を保持します。このため、ネットワーク使用率が減少します。
Data Domain Encryption ソフトウェア オプションは、重複排除ストレージへの保存デ
ータの暗号化機能を業界で初めて提供し、組織のバックアップ データのセキュリテ
ィ強化を支援します。Data Domain システムには、ローカル鍵管理機能が備わってい
ます。
Data Domain の強化されたセキュリティのメリット
役割に基づいたアクセス制御により、ユーザーの役割に基づいて、ユーザーが意図的
に、または意図せずに行える操作を制限して、セキュリティ保護を実現します。
オプションの保存データの暗号化により、Data Domain システムに保存されているデ
ータに対して、必要に応じてデータ セキュリティのレイヤーを追加できます。オプ
ションの転送データの暗号化が利用可能で、1 つの Data Domain システムから別の
Data Domain システムにレプリケーション中のデータを保護すると同時に Data
Domain Replicator の重複排除時の帯域幅の効率性を維持します。
Data Domain には、基本的な暗号化キー管理機能と、オプションで RSA Data
Protection Manager との統合が備わっており、Data Domain の暗号化キーと他のシス
テムの暗号化キーを管理できます。この RSA との統合オプションを使用すると、お客
様はすべての暗号化キーを単一のメカニズムで管理できます。
DD Boost ソリューションの統合
EMC は、引き続き DD Boost を使用した Data Domain の変革と活用を行い、数多くの
方法でお客様にメリットを提供します。業界をリードするバックアップ アプリケー
ションおよびエンタープライズ アプリケーションとの統合は拡大を続け、お客様が
この強力なテクノロジーを活用する機会はますます増えていきます。
バックアップ アプリケーション向け DD Boost
•
EMC NetWorker
•
EMC Avamar
•
VMware vSphere Data Protection Advanced
•
Symantec NetBackup
Data Domain のビジネス バリュー
14
•
Symantec Backup Exec
•
Dell NetVault
•
Dell vRanger
•
HP Data Protector
エンタープライズ アプリケーション向け DD Boost
•
Oracle RMAN
•
Microsoft SQL
•
SAP
•
SAP HANA
•
IBM DB2
•
Pivotal Greenplum
図 3:DD Boost との統合
Data Domain のビジネス バリュー
15
結論
このホワイト ペーパーをお読みになって、Data Domain システムが劇的にバックアッ
プ、リカバリ、アーカイブのプロセスを改善できるという点について、理解を深めて
頂けたと思います。
要約すると、Data Domain システムは、以下の点でお客様を支援します。
•
短時間でバックアップを完了し、バックアップ ウィンドウの範囲で毎年のデ
ータ増大に対応する余裕を持つことができます。
•
劇的にバックアップ時間を削減することで、大規模で重要な Oracle データベ
ース バックアップの保護を改善し、リカバリを強化します。このことにより、
信頼性の高い短時間のリカバリに備えた毎日のフル バックアップを完了でき
る時間が生まれます。
•
バックアップにより生じるネットワーク インフラストラクチャへの制約を緩
和し、インフラストラクチャ アップグレードのコストを繰り延べることがで
きます。
•
大規模な物理テープ ライブラリやテープ ストレージが不要となり、貴重なデ
ータセンターのフロア面積を解放します。
•
手動による操作が少なくなり、バックアップ ジョブ完了時の成功率が高まり
ます。
•
電源、冷却装置、テープ管理、バックアップのライセンスに関連する、継続
的なバックアップ/リカバリ コストを削減します。
•
重要なデータが本当に必要となったときの復旧可能性に確信が持てます。
•
高い重複排除の効率性を維持しながら、複数チャネルの速度を活用し、Oracle
データベース バックアップを最適化します。
•
Oracle データベース管理者は、完全なカタログの可視性とバックアップ/リカ
バリに対する制御により、極めて高速に毎日のフル データベース バックアッ
プを行うことができます。よって、Oracle データベース管理者の満足度が高
まります。
•
何千ものテープ カートリッジの管理を不要にすることで、毎日のバックアッ
プ業務を簡素化します。
•
帯域幅効率に優れ、暗号化で保護されたレプリケーションにより、物理テープ
に基づくリカバリが抱える問題とリスクをすべて排除することで、災害復旧対
応を強化し、RTO(Recovery Time Objective:目標復旧時間)を短縮します。
•
年次の災害復旧テストにかかる時間、労力、コストを削減し、物理テープの
輸送と管理を不要にします。
•
安全なマルチ テナンシーを使用して、コスト パフォーマンスを向上させ、内
部の事業部やお客さまによるストレージ保護のためのチャージ バックを可能
にします。
Data Domain のビジネス バリュー
16
Data Domain システムの詳細については、EMC の Web サイトで
Data Domain データ非脆弱性アーキテクチャ、Data Domain SISL、Data Domain
Replicator、Data Domain Boost for Oracle RMAN のホワイト ペーパーを参照してくださ
い。また、iPad をお持ちの場合は、EMC の Web サイトで Data Domain Interactive
Product Guide を参照してください。最後に、The Backup Window ブログにアクセスし
て、このホワイト ペーパーやその他の EMC データ保護と可用性のトピックについて
ご確認ください。
Data Domain のビジネス バリュー
17
Fly UP