...

ダウンロードはこちら - EMC Japan

by user

on
Category: Documents
12

views

Report

Comments

Transcript

ダウンロードはこちら - EMC Japan
EMC Data Domain Replicator
詳細レビュー
US ホワイトペーパー翻訳版
要約
重複除外と圧縮を適用したレプリケーションは、WAN帯域幅の使用を最小限に抑えて、安全な遠
隔地への複製データの移動を自動化するための最も経済的なアプローチです。これにより、プラ
イマリ・データ、プライマリ・サイト、セカンダリ・ストアのいずれかが使用できない状態に
なっても、確実に高速リカバリを実行できます。EMC® Data Domain® Replicatorソフトウェアは、
企業向けのシンプルかつ高速で堅牢なWANベースのディザスタ・リカバリを提供します。このソ
フトウェアは、分散環境を持つ企業内での、末端のリモート・オフィスから大規模なコア・デー
タセンターに至るまで、各種トポロジーに対応できる包括的な柔軟性を備えています。他の重複
除外方法と異なり、Data Domainの重複除外はインラインで実行されるため、レプリケーション
は可能な限り短時間で完了し、リストア・ポイントが可能な限り直近のものとすることができる
ため、リスクを最小限に抑えることができます。
2010 年 4 月
Copyright © 2010 EMC Corporation.不許複製。
EMC Corporation は、この資料に記載される情報が、発行日時点で正確であるとみなしてい
ます。この情報は予告なく変更されることがあります。
この資料に記載される情報は、「現状有姿」の条件で提供されています。EMC Corporation
は、この資料に記載される情報に関する、どのような内容についても表明保証条項を設けず、
特に、商品性や特定の目的に対する適応性に対する黙示の保証はいたしません。
この資料に記載される、いかなる EMC ソフトウェアの使用、複製、頒布も、当該ソフトウェ
ア・ライセンスが必要です。
最新の EMC 製品名については、http://japan.emc.com/ 上の「EMC Corporation
Trademarks」を参照してください。
他のすべての名称ならびに製品についての商標は、それぞれの所有者の商標または登録商標
です。
パーツ番号 h7082-J
EMC Data Domain Replicator
詳細レビュー
2
目次
エグゼクティブ・サマリー................................................................................... 4
概要....................................................................................................................... 5
対象読者....................................................................................................................................... 5
Data Domain Replicatorの概要........................................................................... 5
Data Domainファイル・システムおよびコレクションの論理ストレージ・レイヤー ............. 5
さまざまなレプリケーション要件を満たすための論理ストレージ・レイヤーの活用 ............... 6
ディレクトリ・レプリケーション ........................................................................................... 7
NetBackup OpenStorageのoptimized duplication ......................................................... 10
コレクション・レプリケーション ......................................................................................... 11
ディレクトリ・レプリケーション、optimized duplication、コレクション・レプリケー
ションの選択.............................................................................................................................. 12
Data Domain Replicatorの機能概要.................................................................. 13
重複除外済みデータのみ ........................................................................................................... 13
ローカル圧縮.............................................................................................................................. 14
レプリカからの迅速なレプリケーションとリストア ................................................................ 14
ソースおよびレプリカのスナップショット管理と保存ポリシーの柔軟性 ............................... 14
EMC Data Domain Retention Lockソフトウェア ................................................................. 15
ネットワーク管理 ...................................................................................................................... 16
実装におけるベスト・プラクティス .................................................................. 17
重複除外ストレージの比較:RPO、RTO、DR時間 .......................................... 18
リカバリ・ポイント................................................................................................................... 18
リカバリ時間.............................................................................................................................. 19
DR時間のサマリー..................................................................................................................... 19
お客様事例.......................................................................................................... 20
N対 1 のブランチ・オフィスDRの展開 ..................................................................................... 20
2 か所のデータセンターによる大規模なDRの展開 ................................................................... 20
レプリケーションによる大規模ファイル・アーカイブの展開 ................................................. 21
最後に ................................................................................................................. 22
EMC Data Domain Replicator
詳細レビュー
3
エグゼクティブ・サマリー
レプリケーションは、長時間のサイト障害からストレージを自動的に保護するために推奨さ
れている方法ですが、関連する帯域幅コストが高いため、特定の利用用途でしか広く導入さ
れていません。大半の企業においては、バックアップデータの複製のために広帯域のネット
ワークを導入することはコスト的に敷居が非常に高いため、トラックでのテープ搬送という
手動の安全でないミスの発生しやすいフォール・バック・アプローチを採択しています。読
者の方々がこのような状況である場合は、災害対策の復旧テストを実行してみた結果はどの
ぐらい信頼できるのだろうかと懸念されているのではないでしょうか。
通常、フル・バックアップは、レプリケーションにおいて最悪のケースと考えられていまし
た。それは、既存のレプリケーション技術は、新たに増加したデータを単純に送信する方式
ですので、フル・バックアップの度に同じデータが何度も送信され、非常に大きな帯域幅が
必要になるからです。通常のレプリケーション手法では、フル・バックアップ内の新規増加
データを効率的に見つけることはできません。
その解決策の 1 つが、重複除外ストレージです。古いバックアップと新しいバックアップの
差を効率的に特定できれば、バックアップ・データのレプリケーションは可能になり、ほと
んどの IT 組織で、他のコピー方法よりも(ファイル単位などの)リカバリが容易に、より包
括的になります。ブロック差分のレプリケーションが実用可能であれば、帯域幅を 80%以上
節約できます。
EMC Data Domain は、可変長の重複除外と従来のローカル圧縮を動的に組み合わせて使用す
るため、バックアップ全体をコピーするために使用される帯域幅を 99%以上削減できます。
レプリケーション導入のコストの下限をさらに引き下げることで、この効率化テクノロジー
のさらなる普及が促進されます。ルイジアナ州のカトリーナ災害後などは典型的な例ですが、
多くのお客様が WAN(ワイド・エリア・ネットワーク)レプリケーションを実現するために
重複除外を適用されています。それらのお客様のフィードバックに基づき、Data Domain で
は、導入における検討事項として 3 つの重要な結論を導き出しました。
•
速度と安全性。DR(ディザスタ・リカバリ)サイトが利用可能になるまでの時間は非常
に重要です。バックアップ/アーカイブ・アプリケーションでは、テープセントリックな
ソリューションを置き換えるために十分もしくはそれを上回るリカバリー要求を満たす
よう設計されているだけで、レプリケーション機能との同期動作は考慮されていません。
Data Domain の設計要素である、真のインライン重複除外、レプリカにおける継続的な
データ整合性、レプリカからの高速リストア・ストリーム等が有機的に連携し、ソー
ス・システムにデータが最初に保存された後できるだけ早く、レプリカ・サイトで容易
かつ高速にリカバリを行えるようになりました。
•
柔軟性。特定の重複除外レプリケーション方法がすべての WAN に適合するとは限りませ
ん。特に、大規模データセンターとは WAN 要件が大きく異なる小規模リモート・オフィ
スの場合はなおさらです。ポリシー・ベースで速度と効率のバランスを取れるように、
トポロジーの選択肢を提供し、広範な回線タイプで動作できることが求められます。
•
シンプルさ。エンタープライズグレードの重複除外機能の実装は簡単ではありません。
高いパフォーマンスと復旧性を一貫して提供するために、高度なシステム設計が必要で
す。これは重複除外レプリケーションの場合も同様です。Data Domainは、DRシステム・
ミラーリングからシステム間のデータ移行、さらにバックアップからアーカイブに至る
まで、すべての機能において重複除外をフルに活用しています。DD OS(EMC® Data
Domain® Operating System)では、重複除外スナップショット、アーカイブ・サポート
用のEMC Data Domain Retention Lockソフトウェアなど、サポートされるすべてのプロ
トコルとオプションがレプリケーションと連携可能です。
Data Domain Replicator ソフトウェア・オプションは、基盤となる DD OS データ・ストレー
ジ・フレームワークと緊密に統合された重複除外レプリケーションでのポリシー・ベースの
アプローチを可能にします。これにより、Data Domain のお客様は、データ保護もしくはそ
EMC Data Domain Replicator
詳細レビュー
4
れ以上の機能性を提供する重複除外中心のストレージ・ネットワークのすべてのメリットを
享受できます。
概要
このホワイト・ペーパーでは、EMC Data Domain Replicator ソフトウェアを紹介し、ディザ
スタ・リカバリの強化のための柔軟性のあるレプリケーション・トポロジーをさまざまな企
業 環 境 で 提 供 す る 方 法 に つ い て 説 明 し ま す 。 こ の ホ ワ イ ト ・ ペ ー パ ー を 読 む と 、 DD
Replicator が、集中型企業と分散型企業におけるバックアップ、リカバリ、DR の問題をどの
ように解決するのかをご理解頂くことができます。
これ以降のセクションでは、サイト間重複除外などの DD Replicator の独自の特長に加えて、
リカバリ目的を満たす導入シナリオとベスト・プラクティスについて説明します。
対象読者
このホワイト・ペーパーは、Data Domain Replicator ソフトウェアの詳細に興味を持つ EMC
のお客様、テクニカル・コンサルタント、パートナー、EMC とパートナーのプロフェッショ
ナル・サービス・コミュニティのメンバーを対象としています。
Data Domain Replicator の概要
Data Domain ファイル・システムおよびコレクションの論理スト
レージ・レイヤー
図 1に示すように、Data Domainシステム内には、物理ディスク・ストレージの上位に複数レ
ベルの論理データ抽象化構造があります。
図 1:DD OS ファイル・システムには、論理ファイル・システム・レイヤーにアクセスする
ためのプロトコル固有のネームスペースがクライアント/アプリケーションに提供されてい
ます。ファイル、ディレクトリ、スナップショットはすべて、一意のセグメントが存在する
EMC Data Domain Replicator
詳細レビュー
5
同一のプールを参照しています。このプールはコレクションと呼ばれ、ディスク上のセグメ
ントにより構成され、スループットと重複除外効果を最適化するためにログ構造化コンテナ
として作成されています。
1. アプリケーションに対する外部インタフェースとして、VTL(仮想テープ・ライブラリ、
ファイバ・チャネル経由)、Symantec NetBackup OpenStorage LSU(論理ストレージ・
ユニット)、CIFS/NFS ファイル共有(Ethernet 経由)などのプロトコル・ネームスペー
スがあります。Data Domain では、データの格納およびアクセス用に、これらの任意の
組み合わせを同時に使用できます。
2. これらのネームスペースのファイルとディレクトリは、ファイル・システムに格納され
ます。CIFS/NFS 以外の場合、データ(仮想テープ・カートリッジなど)は特別なディレ
クトリの下にファイルとして格納されます。DD OS のファイル・システム・スナップ
ショットは論理的なものであるため、コレクション内の基盤となる同一データ・セグメ
ントを共有し、領域効率に非常に優れています。
3. コレクションは、ファイル(または仮想テープ)と論理ファイル・システム・スナップ
ショットのセットです。システムは、このコレクションの下で重複をインラインで特定
し、重複除外後のデータセグメントを圧縮して物理ディスクに書き込みます。各セグメ
ントは、コレクション内で一意です(自動的に解消される特定の重複は考慮に入れてい
ません)。1 つの Data Domain システムには 1 つのコレクションが存在し、セグメン
ト・ローカリティ・コンテナのログに格納されます。セグメントのローカリティの詳細
については、ホワイト・ペーパー「EMC Data Domain SISL™スケーリング・アーキテク
チャ」を参照してください。
4. これらのコレクション・コンテナは、RAID 対応ディスク・ドライブ・ブロック上で階層
化されています。Data Domain 重複除外ストレージ・システムでは、内蔵ディスクと拡
張シェルフで構成される Data Domain RAID 6 を使用します。
さまざまなレプリケーション要件を満たすための論理ストレー
ジ・レイヤーの活用
Data Domain Replicator ソフトウェアには、3 つのレプリケーション方式が用意されており、
各方式はシステムの異なる論理レベルを活用して、異なる効果をもたらします。これら 3 つ
の方式のいずれかを使用するレプリケーションでは、ソース側で使用していたデータを、レ
プリカ上でデータ到達後同じアプリケーションからすぐに使用することも可能です。これは、
DR とアーカイブ・アクセスを目的に、複製データの利用を最適化するために非常に重要です。
3 つのレプリケーション方式の概要は、次のとおりです。
•
ディレクトリ・レプリケーションは、レプリケーション・ソースとして構成されている
Data Domain ファイル・システム・ディレクトリ内の任意のファイルまたはサブディレ
クトリに加えられた変更に重複除外を適用したデータを、レプリケーション・ターゲッ
トとして構成されている別のシステム上のディレクトリに転送します。ディレクトリ・
レプリケーションでは、システム・ミラーリング、双方向、N対 1、1 対N、カスケード
を含め、最も柔軟なレプリケーション・トポロジーが提供され、効率的なサイト間重複
除外が可能です。VTL ネームスペースでは、指定された仮想カートリッジのプールを、
この方式に関連するディレクトリとして使用できます。
•
NetBackup optimized duplication 機能は、Symantec の NetBackup OpenStorage オプ
ションに組み込まれている、このアプリケーションに固有のディレクトリ・レプリケー
ション・メカニズムの 1 つです。optimized duplication 機能では、NetBackup から要求
された時点で、一度に 1 つのバックアップ・イメージを直接転送します。NetBackup は、
レプリケーション・ステータスとレプリカ・コピーからのリカバリを容易に実行できる
ように、すべてのコピーを履歴管理します。Data Domain での実装としては、基盤とし
てディレクトリ・レプリケーションの方法を活用して、サイト間で同様の重複除外効果
と柔軟なネットワーク配置トポロジーを実現しています。
EMC Data Domain Replicator
詳細レビュー
6
•
コレクション・レプリケーションは、1 対 1 のトポロジーでシステム全体のミラーリン
グを実行し、Data Domain ファイル・システムのすべての論理ディレクトリとファイル
を含め、基礎となるコレクション内の変更を継続的に転送します。ディレクトリ・レプ
リケーションとコレクション・レプリケーションのモードでは、データへのマルチ・プ
ロトコルおよびマルチ・アプリケーション・アクセスがサポートされます。コレクショ
ン・レプリケーションは他の 2 つの方式のような柔軟性を備えていませんが、非常にシ
ンプルで軽快であるため、より少ないオーバーヘッドで、より高いスループットとより
多くのデータの扱いをサポートできます。
DD OS は、バックアップ、アーカイブ、その他のニアライン・アプリケーション向けに
チューニングされた設計になってます。通常、バックアップには直近 24 時間に加えられた変
更がすべて含まれます。そのため、既に数時間も経過したデータのバックアップに対して同
期レプリケーションを行うのは過剰であるケースがほとんどです。レプリケーションはタイ
ムリーに実行する必要がありますが、大容量のネットワーク帯域を必要とせず、非常に高い
データの整合性と復旧性を維持して適切にリカバリできることのほうが、より重要です。そ
のため、すべてのレプリケーション・アプローチは非同期で動作します。次に、各レプリ
ケーション方式について詳しくご説明します。
ディレクトリ・レプリケーション
ディレクトリ・レプリケーションでは、図 2に示すように、ソース・システム上のディレク
トリ(およびその下のすべてのファイルとサブディレクトリ)が、別のシステム上のター
ゲット・ディレクトリに複製されます。ターゲット・ディレクトリは読み取り専用となり、
同じシステム上の他のレプリケーション・ターゲット・ディレクトリ、レプリケーション・
ソース・ディレクトリ、その他のローカル・ディレクトリと共存できます。それらはすべて、
そのシステムのコレクション内で重複除外を共有します。その結果、ディレクトリ・レプリ
ケーションでは、シンプルなシステム・ミラーリング、双方向、多対 1、1 対多、カスケード
などの幅広いトポロジーが利用可能です。
ディレクトリ・レプリケーションでは、1 つのレプリケーション・コンテキストにおいて、1
つのソース・ディレクトリ(パス名として指定される)と、別のシステム上の 1 つのター
ゲット・ディレクトリが対になります。DD OS バージョン 4.8 では、EMC Data Domain
Global Deduplication Array が合計で最大 270 の受信レプリケーション・コンテキストを保
持できます。すでにターゲット・システムに存在するデータ・セグメントは、WAN 経由で転
送されません。
図 2:ディレクトリ・レプリケーションでは、対象オブジェクトのメタデータ転送を開始す
るために、論理ファイル・システム・レイヤーの変更が履歴管理されます。これにより、レ
プリカ・システムには存在しない一意のデータ・セグメントだけが転送されるため、重複除
外は確実に維持されます。すでにレプリカ・コレクションに格納されているセグメントをメ
タデータが参照している場合は、メタデータのみが WAN 経由で送信されます。
EMC Data Domain Replicator
詳細レビュー
7
ディレクトリ・レプリケーションでは、2 つのシステム間でプロトコルのやり取りが行われ
ます。書き込みファイルが閉じられると、ファイル転送を開始します。閉じる頻度が低い場
合は、DD Replicator がデータ転送を定期的に強制実行します。メタデータとそれに対応す
る一意のデータ・セグメントが転送されると、リモート・システム上でもファイルが作成お
よび保持されます。つまり、レプリカのコレクションはソースとは独立しています。レプリ
カ上に完全なファイルが作成されると、レプリカのネームスペース(CIFS、NFS、VTL)で即
座に認識され、すぐにリストアやコピーが可能になります。
図 3:ディレクトリ・レプリケーションのプロトコルは対話型です。ソース・システムは、
新しいデータ・セグメント(A、B、C)のフィンガープリント(a、b、c)を、ディレクト
リ・コンテキストからレプリカ側システムに送信します。レプリカ側のコレクション上にす
でにそれらのセグメントが存在する場合は、小さなデータ量の参照情報とファイル・メタ
データだけを送信するだけです。レプリカ側コレクションに対象のセグメントと同じものが
ない場合は、サイズの大きいセグメントデータが送信されます。このような仕組みであるた
め、例えばN対 1 のトポロジーでは、一意のセグメントが WAN を経由する必要があるのは、
一度だけに限られます。
サイト間の重複除外の結果、WANレプリケーションの効率は、ストレージ上での重複除外と同
等になります。さらに、マルチサイト・トポロジーではそれぞれのメリットが集約されます。
例として、図 3に示すように、2 対 1 トポロジーのサイトとして、S1、S2、Rの 3 つがあると
します。Rは、ソースS1 とS2 からレプリケートするソース・ディレクトリのターゲットです。
S1 とS2 のレプリケート元ディレクトリには同一のデータが保持されており、S1 のみすでに
レプリケート済みで、S2 からRへのレプリケーションが開始したばかりであるとします。こ
の場合、必要なデータはすでにR側に存在しており、転送する必要があるのはメタデータのみ
であることから、S2 のデータをRにレプリケートするために必要な時間と帯域幅は非常にわ
ずかです。送信された最初のS1 のデータとS2 の重複データを比べた場合の帯域幅への影響は、
初回フル・バックアップと 2 回目のフル・バックアップで使用されるローカル重複除外スト
レージ容量の差と似ています。一般的な例では、S1 はレプリカ・システムRと同期化するた
めに、フル・バックアップの約 2 分の 1 から 3 分の 1 のデータを送信する必要があります。
後から同じデータを送信するS2 は、送信データのサイズは同一のフル・バックアップの約 50
分の 1 から 60 分の 1 になります。
EMC Data Domain Replicator
詳細レビュー
8
多くの組織ではデータの2つ目の複製を持つだけで十分ですが、一部の組織、特に広範囲に
分散している企業では、3つ目(またはそれ以上)の複製が必要になる場合があります。追
加の複製を作成することによって、データ保護が強化され、複数サイトにデータを配信する
機能が提供されます。たとえば、QA/テストのコンテンツやトレーニング資料を、異なるリ
モート・サイトに信頼性と優れた効率でレプリケートできます。
DD Replicatorは、1対Nおよびカスケードという2つの強力なレプリケーション・トポロジー
をサポートしているため、ディレクトリ・レプリケーションによるデータの複数からなる複
製を作成できます。1対多レプリケーションはソース・ファイルから複数のコピーを作成し、
カスケード・レプリケーションはソース・システム・データの連続的なレプリケーションか
らコピーを作成します。これら2つを組み合わせることによって、複雑なトポロジーと多様な
帯域幅の既存のネットワークを活用する最高の柔軟性が提供されます。
1対Nレプリケーションによって、複数の異なるリモート・サイトに同一ソース・ディレクト
リを並行してレプリケートできます。1対Nのレプリケーションを設定することは、複数の独
立したレプリケーション・コンテキストを一度に1つずつ、すべて同一のソース・ディレクト
リで作成することに似ています。さらに、1対Nのレプリケーションは、N対1のレプリケー
ションが行うのと同じ方法でスループットとストリーム・カウントを拡大します。全体とし
て、各コンテキストが他の独立したコンテキストのように扱われるので、1対Nレプリケー
ションを使用することによる追加の管理は必要ありません。
図 4:1 対Nレプリケーションでは、ディレクトリを複数のリモート・システムに同時にレ
プリケートできます。レプリケーション・コンテキストはそれぞれのターゲット用に作成さ
れます。
カスケード・レプリケーションでは、Data Domainシステム上のディレクトリは、あるレプリ
ケーション・コンテキストのターゲットであると同時に、別のレプリケーション・コンテキ
ストのソースでもあるように構成できます。これによって、図 4に示すように、Data Domain
システムAからData DomainシステムBへのディレクトリとその内容(ファイルとサブディレク
トリ)のレプリケーション、およびData DomainシステムCへの同じディレクトリの後続レプ
リケーションが可能になります。つまり、複数のシーケンシャル・ホップで、必要な数のサ
イトにデータセットをレプリケートできます。
EMC Data Domain Replicator
詳細レビュー
9
図 5:カスケード・レプリケーションを使用すると、ディレクトリ・レプリケーション・コ
ンテキストを、複数システムにまたがるシーケンシャル・レプリケーション・ホップの
チェーン内に構成できます。双方向レプリケーションがサポートされます。
レプリケーション・コンテキストのカスケード・チェーンからのリカバリまたは再同期化は、
レプリケーション・フローとは逆方向、つまりシステム C からシステム B、さらにシステム B
からシステム A へと連続して実行できます。
この構成は、双方向、N対 1、1 対Nを含め、ディレクトリ・レプリケーションを使用可能な
すべてのトポロジーでサポートされます。要件によっては、1 対Nまたはカスケードのレプ
リケーションが望ましい場合があります。たとえば、1 対Nは同一のソース・ディレクトリ
から複製を作成するので、ターゲットにはカスケード・レプリケーションよりも早くデータ
が到達し、カスケード・レプリケーションではデータは先に中間システムに到達してから最
終的なターゲットにレプリケートされます。そのため、複数の複製を最高の速度で送信する
ことを優先する場合は、1 対Nが望ましいでしょう。
ただし、ソースのネットワーク帯域幅が限定されていたり、DR 準備のために 1 つの複製デー
タをオフサイトに先に送ることのほうが追加の複製データ作成よりも重要である場合は、カ
スケード・レプリケーションの方が望ましくなります。
NetBackup OpenStorage の optimized duplication
Symantec では、最先端のストレージ・デバイスとのインテリジェントな統合を可能にするメ
ディア・サーバ API(アプリケーション・プログラミング・インタフェース)であ る
NetBackup OpenStorage を、NetBackup 6.5 から導入しました。Data Domain は、この API に
対応した業界初の認定プラグインを提供しました。2 つの製品間で提供される効率化と管理
の最適化に加え、optimized duplication と呼ばれる重要なアプローチが Data Domain 導入
環境では実現されています。
前述のディレクトリ・レプリケーションの場合、レプリカ・ディレクトリには、ソース側
デ ィ レ ク ト リ の す べ て の 書 き 込 み 、 更 新 、 削 除 が ミ ラ ー リ ン グ さ れ ま す 。 optimized
duplication では、NetBackup のポリシーまたはユーザーが選択した個々のバックアップ・
ファイル・イメージを、バックアップの完了後に別のシステムにレプリケートします。従来
のテープへの NetBackup ヴォールティングとは異なり、データは、複製先に書き込まれると
きにメディア・マネージャによって読み取られません。その代わりに、NetBackup はデータ
を保持しているストレージ・システムにデータの複製作業を任せ、最も効率的な方法を使用
してデータを転送します。
EMC Data Domain Replicator
詳細レビュー
10
Data Domain は、ディレクトリ・レプリケーションの機能を使用してこの転送を実現してい
るため、前述のとおり、必要な帯域幅を最小限に抑えることができます。NetBackup は、
Data Domain システムとの対話型の API 通信に基づいてデータ複製の開始するタイミングを
決定し、終了する時刻を識別します。このアプローチを使用して、NetBackup はレプリカ側
がソース側のファイルとは独立してバックアップイメージファイルの複製を保持しているこ
とを認識します。この 2 つの保存期間は独立して管理できるため、DR サイト側でフルバック
アップ・イメージデータをより長く保持するといったこともできます。ディレクトリ・レプ
リケーションの他のすべての特性も、NetBackup の optimized duplication に適用されます。
管理者は、ストレージ・ライフサイクル・ポリシーを構成することで、初期バックアップか
ら optimized duplication までプロセス全体を自動化できます。NetBackup 6.5.4 で導入さ
れたこれらのポリシーの特徴は、階層型の複製を構成できることです。これによって、任意
の既存のコピーを、optimized duplication オペレーションのソースとして使用できます。
管理者は、この機能を使用して、各複製データを NetBackup カタログで履歴管理できるとい
うメリットを備えたカスケード・レプリケーションを実装できます。optimized duplication
の使用方法の詳細については、ホワイト・ペーパー「Symantec NetBackup OpenStorage Best
Practices with Data Domain」を参照してください。
コレクション・レプリケーション
最も高速で動作が効率的なレプリケーション・ポリシーは、コレクション・レベルの方式で
す。前述の 2 つの方式と異なり、秒あたりのファイル数は無制限であり、何を送信するかに
関してシステム間のやり取りは行われません。コレクション・レプリケーションでは、ファ
イルは識別されません。レプリケーションは、セグメント・ローカリティ・コンテナ上で動
作します。これらのコンテナがクローズ処理された後に送信されます。
システムごとにコレクションは 1 つのみであるため、これがシステム・ミラーリングの専用
アプローチとなります。レプリカ・システムを他の役割用に共有することはできません。レ
プリカ・システムは読み取り専用であり、1 つのソース・システムからの複製データのみを
表示します。ただし、LUN レベルのストレージ・ミラーリングと異なり、コレクションは論
理構造です。データがレプリカ上に配置されると、ファイル(および仮想カートリッジ)は
即座にリカバリ用として認識されます。
前述のとおり、コレクションのコンテナ・セットはログ構造です。そのため、図 5に示すよ
うに、この方法でのデータ転送では、単にソースとターゲットのログの先頭部分が比較され、
一度に 1 つのコンテナを更新するのみとなります。ここで遅延が生じても、後で更新されま
す。重複除外インデックスはレプリカ上で個別に維持されるため、インデックス更新をネッ
トワーク経由で送信する必要はありません。このアプローチは、条件が非常に厳しい多様な
エンタープライズ・アプリケーションに適しています。たとえば、ディレクトリ・レプリ
ケーションの選択性やサイト間フィルタリングのオーバーヘッドが原因となっているリソー
ス・オーバーヘッドの最適化を必要とされている大規模システムや、アーカイブの展開にお
いて数億個のファイルが対象となることによるリソース・オーバーヘッドの最適化を必要と
されている大規模システムなどがその対象になります。
EMC Data Domain Replicator
詳細レビュー
11
図 6:コレクションのログ構造を活用することで、コレクション・レプリケーションは、
ソース・コレクションの先頭とターゲット・コレクションの先頭との差を履歴管理し、差が
埋まるまで重複除外後のデータセグメントを含む各コンテナを順番に転送します。
ディレクトリ・レプリケーションと比べて、コレクション・レプリケーションのシステム・
パフォーマンスへの影響は非常に小さいです。それは、その他の読み取りおよび書き込みの
同時ストリーム数へ影響しません。システムへの影響を抑えて高いレプリケーション・ス
ループットを実現する必要がある場合(広帯域幅WANを使用する非常に大規模なDR展開など)
は、コレクション・レプリケーションの使用を推奨します。図 7に示すように、レプリケー
ション・コンテキストのカスケード・チェーンの最終ホップで、コレクション・レプリケー
ションを使用するように構成することも可能です。
図 7:コレクション・レプリケーションをカスケード・レプリケーション・トポロジーの最
終ホップとして使用して、保護サイト 1 の Data Domain システムのコンテンツを保護サイト
2 のシステムにミラーリングできます。
ディレクトリ・レプリケーション、optimized duplication、コレ
クション・レプリケーションの選択
特定のData Domain展開に最適なレプリケーション・アプローチの決定は、とても単純です(
表 1を参照してください)。
•
2 つのサイト間の一方向システム・ミラーリングのみが必要な場合は、コレクション・
レプリケーションを使用します。これが、DR サイトを準備するための最も迅速で最も影
EMC Data Domain Replicator
詳細レビュー
12
響が小さい方法です。大規模な企業データセンターでは、システムの規模や使用するリ
ンク速度によっては、コレクション・レプリケーションがデータの高速移動のための最
適な手段となります。
•
システムをアーカイブ・ストレージ用に使用しており、システムの制限を超える数百万
個のファイルが存在する場合も、コレクション・レプリケーションを使用します。
•
NetBackup 6.5 以 降 を 使 用 し て い る 場 合 は 、 OpenStorage の 実 装 と optimized
duplication の使用を検討できます。これは、独自のバックアップ・オペレータ中心型
ソリューションであり、オリジナルとレプリカで個別に保存期間を維持するなど、詳細
なポリシーを容易に適用できます。
•
上記以外の場合は、ディレクトリ・レプリケーションを使用します。これは、トポロ
ジーの面で最高レベルの柔軟性がもたらされ、サイト間重複除外の効果により集約的な
最高レベルの WAN 効率を実現します。
各レプリケーション・アプローチは多数のトポロジーをサポートし、WAN 経由の効率の良い
データ移動のための柔軟性を実現します。
表 1:サポートされるレプリケーション・トポロジー
Data Domain Replicator の機能概要
次に、導入の目的に応じて選択したレプリケーション・アプリケーションに関係なく、共通
する機能とメリットを示します。
重複除外済みデータのみ
Data Domain Replicator では、常に、重複除外済みデータだけが転送されます。ソース側で
の書き込みにはインライン重複除外プロセスが使用され、ディスクに書き込まれる前に、す
べてのデータに重複除外が適用されます。つまり、残された手順はレプリケーションのみと
いうことになります。それとは対照的に、重複除外を開始する前に、ディスク上に全ての
バックアップイメージデータをネイティブ形式で保存するポストプロセス型の重複除外シス
テムもあります。そうしたシステムでは、バックアップ、および、重複除外処理が終わらな
いと、WAN 上でレプリケーションを開始することができません。
DD OS では、データがソース・システムに最初に書き込まれた時点で重複除外が適用され、
レプリケーションの際にも重複除外が維持されます。これにより、データをレプリカ・シス
テムに転送する際に、データ量を抑えることができます。ソース・システムで重複除外が開
始されるのを待機したり、レプリカ上で再度重複除外が実行されるのを再び待機したりする
ための遅延はありません。
EMC Data Domain Replicator
詳細レビュー
13
ローカル圧縮
DD Replicator は、必要に応じて、柔軟なローカル圧縮の選択肢を幅広く提供しています。
DD OS では、LZ スタイル(デフォルト)、GZ-fast、GZ、圧縮なしなどのローカル圧縮タイプ
の選択肢が用意されています。ローカル圧縮の圧縮率が高いほどデータ・サイズを小さくで
きますが、必然的に CPU 負荷が高くなり、システム・パフォーマンスが低下することがあり
ます。デフォルトでは、ソース・システム、ネットワーク、ターゲット・システムで同じス
タイルが使用されます。
レプリカからの迅速なレプリケーションとリストア
Data Domain ストレージ・システムは、データがレプリケートされ、迅速にリストア可能な
状態であることが確実となるように、パフォーマンスが最適化されています。
Data Domain Replicator では、レプリケートされたデータは継続して一貫性を維持します。
また、ファイル転送が完了するとすぐに読み出し可能になります。つまり、システム管理者
は、レプリカを見れば、どのファイルが転送され、どのファイルが転送されていないかを正
確に把握できます。そして、Data Domain Replicator は DR サイトのリストア・ポイントを
最適化します(後で詳しく説明します)。さらに、レプリカ・システムを1つに集約し、
テープへの複製を分散した拠点毎に行うのではなく、1ヶ所で行うことで、アーカイブ機能
の一元化を実現します。データを認識可能にするために管理する必要性をなくなるので、集
約化のプロセスにおける最大限の自動化を実現できます。
Data Domain SISL Scaling Architecture は、ディスク上のコレクションにおけるストリー
ム・インフォームド・セグメント・レイアウトを定義し、重複除外ストレージでの業界を
リードするコスト・パフォーマンスを提供します。レプリカ側のサイトでテープ管理が実行
される場合、システムは、テープ・ストリーミング速度を満たすためにレプリカ・システム
において十分な高速性を備えている必要があります。
ソースおよびレプリカのスナップショット管理と保存ポリシーの
柔軟性
DD OS は、ファイル・システムのポイント・イン・タイム・スナップショット・イメージを
提供します。スナップショットは、独自のシーケンスによるコレクションの単なるもう 1 つ
の仮想イメージであるため、システムに対するオーバーヘッドが増えることはありません。
システムのパフォーマンスを低下させることなく、数百のスナップショットを保持できます。
多くのお客様が、それぞれのバックアップ・データの保護を強化するために、1 つ以上のス
ナップショットを保持しています。
スナップショットは、システム全体を対象としています。ディレクトリ・レプリケーション
および optimized duplication レプリケーションの場合、スナップショット・スケジュール
はそれぞれのシステムごとに独立して管理されます。コレクション・レプリケーションでは、
コレクション内のすべての他のデータおよびメタデータと同様に、スナップショットはソー
スからレプリカにミラーリングされます。
前述のとおり、optimized duplication レプリケーションでは、NetBackup のソース側とレプ
リカ側の論理ストレージ・ユニット内のファイルごとに異なる保存期間を設けることができ
ます。また、ディレクトリ・レプリケーションを使用して、システムごとに異なる期間ス
ナップショットを保持することでも、これと同様の結果を得ることができます。
EMC Data Domain Replicator
詳細レビュー
14
図 8:EMC Data Domain Enterprise Manager を使用すると、分散型企業内のすべてのシス
テムでレプリケーションを管理できます。
図 9:Data Domain Enterprise Manager によって管理されている各レプリケーション・コン
テキストのレプリケーション構成およびステータスの詳細なビュー。
EMC Data Domain Retention Lock ソフトウェア
DD Retention Lock は、ファイルに保存期間を適用し、ガバナンス用のファイルをロックす
るためにファイルを変更および削除不可能にします(信頼できるオペレータによって変更さ
れる場合を除く)。ファイルがソース・システム上でロックされると、ロック状態はレプリ
カにも反映されます。
EMC Data Domain Replicator
詳細レビュー
15
ネットワーク管理
すべての Data Domain レプリケーション・アプローチにメリットをもたらす、多数のネット
ワーク管理機能があります。
•
状況の把握。Data Domain Enterprise Managerには、レプリケーションを設定し、管理
するためのGUIが組み込まれています。図 8は、N対 1 ディレクトリ・レプリケーション
のターゲット・ノードの現在のステータスと現在のレプリケーションの転送状況をハイ
ライトしたペインの例を示しています。より詳細にレプリケーションの状況を確認する
ために、コンテキスト単位で追加のビューが用意されています。図 9に示すこれらの
ビューでは、転送状態などDRに備えるためのに必要な最も一般的な管理上の課題に対応
したフォーカスが追加され、さらに、データ・ストレージとデータ伝送速度間の関係を
即座に把握できるグラフが提供されています。
•
スロットリング。QoS(サービス品質)の基本形式として、管理者はデータを送信可能ま
たは不可能な時間帯を規定し、使用可能な帯域幅を制限することができます。さらに高
度な QoS 機能を使用するには、ネットワーク自体の中でより細かな制御を行うことを推
奨します。
•
広帯域ネットワークにおけるレプリケーション・コンテキストのマルチ・ストリーミン
グ。Data Domain システムは、各レプリケーション・コンテキストに最大 9 つのスト
リームを割り当てることができ、さらに各システムにはそれぞれ使用可能な最大合計コ
ンテキスト数を割り当てることができます。そのため、データ転送は各コンテキスト内
で並行して実行され、レプリケーション・スループットが最適化されるため、特に広帯
域幅の WAN 経由での場合は、データの DR 完了までの時間が短縮されます。
マルチ・ストリーミングはディレクトリ・レプリケーションでのみ動作しますが、サ
ポートされているすべてのレプリケーション・トポロジー(1 対 1、N対 1、1 対N、双
方向、カスケード)に対応しています。さらに、NetBackup optimized duplication は、
複数のバックアップ・イメージを並行して複製することができます。
•
低帯域幅ネットワーク向けのレプリケーション・コンテキストの最適化。小さなデータ
セットと 6 Mb/秒以下の帯域幅のネットワークを持つ企業では、DD Replicator の低帯域
幅最適化モードにより送信するデータの量をさらに削減できます。このモードはデルタ
圧縮技術を使用して、WAN 経由でデータを送信する前に、重複除外されたデータをさら
に圧縮し、セグメント内の冗長データを排除します。これによって、限定された帯域幅
しかないリモート・サイトに対しても、既存のネットワーク経由でより多くのデータを
レプリケートして保護できます。低帯域幅の最適化は、ソースとターゲットの両方で
ディレクトリ・レプリケーションとともにレプリケーション・コンテキスト単位で有効
になります。このモードは、NetBackup optimized duplication に対しても有効にでき、
低帯域幅ネットワークにおいてもバックアップ・イメージの複製を可能にします。
•
安全な接続認証。すべての接続はソースとターゲット間で Diffie-Hellman 鍵交換を使用
しています。
•
レプリケーション・レベルでのデータ検証。Data Domain Replicatorは、TCPが提供する
機能に加え、専用のチェックサムを使用して、すべての送信されたデータが正しいこと
を検証します。TCPに埋め込まれたチェックサムは、重複除外の点では十分な強度を備え
ておらず、多数のWANで週あたり数千のエラーを引き起こす場合があります。「EMC
Data Domain Data Invulnerability Architecture」ホワイト・ペーパーで説明されている
ように、ストレージ・レベルでも追加の検証が提供されています。
•
代替ポートの使用。レプリケーションでは、任意の使用可能な Ethernet/IP ポートを利
用できるため、管理者は専用のレプリケーション・ネットワークを構成することにより、
CIFS/NFS ファイル共有を使ったバックアップ用インタフェースとの競合を回避できます。
•
スクリプトおよびレポート・ツールの統合。Data Domain システムには、レプリケー
ション管理のすべてをサポートする、機能豊富なコマンド・ライン・インタフェースが
あります。サード・パーティのレポート・ツールを使用して容易に導入できるように、
すべてのイベントおよびステータス情報はテキストログに格納されます。警告とサマ
EMC Data Domain Replicator
詳細レビュー
16
リー・ステータスは、Data Domain の AutosupportMail プロセスによって配信される
メール・レポートで通知されます。これらのレポートは、EMC 社データドメイン・サ
ポートにも送信され、オンデマンドで最適なカスタマー・サービスを提供するための履
歴として保持されます。
実装におけるベスト・プラクティス
重複除外機能自体が後から追加された補足的なものである他の多くの製品とは異なり、Data
Domain Replicator の機能は、Data Domain システムの挙動の多くに緊密に統合されていま
す。
たとえば、システムをリプレースし、システム間でデータを移行する必要がある場合は、
Data Domain レプリケーション・テクノロジーが使用されます。シンプルなコマンド・セッ
トで、移行元と移行先を指定し、コレクション・レプリケーションと同様のスタイルでデー
タを移行します。さらに、移行完了後に迅速なサービス再開を実現するために、レプリケー
ション・コンテキストを含む構成情報も転送しされます。
バックアップ用途においては、初回のレプリケーションがレプリカ側への転送サイズとして
最大になります。この特別な状況はシーディングと呼ばれ、レプリカへ転送されるものの大
半が一意のデータ・セグメントとなります。シーディングの最もシンプルな方法は、最初の
バックアップの同期が完了するまで同じローカル・ネットワークに両方のシステムを配置し、
シーディング終了後に最終設置場所へレプリカ側システムを移設する方式です。シーディン
グを WAN 経由で実行する場合のには、テープまたは他の任意のローカル・ストアからター
ゲット・システムの一時的な場所にフル・バックアップをコピーすることで対応することも
できます。その場合、ソース・システムがレプリケーションを開始すると、メタデータだけ
がレプリカに転送されます。2 つのシステムが同期すると、テープなどからレプリカ側にコ
ピーした一時的なコピー・イメージを削除できます。セグメントは、この時点でレプリカ・
ディレクトリ上に存在するデータのために使用されているため、削除されずそのまま保持さ
れます。
他のベンダーの実装の場合、シーディングの次に、システムを地理的に別の場所に再導入す
ることが困難な場合があります。Data Domain Replicator では、ネットワーク ID を変更す
るだけで、他はすべてそのまま保持できるため、(ソース・システムと同一 LAN 上など)1
か所でシーディングしてから、それを別の場所に移動させて使用することも容易に実行でき
ます。再配置されたシステムをオンラインにした後(または、長いネットワーク障害の後)
は、システムはレプリケーションを継続するために、再同期化するか、再認証される必要が
あります。コレクション・レプリケーションでは、これはシステムにとって簡単なことです。
セグメント・ローカリティ・コンテナのログを確認するだけです。ディレクトリ・レプリ
ケーションおよび最適化複製では、システムは未変更の要素を確認し、その後の新しいファ
イルを転送する必要があります。どちらの場合も、プロセスは自動で行われ、オペレータが
介在する必要はありません。
ソース側のサイトまたはシステムがリカバリ不能な問題を引き起こしたり、破壊されたりす
る場合があります。これは稀なケースですが、そのような事態に備えておく必要があります。
ある意味で、ソース側のレプリカからのリカバリは、初期化の逆です。適切なレプリカから
新しいソース・システムにデータを移動し直す必要があります。シーディングの場合と同様
に、いくつかの方法があります。
•
コレクション・レプリカからのコレクション・ソースの作成:コレクション・モードを
使用します。
•
ディレクトリ・レプリカからのディレクトリ・ソースの作成:
ƒ ディレクトリ・モードを使用できます。前述したシーディング・プロセスを使用して、
プロセスを迅速化できます。
ƒ コレクション・モードを使用し、ディレクトリ・モードに変換できます。データ転送
はより高速になります。余分なディレクトリが削除され、新しいソース側がレプリカ
に似ている場合は、非常に迅速に再同期化が実行されます。
EMC Data Domain Replicator
詳細レビュー
17
重複除外ストレージの比較:RPO、RTO、DR 時間
レプリケーション手法を検討する際には、よく知られている 2 つのメトリックである RPO
(Recovery Point Objective:目標復旧時点、レプリカでリカバリ可能なデータの古さ)と
RTO(Recovery Time Objective:目標復旧時間、データを使用可能な状態にリカバリするた
めに要する時間)が役に立ちます。重複除外ストレージ・システムを比較するには、さらに
もう 1 つの測定基準を考慮します。適切なサイズのフル・バックアップを開始するときに、
次のことを実行するのにかかる時間を考慮します。
1. ソース・システムでのバックアップおよび重複除外
2. IP ネットワーク経由のレプリケーション
3. レプリカから DR サイトの別のサーバ・セットにデータをリストア
簡潔を期すために、この複合メトリックを「DR 時間」と呼びます。これは、バックアップの
開始からレプリカ・サイトでデータ・リカバリが完了するまでのエンド・ツー・エンドの時
間です。DR での使用を目的とした新しい重複除外ストレージ・システムを比較するコンセプ
ト・テストの結果、これが最も有効なチェック項目であることが実証されています。
リカバリ・ポイント
レプリケーションに長時間かかった場合、レプリカのデータのリカバリ・ポイントは古くなり
ます。最新の複製がすでに存在する場合は、さらに新しい複製がそこに配置されるまでは、引
き続きそれが最良のリストア可能なコピーとなります。たとえば、新しいバックアップが開始
され、その時点でのリカバリ・ポイントは昨日のバックアップだとします。重複除外レプリ
ケーションでは、ユーザーは重複除外された(より帯域幅の小さい)データをレプリケートす
ることしか通常望んでいません。Data Domain システムでは、重複除外は高速でインラインで
あり、レプリケーションをバックアップと同時に実行できるため、短時間で完了することがで
きます。リストア・イメージは、レプリカ側に到達すれば、すぐに使用できます。
重複除外速度が遅いシステム、特に「ポストプロセス」型の重複除外システムのような重複
除外の開始に遅延が生じるシステムでは、レプリケーションにより長い時間がかかります。
ポストプロセス型システムでは、その重複除外スループットは重複除外を行わないストレー
ジのバックアップ・スループットの 2 分の 1 未満と通常考えられます(そうでなければ、2
ステップ・プロセスとその複雑性、境界条件、余剰なディスク・プロビジョニング要件に頭
を悩ますことはありません)。レプリケーションは、重複除外が終了して初めて完了可能に
なるため、通常はレプリカ・サイトへの実際の到達速度が犠牲になります。仮に Data
Domain システムの重複除外速度が現状の 2 分の 1 であると仮定すると、レプリカ・サイトに
データが到達できる速度は 2 分の 1 未満になってしまうということです。
そのため、ポス
トプロセス型の重複除外の場合、リストア・ポイントは、前日の状態からバックアップ・
ウィンドウ 2 回分を追加した時点もしくはそれ以上になります。
一部のシステムでは、さらに次の点も犠牲になります。
•
一部の重複除外システムでは WAN 上で圧縮を行わないため、帯域幅コストが 2 倍になる
か、データがレプリカに到達するまでの時間が 2 倍かかります。
•
一部の重複除外システムは、レプリカ側で継続的な一貫性が保たれません。新たにレプ
リケートされたデータを読み取り可能にするには、バッチまたは手動プロセスを実行し
なくてはならない製品もあります。リカバリを計画する際は、これに必要なタイミング
と労力を考慮しなければなりません。たとえば、毎日のスケジュールに従いバッチで同
期化するシステムでは、重複除外後、ネットワークを経由していると推定されると、
データが到達しても追加の処理・手順が必要となるため、すぐにはリストア可能にはな
りません。そのため、リカバリ・ポイントは昨日のバックアップのままとなります。
EMC Data Domain Replicator
詳細レビュー
18
リカバリ時間
レプリカ側には、重複除外されたデータしか存在しません。リカバリ時間は、レプリカ内の
重複除外プールからのリカバリ速度と同じです。リカバリ時間は、持続的なパフォーマンス
が必要になるため、サイズの大きいデータセットを使用して慎重に計測する必要があります。
SISL アーキテクチャにより、Data Domain 重複除外ストレージはソースとレプリカの両方で
高速リストアを提供しています。Data Domain によって公開されているパフォーマンス・
レートは、重複除外ストレージから読み出されたものだけです。
このドキュメントの発行時点で、ポストプロセス型システムでは、重複除外プール、特にレ
プリカ上の重複除外プールからのリストア速度を公表していません。このことからポストプ
ロセス型システムの公開値(いずれも重複除外を適用していないキャッシュ・ストレージに
対してベンチマークを実施しています)に比べ実際のパフォーマンスは大幅に劣ることが推
測されます。そのため、実際のリカバリ時間は非常に長くなると考えられます。
DR 時間のサマリー
リカバリ・ポイントが確立されたら(より早くリカバリ・ポイントを最新の状態にするため
に、できるだけ迅速に転送することが望ましいです)、リモート・サイト内のシステムでDR
テストを完了できるように、リカバリ・ポイントからのリカバリのスケジュール設定を行う
必要があります。重複除外ストレージ・システムにはさまざまなアプローチが用意されてい
ますが、Data Domainは最近のリカバリ・ポイントの採択とレプリカでのリカバリ時間の短縮
を支持し、積極的に最適化することを選択しています。図 10に示すように、その他は明確に
は選択していません。
図 10:災害発生時にオンサイトとオフサイトの両方でリカバリ可能な今日の企業バックアッ
プ・データ。Data Domain は、このデータをインラインで重複除外し、即座にレプリケー
ションを開始して、リモート・システムへの DR をより迅速に準備できるようにします。ポ
ストプロセス型のアプローチでは、最初にバックアップ・データをディスク・キャッシュに
取り込み、その後、通常は取り込み速度の 50%未満で重複除外を実行します。重複除外とレ
プリケーションが取り込み中に開始されたか、取り込み後に開始されたかに関係なく、これ
らのシステムの DR が準備されるまでにはかなりの遅延が発生します。
EMC Data Domain Replicator
詳細レビュー
19
お客様事例
Data Domain Replicator の基本特性を、次の 3 つのお客様事例でご紹介します。その他にも
多くの事例があり、詳細とともに、Data Domain の Web サイトでご参照頂けます。
N 対 1 のブランチ・オフィス DR の展開
米国の大手投資銀行である Thomas Weisel Partners は、地理的に分散されたテープ・バック
アップ・インフラストラクチャに依存してバックアップと DR 保護を提供しているマルチサイ
ト企業にありがちなバックアップ問題に直面していました。そこでこのお客様は、世界各地
に位置するブランチ・オフィスで Data Domain システムを使用することを決定されました。
これにより、テープをなくし、中央からの集中管理を可能にし、各オフィス内のインフラス
トラクチャを監視することで、リモート・ロケーションのバックアップおよびアーカイブ・
プロセスを管理することができました。これらのリモート Data Domain システムはそれぞれ、
N 対 1 トポロジーの中で、米国のメイン・データセンターに配置されたより大規模な Data
Domain システムへ、ディレクトリ・レプリケーションを使用して、すべてのローカル・バッ
クアップをレプリケートするように構成されています。
従来のテープ・ベースのアプローチでは実現不可能だった、信頼性の高い、ほぼ瞬時にディ
ザスタ・リカバリが完了する運用が実現できました。ソリューションの主なメリットは次の
とおりです。
•
バックアップ・ウィンドウの短縮、ローカルおよび DR サイトからリストアの迅速化、さ
らにすべてのサイトでの 30 日を超える保存を実現します。
•
迅速かつ安全にリモート・サイト・バックアップをレプリケートすることで、効果的な
DR を可能にします。レプリケートされたデータは、バックアップ・ジョブ完了後 1 時間
以内に同期化されています。
•
テープの取り扱い/保管のコストを削減します。さらに、WAN 帯域幅とテープ・メディア
のコストも削減します。
•
テープのオペレーションを 1 か所のデータセンターに統合し、アーカイブ・コピーを月
に 1 度生成することで、管理オーバーヘッドが大幅に削減されます。
2 か所のデータセンターによる大規模な DR の展開
某大手金融機関は、米国東部の 2 か所のメイン・データセンターおいて、DD690 コントロー
ラで構成される Data Domain DDX アレイを TSM バックアップ用のプライマリ・ストレージ・
プールとして配置しています。9/11(ナイン・イレブン)以降の規制により、組織は次の
バックアップ・サイクルを開始する前に、安全でリカバリ可能なオフサイト・バックアッ
プ・コピーを保持することが求められています。これにより、実行可能なアプローチとして
は、テープ搬送での対応は事実上不可となります。代わりに、1 か所のデータセンター内の
TSM クライアントがもう一方のデータセンター内のテープやディスクのプールに直接バック
アップできるように、Dark Fiber による広帯域幅 WAN が検討されました。しかし、関連する
距離を経由するネットワークのレイテンシーが原因で、大量のミッション・クリティカルな
データベースの転送およびアプリケーション・データを使用可能なウィンドウ内で保護する
という技術的な課題に直面しました。さらに、プライマリ・バックアップ・コピーの損失を
防ぐために、引き続き、セカンダリ・テープ・コピーを作成し、オフサイトに輸送する必要
がありました。これは、毎日の TSM 運用において必要なハウスキーピングおよびレクラメー
ション・プロセスと矛盾し、結果的に運用コストが多額になるだけでなく、テープの取り扱
いとオフサイト保管に伴うセキュリティ上およびビジネス上のリスクをももたらします。
DDX アレイが各ロケーションに導入され、すべての TSM クライアントが、ローカルの Data
Domain システムをターゲットとして、プライマリ・ストレージ・プールにバックアップする
ように再構成されました。各データセンターのシステム間には、双方向ディレクトリ・レプ
リケーションが構成されました。バックアップ・ジョブが引き続き実行されている間も、重
複除外されたデータは、もう一方のデータセンター内の Data Domain システムに自動的に転
EMC Data Domain Replicator
詳細レビュー
20
送されます。重複除外がもたらすデータの大幅削減というメリットにより、レプリケーショ
ンは、ネットワーク経由でネイティブ TSM バックアップを実行するより 1 桁少ない帯域幅だ
けを利用して、バックアップの完了後数分以内で完了しています。帯域幅の節減がかなり大
幅なため、IP ベースの Data Domain レプリケーション・トラフィックを、データセンター間
で用意された汎用の Ethernet 帯域幅を介して転送し、Dark Fiber レプリケーション・ネッ
トワークを廃止することができました。この結果、毎月発生する料金が数千ドル節減されま
した。
現在、組織は、TSM クライアントのオンサイトおよびオフサイトのリカバリ SLA(Service
Level Agreement)を満たすための機能を改善する一方、レガシーのテープ・ベースのインフ
ラストラクチャに関連する運用コストとビジネス上のリスクを大幅に削減する、完全に自動
化されたテープ・レス・バックアップ・インフラストラクチャを保持しています。ソリュー
ションの主なメリットは次のとおりです。
•
テープを使用せず、完全に自動化された TSM バックアップおよびディザスタ・リカバ
リ・プロセスを展開。
•
ローカル・バックアップとレプリケーションに移行することで、オンサイトとオフサイ
トの両方のデータ保護とリカバリにおいて定義済み SLA に対するパフォーマンス・メト
リックを改善。
•
テープの取り扱いと保管をなくし、レプリケーションに必要な帯域幅を削減することで、
データ保護と DR の運用コストを削減。
•
高価な Dark Fiber バックアップ・ネットワークを廃止した結果、月額数千ドル以上を
節減。
レプリケーションによる大規模ファイル・アーカイブの展開
ある大手半導体メーカーは、F5 ARX ファイル仮想化アプライアンスと Data Domain 重複除外
ストレージを組み合わせて使用し、コスト効率の良いアーカイブ層を実現しています。ARX
システムが統合されたファイル・システムのネームスペースを提供し、プライマリ・スト
レージ・ファイラーから Data Domain システムへ移行された 70 TB に及ぶファイルへのシー
ムレスなアクセスを可能にしています。このプロセスは、従来の高価な NAS ファイラーに格
納されている比較的古くアクセス頻度の低いファイルを識別し、それらに悪影響のない方法
で Data Domain システム上のディレクトリに移動する ARX アプライアンスのポリシーによっ
て自動化されます。Data Domain 重複除外ストレージによって、このデータの格納に必要な
物理ディスク量が 80%以上削減できるため、電力、冷却、空間の運用コストを大幅に削減で
きます。米国中央部のデータセンターから東海岸の DR サイトへ数百万のファイルを効率的に
移動するために、コレクション・レプリケーションが使用されています。
このプロセスは自動化されているため、継続的に帯域幅が 90%以上削減されるだけでなく、
F5 ARX アプライアンスによって両サイトのデータへのシームレスなアクセスが可能になりま
す。主なメリットは次のとおりです。
•
F5 ARX アプライアンスを使用して、古くて使用頻度の低いデータを自動的かつシームレ
スに Data Domain 重複除外ストレージに移行することで、従来の高価な NAS ストレージ
の領域を最大 70 TB まで解放。
•
アーカイブ層の物理ストレージ要件を 80%まで削減するとともに、電力、冷却、空間に
関する運用コストを削減。
•
最大で 90%減の帯域幅でコレクション・レプリケーションを使用して、数百万のファイ
ルへのサイト間アクセスを実現。
EMC Data Domain Replicator
詳細レビュー
21
最後に
重複除外ストレージでは、WAN にまたがる堅牢なレプリケーションにより、ディスク・ベー
スのリカバリと人手を介さない分散データの移動という両方のメリットを可能にします。
Data Domain Replicator は、Data Domain ストレージ・システム設計との緊密な統合を通じ
て、レプリケーションへのシンプルで堅牢なポリシー・ベースのアプローチとともに、分散
型企業における最適化およびトポロジー要件を満たす広範なオプションを提供しています。
DD Replicator は、Symantec NetBackup の OpenStorage インタフェースに対応した業界初の
最も成熟したサポートを含め、最も幅広くバックアップおよびアーカイブ・アプリケーショ
ンをネイティブにサポートできます。Data Domain システムは、インライン設計、高速重複
除外、およびレプリカ重複除外プールからの高速リストアを通じて、競合する重複除外スト
レージ設計と比べて RPO(目標復旧時点)、RTO(目標復旧時間)、DR(ディザスタ・リカバ
リ)時間という点で大きなメリットを提供します。
EMC Data Domain Replicator
詳細レビュー
22
Fly UP