...

DR4000 Architecture の概要

by user

on
Category: Documents
15

views

Report

Comments

Transcript

DR4000 Architecture の概要
DR4000
Architecture の概要
目次
はじめに ................................................................................................................... 2
重複除外と圧縮の概要 .................................................................................................. 2
Dell DR4000 ソリューション – 概要 ................................................................................... 3
DR4000 の構成要素 ...................................................................................................... 3
データ重複除外ワークフロー .......................................................................................... 4
データ整合性機能 ........................................................................................................ 5
レプリケーション ........................................................................................................ 6
ハードウェア ............................................................................................................. 6
ネットワークアーキテクチャ(ローカル) .......................................................................... 7
ネットワークアーキテクチャ(リモート) .......................................................................... 7
このホワイトペーパーは情報提供のみを目的として作成されたものであり、誤字脱字や不正確な技術情報が含まれて
いる場合があります。 本書の内容は現状のまま提供され、その内容について明示または黙示にかかわらずデルはい
かなる責任も負いません。
© 2012 Dell Inc. All rights reserved. Dell Inc. の書面による許可なく、文書を無断で複写、複製、転載することを禁
じます。 詳細については、デルにお問い合わせください。
デル 、デルの ロゴ、およびデルの バッジは Dell Inc. の商標です。インテルと Xeon は、米国およびその他の国におけ
る Intel Corporation の 商標です。 本書では、上記以外の商標や名称が該当のマークおよび名称の権利を有する団体
またはその団体が所有する製品を示すために使用されている場合があります。 他社の商標および会社名は、一切デ
ルに帰属するものではありません。
2012 年 1 月
1
はじめに
バックアップはしばしば見過ごされがちですが、データの整合性とリカバリのために不可欠な要素です。
過去 20 年間でプライマリストレージテクノロジーは目覚ましい発展を遂げましたが、これらの技術的利
点も、効果的なバックアップ / リストア戦略に取って代わるには十分ではありません。
あらゆる規模の組織で生成されるデータの急激な増加に伴い、より効果的かつ革新的な方法でバックアッ
プ / リストア要件を満たすシステムに対する需要が増大しています。 かつては、テープがデータのバッ
クアップに対する最も有力な媒体でした。 しかし、テープによるソリューションは、今日の情報インフ
ラに対するパフォーマンス、信頼性、および管理の利便性の要件を満たすことはできません。 そして、
最適なバックアップテクノロジーとして、重複除外や圧縮などの機能を備え、ディスクへのバックアップ
をサポートするシステムが登場しました。
Dell ™ DR4000 ディスクバックアップシステムは高性能のディスクベースのバックアップ / リカバリアプ
ライアンスであり、インライン型の重複除外と圧縮、高度なデータ保護、レプリケーションなどの革新的
な機能を提供します。 さらに、管理機能、容易な導入、そしてコアバックアップデータをこれまでより
も長くディスク上に留め、オンライン状態を維持できるアーキテクチャにより、バックアップに伴う複雑
さを軽減することができます。 これらの機能を包括的なライセンスモデルと併用した場合、非常に優れ
た総所有コスト(TCO)を実現することができます。
重複除外と圧縮の概要
DR4000 は高度な重複除外 / 圧縮テクノロジーを実装しているため、必要なストレージ容量を大幅に削減
することができます。
重複データは、複製した仮想マシンイメージファイル、E メールの添付
ファイル、ファイルの重複コピーなどにより発生し、それにより、必要
なストレージの容量が増加します。 重複除外テクノロジーは、ファイ
ルレベルまたはブロックレベルでデータの重複を特定し、排除します。
また、データを圧縮して、スペース効率性を向上させることができます。
DR4000 は「zlib」(圧縮速度が最も速く、圧縮率は最低)または「oca_
bbb」(圧縮速度は最も遅く、圧縮率は最高)のいずれかの圧縮アルゴ
リズムを使用して、インライン圧縮 / 重複除外を実行します。アルゴリ
ズムは、DR4000 管理コンソールで選択できます。
zlib アルゴリズムはデータをメモリ上または読み込みながら圧縮するた
め、より迅速な圧縮が実行しますが、圧縮容量に制限があります。 デ
ルが開発した oca_bbb アルゴリズムは、はるかに大量のデータを圧縮
できますが、圧縮速度は zlib よりも遅くなります。
図 1: 重複除外
2
Dell DR4000 ソリューション – 概要
DR4000 は高性能のディスクベースのバックアップ / リカバリアプライアンスであり、導入と管理が簡単
にできます。 このアプライアンスは 2.7 TB、5.4 TB、および 9 TB のストレージ容量で利用でき、小規模
企業やリモートオフィス環境での導入に最適です。
DR4000 は次のような一連の優れた機能を備えています。
•
•
•
•
•
•
•
インライン型の重複除外と圧縮
重複除外レプリケーション
高度なデータ保護
レプリケーションライセンス
無停止での導入
NFS、CIFS、および将来の OST プロトコルのサポート
シンプルな管理機能
DR4000 の構成要素
DR4000 ファームウェアはコンテンツ対応型のインライン重複除外 / 圧縮エンジンを実装しています。 ソ
フトウェアアーキテクチャの構成要素は次の通りです。
•
フロントエンドプロトコル層 : この層は、受信 I/O のプロトコルをサポートするための層です。 サポ
ート対象のプロトコルは NFS と CIFS です (OST と NDMP は今後のリリースでサポートされます)。
•
重複除外 / 圧縮エンジン : アーキテクチャの主要要素。 重複除外エンジンは高度なチャンキングと重
複除外アルゴリズムを実行し、省スペースを実現します。
•
取り込みバッファ : DR4000 はインライン型の重複除外と圧縮を実行します。 高速 NVRAM にある取
り込みバッファに受信データを受け取り、重複除外エンジンによって取り込みバッファ内のデータが
処理されます。
•
ディスクストレージ構造 : ディスクにはいくつかの主要なデータ構造が格納されているため、効率的
な重複除外 / 圧縮作業が可能になります。 これらのデータ構造には以下が含まれています。
¾ ディクショナリ : このファームウェアは、ユーザーデータの入力処理中に検出されたすべての固有デ
ータチャンクへの参照リストを保持しています。 ディクショナリは、すべての固有のパターンに関
する動的なリストで、重複除外の基盤となっています。
¾ データスーツケース : 実際の固有データチャンクのリスト。 ディクショナリにはデータスーツケース
内の固有データチャンクへの参照が含まれています。
¾ ブロックマップ / オブジェクトマップスーツケース : チャンクへのユーザーデータのマッピングをス
ーツケースに保存するためのマッピングファイルです。 ユーザーデータの処理中に、スーツケース
内でチャンクと参照が一致する場合は、データの重複コピーを保存するのではなく、データスーツケ
ース内でそれらのチャンクに対する参照回数が増加します。
3
プロトコル層
図 2: DR4000 重複除外ソフトウェアのアーキテクチャ
データ重複除外ワークフロー
以下の図では、DR4000 ファームウェア内のデータと I/O のライフサイクルの詳細が示されています。 各
I/O は次の手順で処理されます。
1.
受信データは高速 NVRAM キャッシュ内の取り込みバッファに送信されます。
2.
同ファームウェアはラビン指紋アルゴリズムを実行してチャンクを隔離します (このアルゴリズム
は固定サイズのチャンキングに比べて、非常に優れた重複除外結果を生み出しています)。
3.
ステップ 2 で決定されたチャンクは、一致の有無を確認するためにデータディクショナリのパターン
と比較されます。
a) 一致が見つからない場合、チャンクデータは保存されます。
b) 一致が見つかった場合、ブロック / オブジェクトマップと参照回数が更新されます。 受信チャン
クは破棄されます。
4
元のデータ
システムがデータの
チャンクを選択する
ディクショナリでフィンガ
ープリントを探す
フィンガープリントが
取得される
データのチャンクが
保存される
いいえ
一度保存
したものかどうか
重複除外の
プロセス
はい
チャンクが破棄
される
参照回数が
+ 1 される
オブジェクトマップが
更新される
重複除外済みの
データ
Figure 3: Deduplication workflow
データ整合性機能
バックアップは、本番稼働システム上のデータリカバリの
ために利用できるすべての手段が失敗した場合、または実
行できない場合に実行されるのが一般的です。 バックア
ップはユーザーによって日常的に検証されることがないた
め、バックアップシステムが最も重要なタスクとしてデー
タ保護に対応することが不可欠です。
DR4000 は、いくつかのハードウェアとソフトウェアの機
能で構成され、最適な状態で組み合わせることで、卓越し
たデータ保護を実現しています。 ソリューションの構成
は以下の通りです。
•
•
NVRAM
Early Write 検証機能
継続的なデータ検証
表面スキャン
RAID6
ソフトウェア
o 継続的なデータ検証 : 既存のデータは定期的に読み取られ、チェックサムを比較してデータ
整合性を検証します。
ハードウェア
o NVRAM: 停電時でも確実にデータを保護します。
o 表面スキャン : ハードウェアがデータの不一致を報告および / または修正できない場合に実
行されます。
o RAID6: DR4000 上のすべてのデータはホットスペア対応の RAID6 により保護されます。 この
RAID レベルは、二重のドライブ障害時にもデータを保護することが可能です。
継続的なデータ検証と表面スキャンはバックグラウンドで実行されるため、コアバックアップと重複除外
作業が中断されることはありません。
5
レプリケーション
DR4000 は、1 つのノードから別のノードにレプリケーションすることができます。 レプリケーションは
コンテナごとに構成されます。つまり、いくつかのコンテナまたはすべてのコンテナをシステム上にレプ
リケーションすることができます。 レプリケーションはソースまたはターゲットの DR4000 から実行す
るために構成することができ、DR4000 内で特定のフラグと基準に基づき、次の 2 つのモードで実行します。
•
再同期レプリケーションは、レプリケーション構成時に既存のデータが含まれたコンテナ上でレプリ
ケーションが有効化されたときに実行されます。 レプリケーションは、ソースのネームスペースボ
リュームのスナップとクロールを行うことによって実行されます。 再同期レプリケーションサイク
ルは、メンテナンスモードの修復によりいくつかのファイルが削除された後、およびレプリケーショ
ンログファイルが満杯または破損したときにも実行されます。 再同期レプリケーションがアクティ
ブな場合、ログ機能により、スナップが取られた後のソースデータボリュームに対するすべての変更
のログが自動で開始されます。
•
ログベースのレプリケーションは、レプリケーション構成時にコンテナに既存データが含まれていな
い場合、または再同期レプリケーションサイクルがボリュームに保存されている既存データをすべて
処理済みのときに実行されます。 ログはソースコンテナ内に格納されます。ターゲットコンテナに
アクセスできない場合でも、ログは保持されます。 ログサイズには制限がありませんが、物理的な
ディスクサイズの制約を受けます。
ハードウェア
DR4000 ソリューションは、業界標準の PowerEdge サーバハードウェアを採用しており、その仕様は以下
の通りです。
•
•
•
•
•
•
デュアルインテル Xeon E5645 2.53 Ghz プロセッサー
32 GB、1333 MHz デュアルランク RDIMM
2 台の 2.5 インチ 300 GB(10,000 RPM、6 Gbps)の SAS 内蔵ドライブ(オペレーティングシステム用)
12 台の 3.5 インチ 300 GB、600 GB、または 1 TB(6 Gpbs)の SAS ドライブ(データストレージ用)
4 つの 1 Gb イーサネットまたは 2 つの 10 Gb イーサネット Base-T
8G NVRAM カード - NVRAM カードは、8 GB DDR3 DRAMM に加えて、16 GB SD チップと 2 台の超大容
量コンデンサを備えています。 停電時には、超大容量コンデンサが供給するバックアップ用電源を
使用して、DRAM からのデータが永続的なフラッシュメモリにコピーされます。
6
ネットワークアーキテクチャ(ローカル)
DR4000 アプライアンスは、バックアップシステムをサポートするネットワークインフラストラクチャ
に配置され、CIFS または NFS 共有によって接続できます。 DR4000 は、4 つの 1 GB ポートまたは 2 つの
10 GB ポートを使用してネットワークに接続します。 これらのポートは結合されており、自動負荷バラ
ンシング(ALB)または 802.3ad プロトコルを使用したチャネル結合としてセットアップすることができ
ます。 最高のパフォーマンスを得るためには、802.3ad の統合されたリンクとしてポートを結合するこ
とをお勧めします。
DR4000 の導入(ディザスタリカバリを行わない場合)
ネットワークアーキテクチャ(リモート)
DR4000 アプライアンスは、バックアップシステムをサポートするネットワークインフラストラクチャに
配置され、CIFS または NFS 共有によって接続できます。 ディザスタリカバリノードは、レプリケーショ
ンのためにプライマリ DR4000 を CIFS または NFS 共有で接続できるリモートサイトに配置できます。
DR4000 の導入(ディザスタリカバリを行う場合)
7
Fly UP