...

重複除外とは - Acronis

by user

on
Category: Documents
15

views

Report

Comments

Transcript

重複除外とは - Acronis
ホワイトペーパー
あらゆる規模の
企業に利点をもたらす重複除外機能
アクロニス ホワイトペーパー
®
Copyright © Acronis, Inc., 2000 – 2009
ホワイトペーパー
目次
エグゼクティブサマリー .................................................................................................. 3
重複除外とは ................................................................................................................... 4
•
ファイルレベルの重複除外
•
ブロックレベルの重複除外
•
データ整合性を保つ対応策
重複除外の利点 .............................................................................................................. 5
•
全体的利点
•
ソース側で重複除外する場合の利点
•
ターゲット側で重複除外する場合の利点
まとめ .............................................................................................................................. 7
Acronis Backup & Recover 10 Deduplicationの導入 ........................................................... 7
•
アクロニスの重複除外製品の優位点
•
高速ハッシュアルゴリズム:最適化ソース重複除外の重要な要素
次の段階に向けて ............................................................................................................ 10
2
ホワイトペーパー
エグゼクティブサマリー
プライマリストレージは企業の規模に関係なく、毎年50∼100%の割合で拡大し続けています。また、2008年下半期の
IDC調査では、全世界で生成され、保存されるデジタルデータの量が、わずか3年で3,000%以上増加しているという結
果が発表されました。さらに、複数の拠点を持つ企業の多くは、より省スペースで省エネルギーなハードウェア環境を
実現するために、仮想化を含めたシステムの統合およびデータ資産の統合に取り組んでいます。
重複除外によって、ストレージの保存・管理にかかわる
運営費用を大幅に削減できます。
データ重複除外機能の利点は既によく知られていますが、企業における最も基本的な利点は以下のとおりです。
•
一定の予算内ではるかに多くのバックアップデータを保存できる
•
ディスクを追加購入する頻度が大幅に減る
•
ディスクの費用対効果の向上によってディスクの高速性を活用できるため、テープが不要になる
•
バックアップウィンドウを効果的に短縮できる
重複除外がこのようにコスト効率の良いデータ量削減方法であるにもかかわらず、それを使用していない企業が多いの
は何故でしょうか。最近まで、専用ハードウェアを使用する重複除外製品は非常に高価であったため、小規模事業では
検討の対象から外されてきました。製品を購入できた企業でも、企業の保有する全データの半分がワークステーション
のデータで占められることが多いにもかかわらず、同じくコスト上の理由により、サーバーのデータに対してのみ重複除
外製品を使用していました。しかし、ソフトウェアのみで機能する重複除外製品は、あらゆる規模の企業が購入を検討
できる価格帯であり、また、ワークステーションのデータの重複除外も現実的なものになりました。
このホワイトペーパーでは、重複除外とは何かを明らかにしてその利点を詳細に説明します。さらにWindows® 環境と
Linux®環境で重複除外機能を使用した場合のビジネスケースも作成します。
3
ホワイトペーパー
重複除外とは
重複除外とはストレージシステム内の重複データを除去するために設計された機能で、バックアップとして保存する必要
があるデータの量を削減する効果があります。重複除外機能は、ファイルレベルまたはブロックレベルで機能します。
レベルによる動作の違い
ファイルレベルの重複除外
ファイルレベルの重複除外では、完全に同じ内容のファイルを検索して1つだけを保存し、その他のコピーは保存された
ものへの「ポインタ」に置き換えられます。ファイルレベルの重複除外は、他のどのような重複除外手法よりも効率的で
すが、ファイルにわずかな変更を1つ加えただけでも追加のコピーを保存することになります。
ブロックレベルの重複除外
ブロックレベルの重複除外は、全体のストレージ効率を確実に大きく引き上げます。この重複除外では、データサイズ
が4KB以上のチャンクを対象にして重複情報のインスタンスを検索し、コピーの数がいくつあるかに関係なく1つだけ保
存します。これらのコピーは、元データのブロックを参照するポインタに置き換えられます。この置き換えはユーザーに
対してシームレスに実行されるので、ユーザーは、データのすべてのブロックが単独で存在している場合と同じように
ファイルを使用し続けることができます。
重複除外機能によって、ストレージのデータ量を最大90%削減できます。
重複除外の効果を説明するために、例をあげてご説明いたします。多くの画像を含む9MBのMicrosoft® PowerPoint®の
プレゼンテーション資料を社内にいる10人の同僚に電子メールで送信した場合、バックアップシステムにどのような影
響があるかを考えてみましょう。[送信]ボタンをクリックすると、9MBのファイルから10個のコピーが複製されます。各
受信者のデータが従来の手法でバックアップされた場合、プレゼンテーション資料の各インスタンスがバックアップさ
れ、保存されます。9MBだったファイルが、一瞬でバックアップストレージの99MBの領域を占有するようになります。
日々発生するデータ複製の他のインスタンスがこのようにして数百倍に増加することがわかれば、ディスクストレージ
の要件とそれにかかるコストが急速に増大した理由もすぐに理解できるでしょう。
重複除外は、ストレージの導入コストの削減と、ネットワーク帯域幅の節約を同時に実現できる実績のある方法です。
重複除外によって、ストレージユニット当たりのデータストレージ容量を増加させる(データストレージの追加購入の
時期を引き延ばす)こと、またはオンラインデータを保持する期間を延長することが可能になります。
電子メールサーバー
ファイルサーバー1
ファイルサーバー2
バックアップ
Acronis Storage Server
ユーザーは、単にRAW容量に対してではなく、ストレージを最大限に利用してよ
り大きな容量を実現するツールへの投資を始めることができるようになりました
(例:シンプロビジョニング、データ重複除外、ストレージ仮想化)。
IDCストレージシステム調査主任Natalya Yezhkova 2009年1月
4
ホワイトペーパー
次のページの図に示されている全体の処理(左側)は、以下のように実行されます。
•
「ソース側」での重複除外機能では、データをターゲットディスクに書き込む前に、重複データを除去します。
•
「ターゲット側」での重複除外機能では、ディスクに既に書き込まれている重複データを特定し、除去します。
重複除外が重要な理由とは
重複除外機能によってデータ量を大幅に削減できるため、多くの企業で、すべてのバックアップをディスク上に保持でき
るようになります。そのため、アーカイブとして長期間保管する場合を除き、テープストレージとオフラインテープスト
レージは不要になります。この移行によって、管理者はディスクベースのデータ保護ソリューション固有の機能を使用し
て、バックアップと復元をより短時間で完了できるようになります。また、重複除外機能によって、数年間にわたって生
成されるレポートのコピーをすべて保存することが可能になるため、政府機関が定めた報告要件および会計報告の要
件に簡単に対応できます。
データ整合性への懸念に対する対応策
重複除外機能によってディスク領域の使用量を大幅に節約できますが、その一方で、高密度のデータを正しく保存する
ことが極めて重要になります。既に説明したPowerPointのプレゼンテーション資料の例で示したように、複数のソース
で検出された重複するデータブロックに対して重複除外を実行した場合、後でそのデータブロックが失われると、それ
に関連するすべてのバックアップが損傷を受けることになります。これは、データブロックの消失によって、ソースデー
タが存在しなくなるためです。この問題は、システムの完全バックアップにも当てはまります。災害が発生した場合、
Windows OSの極めて重要な部分に対応する1つのデータブロックが損傷すると、システム復元に利用できなくなりま
す。こういった危険を避けるために重複除外されたデータの保存にはRAIDを使用した高レベルのデータ保護をお勧め
いたします。
企業における重複除外の利点
一般的な利点
重複除外機能を使用することで各ストレージユニットに従来の何倍ものデータを保存できるようになります。また、も
う1つの使い方として、オンラインデータを保存する期間の延長を選択することもできます。どちらの使い方を選択した
場合でも、企業にとっては、以下のような利点があります。
•
ネットワーク帯域幅を効果的に節約 - ソース側で重複除外を実行する場合は、コピーをネットワーク経由で送信す
る必要がありません。
•
グリーン環境 - プライマリサイトとリモートサイトの両方で従来よりも省電力、省スペースでデータを保存できます。
•
コンプライアンスの遵守 - ストレージを拡張しなくても、法律または企業が定めたコンプライアンス要件に対応で
きます。
•
短期間での投資回収 - 購入して維持するストレージの数を削減できるため、従来よりも短期間で投資を回収できます。
•
バックアップウィンドウの短縮 - データのコピー自体をバックアップするのではなく、データへのポインタをバック
アップすることで、実際にバックアップされるデータの量が非常に少なくなります。
•
ストレージの総所有コストの削減 - ストレージの数が減ることで、総所有コストも削減されます。
5
ホワイトペーパー
ソース側で重複除外を実行する場合の利点
ソース側(またはサーバー側)での重複除外には、以下のような利点があります(下図の上側)。
•
ターゲットストレージまでネットワーク経由で転送されるデータ量を、大幅に削減します。
•
潜在的な通信のボトルネックを解消します。特に、既存のネットワーク帯域に余裕が無い場合、または帯域制限され
た通信回線を経由してリモートオフィスのバックアップを実行している場合に効果があります。
•
アプリケーション認識型であるか否かにかかわらず、保存されているすべてのタイプのデータに対して機能します。
•
ターゲット側にハードウェアやクライアントを追加する必要が無いため、導入が簡単です。
主な欠点
バックアップの時間が長くなり、データの重複除外処理でCPUサイクルを大量に消費することがあるため、稼働中のコン
ピュータでパフォーマンスの問題が発生する可能性があります。ですが、本書の後半に詳述のとおり、ソース側での重複
除外時のパフォーマンス低下は、パフォーマンス最適化ソース重複除外と呼ばれる新しいテクノロジーによってほとん
ど解消できます。
ソース側での重複除外とターゲット側での重複除外の比較
ターゲット側で重複除外を実行する場合の利点(上図の下側)
ターゲット側での重複除外は、ソースのバックアップが完了した後で、通常、接続ストレージノード(ASN)上のターゲッ
トストレージがある場所で実行されます。
主な利点とは
CPUに大きな負荷をかける重複除外をソースコンピュータから移動させることによってバックアップウィンドウが短縮で
き、ソース側での初期バックアップを短時間で完了できます。ターゲット側での重複除外は、重複除外を認識しないクラ
イアントとデータソースである場合、またはソース側での重複除外に関連する処理のオーバーヘッドによってバックアッ
プウィンドウの長さが設定した時間制限を超えるような場合に適しています。
6
ホワイトペーパー
主な欠点
重複除外が実行される前のコピーはネットワーク経由で送信する必要があるため、帯域幅がボトルネックになる可能性
があります。ソース側での重複除外とターゲット側での重複除外のどちらを選択するかは、クライアントのCPU処理の
オーバーヘッドと、帯域幅のどちらの制約を最も重要と考えるかによって決まります。
まとめ
これまで主に大企業で使用されてきた重複除外製品は非常に高価で、操作方法の習得に時間がかかり、ファイル単位
の重複除外のみに対応していました。また、障害発生時の復元にも限界がありました。これまで重複除外製品は高価格
であったため、大企業でなければ導入が困難でした。また、ほとんどのITインフラストラクチャでワークステーションレ
ベルに膨大な量のデータを保持しているという状況にもかかわらず、主にサーバーでのみ使用されてきました。
重複除外製品のほとんどは、ソフトウェアとハードウェアを組み合わせたソリューションとして設計・販売されてきまし
た。多くの場合、ハードウェアの価格が高く、適正な価格を実現することは困難でした。その事実を示す例として、ある
有名なベンダーは、2009年3月にハイエンド向けのデータ重複除外アプライアンスの価格を3分の1以下に引き下げまし
たが、12TBのストレージ容量で13万ドルという価格は、まだ高いと言わざるをえません。このような障壁によって、重複
除外製品の導入は最大手の企業のみに限られてきました。
しかし今、ついにこの障壁は取り除かれ、多くの企業で重複除外製品が利用できるようになったのです。
•
大企業だけではなく、データストレージに関して課題を抱えている小規模事業でも重複除外製品を使用できます。
•
サーバーだけでなく、ワークステーションでも重複除外製品を使用できます。
Acronis Backup & Recover 10 Deduplicationの導入
アクロニスの重複除外製品には、以下のように、他の多くのベンダーが提供する製品にはないいくつもの利点があります。
•
ソース側での重複除外またはターゲット側での重複除外の選択
多くの企業で部署ごとにどちらの側で重複除外を実行すべきか異なっており、選択できる必要があります。
•
ファイルレベルおよびブロックレベルのバックアップ
ファイルのみのバックアップには、重複除外による経費削減に限界があります。
•
ソース側での高速な重複除外
多くの場合、ターゲット側での重複除外が不要になります。アクロニスの製品は、ソース側での重複除外におけるCPU
負荷を画期的に軽減できるようになったため、ほとんどの企業でターゲット側での重複除外を実行するサーバーやア
プライアンスにジョブをオフロードする必要がなくなります。現在では、より多くの企業が手頃な価格で重複除外製
品を購入して、サーバーだけではなく、ワークステーションでも利用できるようになりました。
•
Acronis Backup & Recovery製品との統合
Acronis Backup & Recovery 10ソフトウェアとシームレスに連携して機能するため、重複除外されたデータも重複し
ていないデータと同じように保護されます。
7
ホワイトペーパー
Acronis Backup & Recovery 10 Deduplicationは、Acronis Backup & Recovery 10 ソフトウェアに完全に統合できるオ
プションモジュールです。ソフトウェアのみで実現できるソリューションであるアクロニスの重複除外製品は、Acronis
Backup & Recover 10ファミリーの以下の「Advanced Edition」と共にご購入いただけます。
•
Advanced Server Edition
•
Advanced Workstation Edition
•
Advanced Server SBS Edition
•
Advanced Server Virtual Edition
アクロニスの重複除外製品の利点
他の多くの重複除外ソリューションとは異なり、アクロニスの製品ではソース側とターゲット側の両方の重複除外をサ
ポートしています。また、以下のようないくつかの点でも他社製品と異なっています。
•
イメージベースのバックアップ
バックアップデータの重複除外が可能なため、ネットワーク帯域幅またはストレージ容量を節約できます。
•
アクロニスの災害復旧ソフトウェアとの完全な統合
重複除外されているか否かにかかわらずファイルとシステムの復元を数時間や数日ではなく数分で行えます。数ギ
ガバイトに達するオペレーティングシステムなど、イメージ内にある大きなデータソースの複数のコピーを保存する
必要がなくなります。
•
各種のバックアップをサポート
重複除外機能は、完全バックアップ、増分バックアップ、差分バックアップに適用できます。
•
手頃な価格
アクロニスは、ソフトウェアのみで機能する重複除外製品を手頃な価格で提供します。
•
一般的なストレージハードウェアで使用が可能
アクロニスの重複除外製品では、高価な専用ハードウェアを使用する必要がありません。
•
高速なインストール
ハードウェアとソフトウェアを組み合わせたシステムのように稼働させるまでに数日もかかるようなことはなく、通
常約1時間で稼働します。
•
取り扱いが容易
アクロニス製品に共通する特徴として、取り扱いが容易でわずかなトレーニングを実施するだけで利用できるた
め、アクロニスの重複除外製品も簡単にセットアップして使用できます。
特に、Acronis Backup & Recovery 10で利用可能なアクロニスの強力な圧縮アルゴリズム(およびその他の機能)を組み
合わせることで、圧倒的なストレージ効率が実現します。アクロニスの強力なデータ圧縮ユーティリティと併用すれば、
ファイルのタイプにもよりますが重複除外後は平均50∼60%の圧縮率となるため、全体のデータストアサイズを削減
でき、ディスクストレージ容量の大幅な節約になります。データ自体の圧縮は、再パック処理の間に接続されたストレー
ジノードを使用して実行できるので、本番環境で稼働しているサーバーに処理の負担がかかりません。アクロニスの.tib
ファイルと重複除外データストレージブロックの両方が圧縮されます。
8
ホワイトペーパー
高速ハッシュアルゴリズム:最適化ソース重複除外の重要な要素
アクロニスでは、ソース側での重複除外を実行するためのより効率的なアプローチを提供しています。そのアプローチ
をご説明するために、まずは、ソース側での重複除外に使用される標準的なアルゴリズムについて見てみましょう(下
図)。図では、最初にクライアントソフトウェアがバックアップされるデータのデータチェックサム(「ハッシュ」と呼ばれ
る)を計算します。次に、このハッシュはターゲットに送信され、ハッシュを受け取ったターゲットは、応答として「デー
タを保持していない」または「データを保持している」のいずれかを返します。応答として「データを保持していない」
が返された場合、クライアントは、次の部分に進む前に実際のデータをターゲットに送信します。応答として「データを
保持している」が返された場合は、クライアントソフトウェアからそれ以上の操作を行う必要がないので、図に示すよう
に、データの次の部分が処理されます。
標準的なソース重複除外
しかし、標準的なソース重複除外では、ターゲットにデータが存在するかどうかに関係なく常にハッシュを計算するの
で、大きなオーバーヘッドが発生します。ソースによってハッシュが提供される前に、ターゲットがデータの存在の有無
を通知することはできないので、ハッシュの計算は不可欠なためです。負荷の大きいシステムでは、標準的なソース重複
除外がシステムの速度を低下させることがあるため、IT管理者が重複除外機能の使用に反対する可能性があります。
9
ホワイトペーパー
アクロニスでは、ソース側での重複除外をほとんどの企業で実行可能なオプションとするために、CPU負荷が小さいア
プローチを提供しています。これは、
「パフォーマンス最適化ソース重複除外」と呼ばれています。この強力なアルゴリ
ズムによって、まだターゲット上に書き込まれていないデータの完全ハッシュを計算する必要がほとんどなくなります。
アクロニスのパフォーマンス最適化ソース重複除外
アクロニスのこのアプローチでは、データが変更された場合に変化する可能性が統計的に最も高い少量のデータを選
択することによって、
「高速ハッシュ」を作成します。高速ハッシュは非常に高速に実行され、
「データを保持していな
い」または「データを保持している可能性がある」のいずれかを返します。応答として「データを保持していない」が返
された場合は、クライアントによって実際のデータが送信されます。応答として「データを保持している可能性がある」
が返された場合は、完全ハッシュが計算され、ターゲットは確実な応答を返します。
セキュリティ対策として、アクロニスの製品は重複除外されたデータを暗号化しています。格納域を作成する際に、格
納域をWindowsセキュアストレージで保護するための暗号化パスワードを指定できます。そのパスワードがなければ暗
号化されたデータにアクセスできないため、重複除外されたデータストレージの格納域からデータを取り出せなくなり
ます。
10
ホワイトペーパー
次の段階に向けて
アクロニスは重複除外製品を最初に提供した企業ではありませんが、イメージをベースとした高速バックアップと即時
復元という当社の技術によって、重複除外製品を新しいレベルに飛躍させました。つまり、ファイルとシステム両方の
バックアップデータに対して、また、サーバーとワークステーションの両方に重複除外機能を実行できるようになったの
です。アクロニスは価格および操作性の面で重複除外製品をより導入しやすいものにしました。アクロニスは、資金的
な面と扱いやすさの面の両方で、より多くのユーザーが重複除外製品を以前よりも手軽に利用できるようにしました。
重複除外機能をAcronis Backup & Recovery 10と併用すれば、従来の定義を超えたデータ保護を実現できます。
重複排除製品を導入してみたいと思われた方のために、試用版をご用意いたしました。
(重複除外製品の試用版の使用
には、Acronis Backup & Recovery 10(試用版がダウンロード可能)も必要となります。)
詳細については、当社のWebサイトhttp://www.acronis.co.jp/をご覧いただくか、または本書の巻末に記載されている
連絡先までお問い合わせください。
詳細情報については、http://www.acronis.co.jp/をご参照ください。
大企業/中小企業向け販売:
電子メール:[email protected]
OEMに関するお問い合わせ:
電子メール:[email protected]
Copyright © 2000-2009 Acronis, Inc. All rights reserved.Acronis、
Acronis Compute with Confidence、
Acronis Backup & Recovery、
およびAcronisロゴは
Acronis, Inc.の商標です。WindowsはMicrosoft Corporationの登録商標です。記載されているその他の名称は、
各所有者の商標または登録商標である可
能性があり、
そのような可能性を考慮して扱う必要があります。技術的な変更および図との差異が生じる可能性があり、
誤りが含まれている可能性があ
ります。2009-06
11
Fly UP