Comments
Description
Transcript
重複排除ソリューションで、 99%以上のデータ削減は本当か?
重複排除ソリューションで、 99%以上のデータ削減は本当か? 企業がバックアップすべきデータは増え続けている。そこで注目を集めているのが重複排除のソリューションだ。 重複排除でどこまでデータを削減できるのか、そして投資対効果はあるのかを解説する。 このパンフレットは TechTargetジャパン (http://techtarget.itmedia.co.jp/) に 2009 年 10 月に掲載された記事をもとに制作されています。 7http://techtarget.itmedia.co.jp/tt/news/0910/21/news02.html ●重複排除率99%は本当か? データ保護やコンプライアンスのため、バックアップ作業は企業システムでは欠かすことのできないものとなっ ている。その結果、データを保管するバックアップ用途のストレージが増えて運用管理コストも増える、というの が一般的だ。その対策としては、バックアップデータを圧縮したり差分バックアップなどの方法でバックアップデー タを少なくする工夫が以前から行われてきた。だが、それらの工夫だけでは限界がある。そのための技術として 登場したのが重複排除だ。重複排除が考え方として当を得たものであることは間違いない。では、どのようにし て重複排除しているのだろうか。 同じデータで重複しているものがあれば保存しないというのが重複排除のルールだ。このルールに従えば、 バックアップ後のデータ量が元のデータ量より減るのは当然である。しかし、ある文書の内容の一部を変更し ファイル名も変更して保存すると、一般的には別のデータと認識される。 シマンテックの「Veritas NetBackup PureDisk」 (以下、PureDisk)は、ファイルレベルではなくブロックレベルで の重複排除を実現している。ファイルを一定サイズのセグメントに分割して、データが同じかどうかを照合する。 つまり、前述の例のような文書の一部を変更してファイル名を変更して保存しても、変更部分に当たる部分のセ グメントだけの追加バックアップで済むので、より重複排除率は高まる。 では、実際にデータをどれほど削減できるのだろうか。シマンテックが公開している例を2つ挙げてみよう。ある 公営企業では714Gバイトのデータをバックアップしたところ、1.5Gバイトになった (重複排除率99.8%) 。もう1社 の消費財企業では2683Gバイトのデータをバックアップしたところ、20.79Gバイトになった (重複排除率99.2%) 。 この 2 つの実例を見て分かるように、99%以上の重複排除も可能だ。とはいえ、重複排除の効果はファイルタ イプやシステム構成によっても差があるのが実情だ。実際に自社で導入した場合の重複排除の効果がどれほど になるかを知りたい場合、シマンテックが提供している無償アセスメントプログラムを利用するという手がある。 このアセスメントを利用することで効果の一端を知ることができる。 会社名 重複排除率 元データ 重複排除後のデータ 公営企業 99.8% 714Gバイト 1.5Gバイト 消費財企業 99.2% 2683Gバイト 20.79Gバイト ●重複排除ってハードウェアを追加するだけでいい? 重複排除技術を利用できる製品として市場に先に出回ったのは、 「重複排除機能対応バックアップ用ストレージ」 といった専用ハードウェア製品だ。 これらのハードウェア製品を導入する場合、自社の重複排除後のデータ量を想定してストレージ容量を決めて から購入する。重複排除した上でのデータとはいえ、バックアップデータは時間の経過とともに増える。重複排除 後のデータ量は、利用環境に応じて異なることと、保存対象の期間を考慮すると多くのユーザーは、ある程度容 量に余裕があるハードウェアを購入する必要性が出てくる。 バックアップの運用は、数週間や数カ月というスパンで使われることは少ない。容量に余裕を持って購入した はずのハードウェアであっても、バックアップ運用の継続とともに、いずれ購入した製品の容量を使い切ってしま う時期が来る場合もある。 専用ハードウェアを利用している場合、その段階で大きな問題が浮かび上がる。 それはコストの問題である。重複排除という付加機能を持つ高価な専用ハードウェアを追加購入しなければな らないためだ。バックアップ後の保存容量に比例してストレージのコストが決まるのは当然としても、通常のスト レージと比較すると専用ストレージの容量単価はかなり高い。また、既存分と追加分の専用ストレージ間で、一貫 性のある重複排除が効く製品は少ない。 ●投資対効果はいつ出るのか? 一方のPureDiskは重複排除機能を実現するソフトウェアモジュールであり、データを保存するストレージは限定 しない。このため、容量不足が心配されるようになったら、ごく一般的なストレージやIAサーバを追加すればいい。 さらに PureDisk を利用する場合は、バックアップ先ストレージの残り容量を見ながら少しずつ容量を増やして いくといったことも可能だし、統合バックアップ対象の部署が順次増えていった場合にも対応しやすい。 PureDisk は複数のハードウェアにまたがる重複排除でもメリットがある。専用ハードウェアによる重複排除の 機能では、複数のハードウェアにまたがる重複排除の機能に制限があったりするケースがあるが、PureDisk の場 合はノードを追加して拡張することで、複数の PureDisk を 1 つにまとめて管理でき、追加した PureDisk を含めて 全体での重複排除が可能となる。つまりPureDisk による重複排除であれば、ハードウェアの追加やノードの追加 などにも柔軟に対応でき、スケールしやすいというメリットがあることに加え、下図のように、重複排除後にデー タをストレージに転送するため、ネットワークコストや、運用コストなどの削減にも即効性がある (図)。 活用例 中央データセンター 顧客サイトA PureDisk クライアント 顧客サイトB 仮想化環境 2. ネットワーク コスト削減 低帯域 ネットワーク NetBackupクライアント /エージェント VMware ESX 1. ストレージ コスト削減 NetBackup メディアサーバ 低帯域 ネットワーク 顧客サイトC PureDisk クライアント PureDisk クライアント 4. 管理コスト削減 PureDisk ストレージプール テープ保管庫 PureDisk クライアント 3. バックアップ 時間削減 帯域幅を最適化したデータ転送 (クライアントサイドでの重複排除) 通常のデータ転送 重複排除エンジン (PureDisk Agentのインストール先) 図 PureDisk は、バックアップ時間の削減だけではなく、さまざまなコスト削減に寄与する テープライブラリ 高価な専用ハードウェアを必要に応じて追加して購入するよりも、PureDisk のようなソフトウェアによる重複 排除の方が、長期的なランニングコストでは優位である。ライセンス体系もそれを後押しする。PureDisk のライ センス体系が、フロントエンド型といってバックアップ元の容量で決まるためだ。 例えば現在、複数のサーバにまたがって総容量 4Tバイトのデータをサーバ上で運用していているとしよう。こ のデータを重複排除した上でバックアップする場合、PureDisk の場合はこのバックアップする前の 4Tバイトに課 金される。それに対して専用のハードウェア製品では、専用のハードウェアの購入費用のほか、重複排除後のデー タにも重複排除のライセンス費用が掛かるケースが多い。仮に重複排除率が 90%であれば重複排除後のデータ である 400Gバイトに課金されることになるが、実際どれぐらい削除できるかは、環境によって変わるために分 からない。しかもバックアップ先のハードウェアの容量が不足すると、先ほども述べたように、高価な専用ハード ウェアを追加購入する必要がある。さらにハードウェアごとに重複排除のライセンス費用が必要とされることが 多い。 だからこそ、重複排除ソリューションを導入する前には、長期間運用することを前提に、どれほどコストに 差 が 付くかを、十分検討してほしい。 ●バックアップは本当に楽になるの? PureDisk 利用のメリットは、バックアップソフトウェアとの連携でも表れている。データ保護市場で大きなシェ アを 誇る シマンテックの「NetBackup」との 統 合が 実 現 されているからだ。既 存 の NetBackup システム へ PureDisk をアドオンとして容易に追加導入できるのもメリットの1つだ。 さらに、PureDisk の最新版では新しい機能が追加されている。その1つが、仮想合成バックアップである。 企業で扱うデータが急激に増えたため、週末の 48 時間を使ってもフルバックアップが終わらないというケース が増えている。その対応策として増分バックアップを利用する方法がある。この方法は、リストアする場合に最新 のフルバックアップ後のすべての増分バックアップデータを正しい順序でリストアする必要があり、リストアする のに手間と時間がかかるというデメリットも併せ持っている。 最新版の「PureDisk 6.6」では、ストレージ内に保存されている過去の完全バックアップと、後に追加された増 分バックアップを合成してフルバックアップイメージを生成することができる。リストア用の完全バックアップ作成 をバックアップサーバに負荷を掛けずに可能で、バックアップサーバのリソースを本来の目的のためだけに使うこ とになる。これだといざという場合のリストアを迅速に、容易に実現できるというメリットがある。 ●だからこそPureDisk ここまで 見てきたように、専用の ハードウェア製品と比べ、Pure Disk は柔軟性と拡張性を併せ持つ。長期運用を前提としたお得なラ イセンス体系と、シマンテックの持つバックアップソフトウェア製品と の連携も大きな魅力だ。だからこそ PureDisk は真剣に導入を検討す べきソリューションといえる。 まずは、PureDisk を購入を検討する前に、購入の妥当性を見いだ すためにシマンテックの提供している無償アセスメントプログラムを 選んでみるのも1つの方法だろう。 最新版の「PureDisk 6.6」の新機能の 1 つは、 仮想合成バックアップができること ■シマンテックの 重 複 排 除ソリューションの 詳 細については 、下 記 のサイトをご覧ください。 http://www.symantec.com/jp/chofuku-haijo ■ シマンテックの 重 複 排 除ソリューションの 詳 細については 、下 記のサイトをご覧ください。 http://www.symantec.com/jp/chofuku-haijo Copyright ©2009 Symantec Corporation. All rights reserved. SymantecとSymantecロゴは、Symantec Corporationまたは関連会社の米国およびその他の国における登録商標です。 その他の会社名、製品名は各社の登録商標または商標です。 製品の仕様/価格は、都合により予告なしに変更することがあります。本カタログの記載内容は、2009 年 12 月現在のものです。 株式会社シマンテック お問い合わせ先 〒107-0052 東京都港区赤坂 1-11-44 赤坂インターシティ www.symantec.com/jp/contact E0912AD0-md -PDITMEDA