Comments
Description
Transcript
こちら - NEC
7-E クラウドで見過ごされがちな 可用性の課題と事業継続の勘所 ~海外の災害対策事例付き~ 2013/11/14 日本電気株式会社 システムソフトウェア事業部 佐藤 陽一 クラウドのメリットと課題 Page 2 クラウド環境の利用目的 Page 3 コスト削減 ビジネスの変動に素早く対応 ECO(省電力化) 評価/テスト環境用途 前提 クラウドで見過ごされがちな留意点 クラウドであっても、物理サーバは存在する DBサーバ メールサーバ ゲストOS ゲストOS 仮想マシン 仮想マシン 物理サーバ ヒトが作った機械が介在する以上、絶対落ちないシステムはあり得ません! Page 4 可用性への考慮が足りないと・・・ ▐ システム停止による影響例 企業活動への影響例 業種 システム停止による影響例 金融業 •市場経済活動の停止による、大きな社会的影響 •社会的信用の失墜 製造業 •生産活動の停止に伴う経済的損失 •元請・下請企業への影響とそれにともなう信用の失墜 •機会損失 流通業 •販売活動の停止による経済的損失 •社会的信用の失墜 業務別に見る影響例 業務 システム停止による影響例 メールシステム •社内・顧客との情報伝達の効率低下による 営業活動への影響 生産システム •生産活動停止による、期間損失 •納期遅延による、CS低下 受発注システム •生産活動の停止による機会損失 •受注作業の停止による機会損失・顧客からの信用失墜 ファイルサーバ •共有ファイルへのアクセスができないことによる作業等の停 滞 ▐ 最悪の事態 顧客への損害賠償 政府による行政指導 ・・・ 情報システムの停止は、自社ビジネスへの影響はもちろん、他企業や 社会へも影響を与え、経営へのダメージは計り知れません。 Page 5 クラウド事業者が提供する解決策 ハード障害時に仮想マシンごと切り替える DBサーバ メールサーバ DBサーバ メールサーバ ゲストOS ゲストOS ゲストOS ゲストOS 仮想マシン 仮想マシン 仮想マシン 仮想マシン サーバダウン 物理サーバ Page 6 物理サーバ クラウドを利用するときの考慮点 仮想マシン内のソフト障害は 検知できない サービスダウン 計画メンテナンス時には 業務が停止する OSのホットフィックス適用時、アプリ ケーションリビジョンアップ時など DBサーバ メールサーバ Windows Linux 仮想マシン 仮想ハードウェア 切断 仮想マシン 移動せず DBサーバ Windows 仮想マシン ゲストOS再起動 Page 7 単体サーバシステムにおけるシステム停止要因 単体サーバシステム停止要因から可用性を検討する 障害発生による停止 ① 24% ② ③ ④ Ⓐ Ⓔ 計画保守停止 76% (内訳) 37%:Ⓐ 13%:Ⓑ 12%:Ⓒ 7%:Ⓓ 7%:Ⓔ (内訳) 9%:① 6%:② 5%:③ 4%:④ OS/ドライバのパニック アプリケーションエラー ハードウェア障害 その他の障害 Ⓓ Ⓑ Ⓒ OSアップグレード/サービスパック・ホットフィクス適用によるOS再起動 アプリケーションインストール/アプリケーション保守 OS設定変更を反映するためのOS再起動 新しいハードウェアの接続と設定を有効にするためのOS再起動 その他によるOS再起動 出典元:マイクロソフト社調べ2005/6、「Windows Server 2003, EEの信頼性」資料 Page 8 クラウドのHAによるシステム停止要因のカバー範囲 クラウドのHA機能ではシステム停止要因の21%しかカバーできない 単体サーバシステム停止要因 ① ② ③ ④ Ⓐ Ⓔ Ⓓ Ⓑ クラウドのHA機能に よるカバー範囲 21% (内訳) 9%:① OS/ドライバのパニック 5%:③ ハードウェア障害 7%:Ⓓ 新しいハードウェアの接続と 設定を有効にするためのOS再起動 Ⓒ 可用性にはまだまだ課題が多いことが否めない Page 9 CLUSTERPRO X による障害対策 Page 10 障害発生時に業務を継続 システム異常を確実に検知し、業務をフェイルオーバ シングルサーバの場合 クラスタリングサーバの場合 フェイルオーバ 障害発生 業務停止 障害発生 業務継続 アクセスする宛先 はそのままでよい ・ 保守担当が駆けつけるまで業務停止 ・ 別のサーバが自動的に業務継続 ・ ビジネス機会損失 ・ ビジネス機会の損失を最小限に抑える ・ 企業としての「信用」失墜 ・ 導入した企業は安心してビジネスに臨める Page 11 計画メンテナンスでも業務継続 待機系よりメンテナンスして、フロント業務を止めない* ① システム停止要因 業務 (内訳) 障害発生による停止 9%:OS/ドライバのパニック発生 6%:アプリケーションエラー発生 5%:ハードウェア障害発生 4%:その他の障害 計画保守停止 76% (内訳) 24% 保守 ④ 単体 サーバ 37%:OSアップグレード/サービスパック・ ホットフィクス適用によるOS再起動 13%:アプリケーションインストール/ アプリケーション保守 12%:OS設定変更を反映するためのOS再起動 7%:新しいハードウェアの接続と設定を有効にするためのOS再起動 7%:その他によるOS再起動 (出典元:マイクロソフト社調べ2005/6、「Windows Server 2003, EEの信頼性」資料 ② 業務 業務 ③ 業務 保守 *:クラスタ化で、保守による業務停止時間を業務移行時間だけでOK! Page 12 異常発生を素早く察知 現用系サーバが業務継続できる状態なのか?を広範囲に監視 ルータ、その他のネットワーク機器 現用系 アプリケーション層 アプリケーション層 アプリケーション 正常応答監視 存在監視 監視エージェント OS層 ★待機系も常に監視! ハングアップ監視 OS層 ハングアップ監視 OS空間 ハードウェア層 アクセスチェック アクセスチェック NICリンクダウン監視NIC システム ディスク NIC HBA システム ディスク NIC HBA クラスタパーティション ユーザデータ Page 13 待機系 Ping応答監視 OS空間 ハードウェア層 検出可能な特定アプリケーション障害 監視Agent(オプション)の導入によりハングアップ・異常状態まで監視可能 単なるアプリケーションの存在監視だけでなく、定期的に正常応答が返るか確認します。 もしもハングアップや異常を検知した場合、フェイルオーバして業務継続できます。 Agent(オプション)なしの場合 障 害 発 生 プロセスが消滅すると 異常と判定 アプリケー ション起動 Agent(オプション)ありの場合 ハング アップ アプリケーションの ハングアップは 検出しない アプリケー ション起動 Agentが定期的に対象の アプリケーションをチェック アプリケーションの ハングアップを 検出できる。 Agent Agent × アプリケーションのハングアップ検出 ○ アプリケーションのハングアップ検出 × アプリケーションからのレスポンス異常検出 ○ アプリケーションからのレスポンス異常検出 ○ アプリケーションの異常終了(要:存在監視設定) ○ アプリケーションの異常終了 (要:存在監視設定) Page 14 CLUSTERPRO X 監視Agent 大切なアプリケーションのハングアップや異常状態まで詳細に監視します! ▌ 利用ケースの多い、6つのカテゴリーに対応 データベース (Database Agent) Oracle, SQL Server, DB2, ODBC, PowerGresなど Linux Oracle, DB2, Sybase, PostgreSQL, PowerGresPlus, MySQL Solaris Oracle, MySQL, PostgreSQL (File Server Agent) Linux Solaris アンチウイルスソフト IIS, SMTP/POP/IMAP4, HTTP,HTTPSなど Linux apache, httpd, sendmail, postfix, popdなど アプリケーションサーバ (Application Server Agent) Windows Linux Samba, NFS Tuxedo, WebLogic, WebSphere, Oracle ASなど (Anti-Virus Agent) Windows ウイルスバスター コーポレートエディション Page 15 (Internet Server Agent) Windows Windows ファイルサーバ インターネットサーバ OS、JavaVMのリソース監視 (System Resource Agent / Java Resource Agent) Windows Linux ・OSのシステムリソース ・Java実行基盤の監視 障害検出後の業務切替(フェイルオーバ)のフロー だいたい1分前後でサーバは切り換わる ①障害検出 ③切替ディスク ④フローティング ②アプリ停止 非活性 IP非活性 ①障害検出 アクティブ フェイルオーバグループ非活性 ここまでの目安1分前後 ⑤フローティング ⑥切替ディスク ⑦アプリ開始 IP活性 活性 スタンバイ フェイルオーバグループ活性 ②アプリケーション停止 ⑦アプリケーション開始 ③共有ディスク(ミラーディスク)非活性 ⑥共有ディスク(ミラーディスク)活性 ④仮想(フローティング)IPアドレス非活性 ⑤仮想(フローティング)IPアドレス活性 OSシステムログに記録、AlertServiceによる通報 Page 16 ●フェイルオーバグループ クラスタサーバが利用するリソースの集ま りです。フェイルオーバグループがノード間 を移動します。同一グループに属するリ ソースは必ず一緒にノード間を移動しま す。 主流のクラスタ構成 業務のデータ容量に応じてクラスタ構成(ディスク構成)を選択可能 SAN接続 共有ディスク型 データミラー型 パブリックLAN パブリックLAN G インターコネクトLAN G インターコネクトLAN 兼 ミラーコネクトLAN サーバダウン監視経路 G 業務のグループ ▐ サーバの内蔵ディスクを業務データ引継ぎに利用 したクラスタ ▐ 内蔵ディスクを使い低コストで高可用なシステム が構築可能 Page 17 共有ディスク FC接続 iSCSI接続 ▐ 共有ディスクを業務データ引継ぎに利用したクラ スタ ▐ 共有ディスクの特長である高性能/高信頼/大容 量を活かしたシステムが構築可能 もちろん仮想化にも対応 仮想化環境の可用性を向上する、仮想化環境型構成 ▐ 仮想化環境でのクラスタ構成 物理サーバのクラスタ化と同じように、仮想マシンのクラスタ化が可能 仮想マシンの中から幅広くシステムを監視 <障害検知範囲> ▐ハードウェア(仮想マシン)観点 業務を フェイルオーバ ①システムディスクのI/O障害 ② 業務データ格納用ディスクのI/O障害 ③ ネットワークのI/O障害 障害 業務 VM1 仮想化基盤 業務 ▐ソフトウェア観点 VM2 ④ ゲストOSのハングアップ ⑤アプリケーションの停止、 またはハングアップ 仮想化基盤 KVM vSphere XenServer IBM PowerVM <対応仮想化基盤> Page 18 Solaris コンテナ(ゾーン) Hyper-V クラウド環境でも自動切換えできる「CLUSTERPRO」 様々なクラウド環境で提供される仮想マシン上で動作確認済み! NECビッグローブ 伊藤忠 テクノソリュージョンズ様 IDCフロンティア様 Amazon Web Services LLC 様 NTTコミュニケーションズ様 日本ユニシス様 マイクロソフト 様 ニフティ 様 クラウド環境への対応状況 http://jpn.nec.com/clusterpro/clp/cloud/cloud_sysrep.html Page 19 (再掲)クラウドを利用するときの考慮点 仮想マシン内のソフト障害は 検知できない サービスダウン 計画メンテナンス時には 業務が停止する OSのホットフィックス適用時、アプリ ケーションリビジョンアップ時など DBサーバ メールサーバ Windows Linux 仮想マシン 仮想ハードウェア 切断 仮想マシン 移動せず DBサーバ Windows 仮想マシン ゲストOS再起動 Page 20 CLUSTERPROならクラウドでの業務も安心! 仮想マシンの障害対策 仮想マシンの計画メンテナンス アプリケーションを 切り替え 障 害 アプリケーションを 切り替え アプリケーション アプリケーション 計画メンテナンス ゲストOS 仮想マシン ゲストOS 仮想マシン ▌ 仮想マシンの中から幅広く監視 ▌ 切り替えは業務アプリケーション単位に起動 ゲストOS 仮想マシン ゲストOS 仮想マシン ▌ 仮想マシンの計画メンテナンスに対応 ▌ アプリケーションの停止と起動で切り替え ▌ ゲストOS再起動を伴う際の影響が小さい Page 21 クラウド化すると・・・仮想マシンの中が業務の本質 クラウド環境であっても業務の継続がサービス提供継続のカギ Page 22 導入事例(クラウド) 株式会社レストラン・エクスプレス様 クラウド上にOSSを用いて基幹システムを構築。 事業成長や業態の追加へ柔軟に対応できる高可用でスケーラブルな仕組みを実現。 導入の目的 従来のシステムでは、新しい業態が増えたと きのシステム追加・拡張に大きなコストが掛 かった。事業の成長に合わせてスケーラブル に拡張できるシステムが必要だった。 導入によるメリット/システム構成 既存のシステムをクラウド化し、柔軟性と拡張性 を確保。さらにクラウド環境の動作をサポートして いるCLUSTERPROを用いて基幹システムに求め られる可用性を確保した。 従来のシステムを拡張するのに比べ10分の1の コストで同機能を実現できた。以下コメント抜粋 『操作性がよく、まるで空気のような存在。』 『全てのサーバを一度で設定変更できて、管理者 が本来の運用管理業務に集中できる。」 事例詳細 仮想OSは CentOS (IDCフロンティア社のクラウドサービスを利用) http://www.nec.co.jp/library/jirei/restaurantexpress/ Page 23 導入事例(遠隔クラスタ) 広域/狭域の災害対策にCLUSTERPROの導入事例が増加中 実績リスト 業種 区間 電力系 東京⇔沖縄 部材管理 業務用途 形態 1,500km データベース 1対1ミラー 千葉⇔神奈川 50km データベース 1対1ミラー 財務会計 東京⇔名古屋 260km データベース 1対1ミラー 金融A 東京⇔江ノ島間相当 50km データベース ハイブリッド 金融B 千葉⇔神奈川 80km データベース ハイブリッド インフラ 大阪⇔東京 390km データベース ハイブリッド 製造A 敷地内 100m データベース 1対1ミラー 製造B 工場間 5km データベース 3対1ミラー 自治体 敷地内 500m データベース 1対1ミラー 事 例 2 距離 事 例 1 ・クラスタソフトによるストレージ・ミラーを低価格で実現 ・通常はメインサイトで運用、災害時にバックアップサイト に手動切替 距離 50km メインサイト バックアップサイト 建物B (バックアップサイト) データベース 建物A (メインサイト) データミラーリング データベース 共有ストレージ ・火災対策として工場間でクラスタ化 Page 24 共有ストレージ 遠隔クラスタ、ケーススタディ(海外事例) ケース 保険A ・扱うデータや業務の性質が非常にクリティカルであるため、災害対策を検討 ・運用管理/操作の容易性、費用対効果の高さ、システムの堅牢性が評価され、 CLUSTERPROの遠隔データミラー型クラスタを採用。 ジェッダの洪水(2011) 「我々のテクノロジーパートナーとして NECを選んだのは非常に懸命な判断でした。 ジェッダで洪水が起きた時、他社がシステム停止により多大な被害を受けたのに 対し、我が社は簡単な操作だけで素早く業務再開ができた。 このとき、我々は NECとNajTechこそが最高のテクノロジーパートナーであると確信しました。」 「我々は20分以内に通常通りの運用に戻すことが出来たのです」 保険A社 IT技術マネージャの言葉 メインサイト 30km DRサイト Oracle Oracle Windows Server 2003 水害 発生 Windows Server 2003 1. 水害発生時に20分以内 の業務再開を実現 2. 企業スタッフの生産性が 15%増加 3. 主要アプリケーションの ダウンタイムを90%削減 ミラーリング Page 25 導入の効果 4. ユーザ満足度が20%上昇 遠隔クラスタ、ケーススタディ(海外事例) ケース 政府機関 Lenel社のOnGuardを使用したアメリカ連邦政府機関のゲート認証システムにおいて、 FTサーバとCLUSTERPROを使用した遠隔クラスタリングで、災害対策を実現。 導入の目的 2 OnGuard Clients 4 OnGuard Panels 40 Km ゲート認証システムにおいて、万一の災害 によるサイトダウンに備え、バックアップサ イトでの業務継続を可能とする災害対策 が求められていた。 New York, NY Value 3 2分以内の 自動フェイルオーバ Newark, NJ LAN SQL Server 2000 Windows 2000 Corporate Network T1 WAN (1.5Mbps) クラスタ Interconnect EXPRESSCLUSTER 導入によるメリット/システム構成 FTサーバ LAN Value 1 99.999% (現用系) CLUSTERPROによる遠隔クラスタリングによ り、災害によるサイトダウンが発生しても「最 小限のダウンタイムで」、「データは完全保障 したまま」バックアップサイトでの業務継続を 可能とするDR(災害対策)ソリューションを 構築。 さらに、メインサイトのサーバにはFTサーバを 採用することにより更なる高可用システムを 実現。 Page 26 SQL Server 2000 Windows 2000 EXPRESSCLUSTER (待機系) Value 2 データの同期ミラーリング iStorage Sシリーズ NEC Corporation of America EXPRESSCLUSTER製品ページ(英語) http://www.necam.com/entsw/ExpressCluster/ (※1)CLUSTERPROは、海外ではEXPRESSCLUSTERの名称で販売しています。 (※2)上記Webページに関するお問い合わせは<[email protected]>まで お願いいたします。 BIGLOBEクラウドアプリストアで CLUSTERPROを始めよう! Page 27 CLUSTERPROで月額利用可能 ▌クラウドアプリストア第一弾の対応製品として登場 ▌月額利用サービスで必要な時に必要な分だけ利用可能 クラウド アプリストア クラスタリングソフトウェア CLUSTERPRO X リレーショナルデータベース Microsoft® SQL Server® アプリ利用料金 とクラウド料金は まとめて支払い 便利で 魅力的なアプリ を拡充 アプリベンダ パートナーによる 事前検証済み Page 28 お客様 クラウド上の サーバに導入しやすい 提供形態 必要なアプリを ワンストップで入手 クラウドを利用するときの悩み Page 29 クラウドアプリストアでお悩み解決 問合せ対応も安心! 初期費用ゼロ! クラスタリングを月額料金で利用できる! 費用もBIGLOBEにまとめて支払い! 問合せはBIGLOBEにすればよい! 障害 OS 仮想サーバ OS 仮想サーバ 月額サービス クラウドアプリストアなら、クラスタリング環境をシンプルにご利用いただけます! Page 30 おわりに Page 31 転載禁止 IDC調査: 12年連続・国内Windows+Linux 高可用クラスタソフトNo.1 クラウドや遠隔間クラスタなど広いニーズに応え、シェアトップを独走! 2012年 OS別売上 2012年 総合売上No.1 Linuxは大型案件の受注により17.8%増と2桁成長 Windowsは4.4%増、Hyper-V環境の案件も増加 ←UNIX+Linux+Windowsの総合 ライセンス売上+メンテナンス 売上が調査対象。 H C No.1 2.3% B 9.0% 売上 41.5% A 11.4% H F 11.5% 売上 45.8% E 20.2% D 14.6% 2.6% 5.3% 6.0% B 9.1% 6,444百万円 (単年) No.1 I Linux Windows その他 G 12.3% 3.9% 32.1% F CLUSTERPRO売上実績の推移 売上 4.3% E 6.2% B D 6.8% A 14.3% Windows版とLinux版を合算した市場で 10.5% 12年連続 No.1 C 6.9% 出典:IDC Japan、2013年7月 「国内システムソフトウェア市場 2012年の分析と2013年~2017年の予測」 (J13310103) Page 32 2001年 2002年 No.1 No.1 2003年 2004年 No.1 No.1 2005年 2006年 No.1 No.1 2007年 2008年 2009年 2010年 2011年 No.1 No.1 No.1 No.1 No.1 2012年 No.1 転載禁止 海外でも高い実績・評価 NECが No.1 日本を含むアジアにおいて4年連続シェアNo1達成 国内のWindows版とLinux版を合算した市場でも12年連続シェアNo1達成 アジア(日本を含む) 国内 No.1 12.3% G 3.9% 32.1% F 4.3% 23.8% 売上 H B 6.5% 7.5% 売上 E 6.2% D C 6.8% E 15.2% 14.3% 10.5% No.1 H 2.3% 10.4% A B 6.9% Linux A No.1 その他 H 2.6% No.1 Windows I 5.3% B 9.0% C 6.0% 売上 B 9.1% A 11.4% D 14.6% 41.5% F 11.5% 売上 45.8% E 20.2% (EXPRESSCLUSTERは、CLUSTERPROの海外名称です) Source:IDC Japan、2013年7月 「国内システムソフトウェア市場2012年の分析と2013年~2017年の予測」 (J13310103) IDC AP、2013年8月 「Asia/Pacific (Excluding Japan) Availability and Clustering Software Market Analysisand Forecast Update」 (AP2670321U) Page 33 構築を安心して任せられる、認定技術者増加中! 全国に技術認定の取得者が多数居ります 最寄の販売店にお声掛けください 200社突破! 合格者 800名 (2013年10月末現在) ▌ CLUSTERPRO技術認定制度は、CLUSTERPROを構築するに あたり必要な知識・技能を修得いただくための構築パートナー向け 認定制度です。 ▌ 既に200社800名が全国に居りますので、 安心して導入をお任せください。 全国各地で開催中! 開催実績 東京 大阪 北海道 名古屋 静岡 愛媛 高知 石川 新潟 長野 大宮 詳しくはこちら→ http://fcc.express.nec.co.jp/clpnintei/ ※東京以外の開催日程、および個別開催についてはお問合せください。 Page 34 本日のまとめ クラウド基盤の障害/災害でも業務継続を実現するCLUSTERPRO X の特長 クラウドでも業務停止リスクを最小化 豊富な監視機能により、精確な障害検知が可能 障害時だけでなく広域災害時にも業務継続が可能 安心の実績No.1 CLUSTERPRO が お客さまの大切な業務を守ります! Page 35 製品ご紹介サイト/お問い合わせ先 製品ご紹介サイト http://jpn.nec.com/clusterpro/ (フル機能が使える試用版をダウンロードできます!) (ドキュメント多数公開中: (随時更新中)) お問い合わせ先 [email protected] 秋葉原でデモをご覧いただけます サーバ/PC等、こだわりの展示品もご覧になれます クラサバ市場秋葉原店 http://www.nec.co.jp/products/express/ichiba/ ・定休日 月・日・祝 ・電話番号 03-5294-9802 ・営業時間 11:00~17:00 Page 36 関連展示のご案内 106 70:クラウド基盤の障害/災害でも業務継続する CLUSTERPRO X 要更新 106:お客様の業務を止めない 高信頼・高可用性プラットフォーム 現在 位置 Page 37 Page 38 Page 39