...

VCEMプロファイル フェールオーバの例

by user

on
Category: Documents
17

views

Report

Comments

Transcript

VCEMプロファイル フェールオーバの例
Virtual Connect Enterprise Managerによる
プロファイルのフェールオーバおよび移動
概要 .................................................................................................................................................... 2
VCEMプロファイル フェールオーバの概要 ................................................................................................. 3
主要コンポーネント ............................................................................................................................. 3
プロファイル フェールオーバ:例 ........................................................................................................... 4
プロファイル フェールオーバの開始 ...................................................................................................... 5
プロファイル フェールオーバの内部処理 ................................................................................................ 5
VCEM Job Manager ...................................................................................................................... 5
フェールオーバの開始 .................................................................................................................... 5
フェールオーバ ジョブが実行する処理 ............................................................................................... 6
プロファイル フェールオーバの機能および制限事項 ................................................................................ 6
推奨事項およびベスト プラクティス ....................................................................................................... 7
ハードウェアの互換性に関する特記事項 ................................................................................................... 8
インストールと設定のチェックリスト ............................................................................................................ 8
すべてのインストール ......................................................................................................................... 8
フェールオーバを実行する前のインストールと設定のチェックリスト .............................................................. 9
スペア ベイとスペア サーバの設定および管理........................................................................................... 9
手動によるフェールオーバの開始 ........................................................................................................... 10
HP SIM自動イベント処理を使用したフェールオーバの開始.......................................................................... 12
コンセプト ....................................................................................................................................... 12
フェールオーバ用のHP SIMイベントの選択 ........................................................................................... 13
HP SIMの監視機能 ...................................................................................................................... 13
クリティカルなサーバハードウェア障害の決定 ................................................................................... 13
サーバからのクリティカル イベントの報告 ........................................................................................ 14
HP SIMの「システム到達不能」イベント ............................................................................................. 14
フェールオーバ イベントとサービス レベルの評価 ............................................................................. 14
インストール済みのフェールオーバ イベントが選択された理由 ............................................................. 15
VCEM 1.10と同時にインストールされるフェールオーバ イベント ........................................................... 15
イベント時のフェールオーバでのHP SIM処理の使用 .............................................................................. 15
イベント時にフェールオーバを開始するHP SIM処理の設定...................................................................... 16
独自のスクリプトを使用したフェールオーバの開始 ................................................................................. 22
リモート システムを使用したフェールオーバの開始 ................................................................................... 22
リモート モニタリングとVCEMプロファイル フェールオーバ ...................................................................... 22
エンクロージャ名とベイ番号によるCLIの使用......................................................................................... 22
リモート システムを使用してシステムを監視する際の制限事項: .............................................................. 23
まとめ ................................................................................................................................................. 23
1
概要
Virtual Connect Enterprise Manager(VCEM)のプロファイル フェールオーバを使用すると、異なる
システム間でバーチャルコネクト(VC)のプロファイルを迅速に移動できます。プロファイル フェール
オーバを開始するには、VCEM GUIまたはVCEMフェールオーバ コマンド ラインを使用します。ま
た、フェールオーバ コマンド ラインをイベント モニタリングと組み合わせて使用すると、特定のシス
テム用の特定のイベントを受信したとき、フェールオーバを自動的に開始することができます。
VCEMプロファイル フェールオーバは障害回復ツールではなく、管理者が予期しない停止時間を最
小限に抑えることができる高速復旧ツールです。
VCEMフェールオーバ の基本的な使用手順は、次のとおりです。
1.
ユーザが、GUIからスペアを指定します。
2.
ユーザが、CLIまたはGUIからVCEMプロファイル フェールオーバを開始します。
3.
VCEMプロファイル フェールオーバは、ソース システムから、同じブレード モデル タイプの
指定されたスペア システムへVCプロファイルを移動します。次の処理が行われます。
1.
ソース システムの電源が切れます。
2.
ソース システムと同じバーチャル コネクト ドメイン グループ内の指定された
スペアから適切なスペアが選択されます。
4.
3.
スペア システムにVCプロファイルが割り当てられます。
4.
スペア システムの電源が入ります。
最終的には、障害を起こしたシステムの電源が切れ、OSとアプリケーション スタックがスペア
ブレードで動作している状態となります。
VCEMフェールオーバ は、以下の方法で開始できます。
 CLIから - CLIからは、以下を使用して開始できます。
o
障害を起こしたシステムのホスト名
o
障害を起こしたシステムのIPアドレス
o
障害を起こしたシステムのエンクロージャ名およびベイ番号
 GUIから - GUIの以下のタブに[フェイルオーバ]ボタンがあります。
o
[プロファイル]タブ
o
[ベイ]タブ
このホワイトペーパでは、管理者がVCEMフェールオーバ を使用する方法について説明します。使
用方法に加えて、制限事項についても説明します。使用方法では、準備、開始、および予想される
結果について説明します。制限事項では、制約と依存関係について説明します。最も重要な制限事
項として、VCプロファイルに関連付けられたブートLUNは、ソース システム以外でも正しく動作する
ように構成されている必要があります。ブートLUNをすべてのスペアであらかじめテストしておくと、こ
の制限事項に関連するリスクを軽減できます。
このフェールオーバ機能は、管理者の日常的な管理作業、特に問題があるシステムの高速復旧
作業を容易にするためのものです。柔軟で堅牢な設計のため、さまざまな要件や環境に適用でき
ます。
2
VCEMプロファイル フェールオーバの概要
本書では、Virtual Connect Enterprise Manager(VCEM)の新機能であるプロファイル フェールオー
バを使用する方法と、HP SIMの自動イベント処理でフェールオーバを開始する方法について詳しく
説明します。
VCEMプロファイル フェールオーバを使用すると、クリティカルなハードウェア障害が発生したSAN
ブート サーバを迅速に復旧できます。プロファイル フェールオーバを実行すると、障害を起こした
サーバのSANおよびIPネットワーク リソースがスペア サーバへ移動します。次に、スペア サーバ
は、障害を起こしたサーバのシステム ドライブを起動します。VCEMでは、フェールオーバを手動で
開始したり、イベントで自動的に開始することができます。
VCEMプロファイル フェールオーバが機能するには、同じイメージが異なるシステムに移動しても動
作する必要があります。VCEMプロファイル フェールオーバでは基本的な互換性がチェックされます
が、管理者はプロファイルの移動についての制限事項を理解することが重要です。
主要コンポーネント
フェールオーバの主要コンポーネントとそれぞれの役割について、簡単に説明します。
 バーチャル コネクト(VC)は、「サーバ プロファイル」と呼ばれる特殊なリソースを使用して、個々
のサーバ ブレードからサーバに接続されたEthernetネットワークおよびファイバ チャネル ネット
ワークを仮想化するインターコネクトですサーバ プロファイルがHP BladeSystem c-Classのサーバ
ベイに割り当てられたり移動されたりすると、そのベイ内のサーバ ブレードは、プロファイルに含
まれるMACアドレスとWWNアドレスを使用して、それぞれ外部のEthernetネットワークやファイバ
チャネル ネットワークと通信します。
 VCEMは、ユーザによるフェールオーバ制御機能を提供し、プロファイル フェールオーバ処理を実
行する、マネジメント ソフトウェアです。VCEMは、中央管理システム(CMS)の一部です。スタンド
アロン コンポーネントとして、またはHP Systems Insight Manager(HP SIM)のプラグインとしてイ
ンストールされます。VCEMは、複数のバーチャル コネクト ドメイン(エンクロージャ当たり1つの
VCドメイン)を1つまたは複数のバーチャル コネクト ドメイン グループに集約し、すべてのVCドメ
イン グループが単一のMACアドレス範囲とWWNアドレス範囲を共有できるようにします。さらに、
任意のVCドメイン グループ内のすべてのサーバ ブレードが、同じEthernet接続とファイバ チャ
ネル接続の組み合わせを共有します。
詳細については、『HP Virtual Connect Enterprise Managerユーザ ガイド』1の「1 はじめに」を参照
してください。
1
HP 製品番号:460924-192。発行:2008 年 4 月、初版。
3
プロファイル フェールオーバ:例
ここでは、プロファイル フェールオーバの単純な例を示します。図1に示すインフラストラクチャは、
次を含みます。
 2台のHP BladeSystemエンクロージャからなる1つのVCドメイン グループ
 バーチャル コネクト(EthernetおよびSANインターコネクト)
 左側のエンクロージャの (赤いボックス)は、稼動系サーバ ブレードを表します。
 右側のエンクロージャの (青いボックス)は、スペア サーバ ブレードを表します。

MACとWWNの割り当てを含むサーバ プロファイル。どの時点でも、プロファイルは、最大
で1つのベイとそのベイ内のサーバに関連付けられます。
図1 VCEMプロファイル フェールオーバの例
次に、上記図1に示すプロファイル フェールオーバ処理について説明します。
 ワークロード(オペレーティング システムを含むSANブート システム ドライブ、アプリケーション
およびアプリケーションのデータ)が、稼動系サーバ (赤いボックス)で動作しています。このワー
クロードを別のサーバへ移動する必要があります。たとえば、ハードウェアに問題があったり、計
画されたサーバ メンテナンスを行う場合です。
 稼動系サーバ (赤いボックス)でプロファイル フェールオーバが開始されます。その結果、VCEM
は自動的に以下の処理を実行します。
 稼動系サーバ (赤いボックス)の電源が切れます。
 スペア サーバ ブレード (青いボックス)が選択されます。
 稼動系サーバのプロファイル
が、稼動系ベイ (赤いボックス)からスペア ベイ (青いボック
ス)へ移動されます。移動後、スペア サーバには、稼動系サーバが保持していたEthernetとSAN
が割り当てられます。
4
 スペア サーバの電源が入ります。稼動系サーバで実行されていたシステム ドライブ イメージが
起動され、稼動系ワークロードがスペア サーバで再開されます。
プロファイル フェールオーバの開始
VCEMでは、VCEMグラフィカル ユーザ インタフェース(GUI)およびVCEMコマンド ライン インタ
フェース(CLI)の2つのインタフェースからフェールオーバを開始できます。GUIは、VCEMユーザだけ
がアクセスできます。CLIは、ユーザがアクセスでき、加えてユーザが開発したスクリプトやHP SIM自
動イベント処理のような他のソフトウェアがAPIとしてアクセスできます。
フェールオーバを開始するには、最上位のVCEM管理者権限が必要です。
GUIを使用する場合、ソース サーバは常にそのエンクロージャとベイの位置で識別されます。
CLIを使用する場合、ソース サーバは、サーバのエンクロージャとベイの位置、サーバのホスト名ま
たはサーバのIPアドレスのいずれかで識別できます。サーバのホスト名またはIPアドレスのいずれか
を使用するには、HP SIMサーバで検出が正常に動作している必要があります。
フェールオーバを開始するには、イベントの発生時にフェールオーバを直接開始するHP SIM自動イ
ベント処理を含め、3つの基本的な操作方法があります。
 管理者が、システムのフェールオーバが必要であることを決定し、GUIまたはCLIからフェールオー
バを開始する。
 HP SIM自動イベント処理が、問題の可能性がある場合にアラートを管理者へ送信する。管理者が、
問題を確認した後、GUIまたはCLIからフェールオーバを開始する。
 HP SIM自動イベント処理が、CLIからフェールオーバを直接開始し、この処理を行ったことを示すア
ラートを管理者へ送信する。
HP SIM自動イベント処理による開始については、後節で説明します。
プロファイル フェールオーバの内部処理
フェールオーバがGUIから開始されたか、CLIから開始されたかにかかわらず、VCEMでは同じ内部
処理が実行されます。ここでは、開始時にプロファイル フェールオーバで実行されることについて説
明します。
VCEM Job Manager
Job Managerは、統一されたプロセスとして一連の設定処理を実行するVCEMの内部リソースです。
VCドメイン グループ当たり最大1つのフェールオーバ ジョブを並列実行できます。
ほとんどのフェールオーバ処理は、フェールオーバ ジョブのコンテキストの中で実行されます。
フェールオーバ ジョブの進行状況は、下記のようにGUIまたはCLIを使用して監視することがで
きます。
フェールオーバの開始
CLIからフェールオーバを開始すると、コマンド ラインが確認され、ソース サーバを識別するために
ホスト名またはIPアドレスが使用されている場合は、固有のエンクロージャとベイの位置に変換され
ます。
次に、フェールオーバ ジョブのスケジュールが設定されます。イニシエータがジョブのステータスを
チェックできるように、ジョブ番号を返します。
5
フェールオーバ ジョブが実行する処理
フェールオーバ ジョブは、以下の処理を実行します。以下で「エラーの場合終了します」とある箇所
では、対応する手順が正常に完了しない場合、フェールオーバ ジョブは処理を停止し、終了しま
す。
 他のユーザやプロセスによる処理との競合を防止するために、ジョブが終了するまで、ソース
サーバのVCドメイン グループをVCEM内の他の処理に対してロックします。
 ソース サーバがProLiantサーバ ブレードであることを確認します。エラーの場合終了します。
 「押し続ける」(ハード電源切断)を使用して、ソース サーバの電源を切ります。
 ソース サーバのVCドメイン グループから、利用可能なスペア サーバを選択します。選択される
スペアは、以下のすべての条件に適合し、最初に発見されるサーバです。利用可能なスペア
サーバが見つからない場合は、エラーで終了します。
 スペア ベイにプロファイルがない。
 スペア ベイ サーバが物理的に存在する。
 スペア サーバのモデルが、ソース サーバのモデルと同一である(注:サーバ モデルの世代
は区別されません。たとえば、BL465c G1とBL465c G5は同じモデルと見なされます)。
 スペア サーバの電源が入っていない。
 •ソース ベイからスペア ベイへプロファイルを移動します。エラーの場合終了します。この処理は
以下を含みます。
 HP SIMからソース サーバのホスト名とIPアドレスの情報を削除します。
 スペア ベイからスペア割り当てを削除します。
 スペア サーバの電源を入れ、SANに接続されたシステム ドライブ イメージを起動します。この
処理は以下を含みます。
 以後10分以内にスペア サーバに対してHP SIM検出を実行するようにスケジュールを設定し
ます。これで、スペア サーバのホスト名とIPアドレスがHP SIMに関連付けられます。HP SIM
検出の実行が正常に動作するには、スペア サーバでブートされるオペレーティング システ
ムが、HP SIM検出が実行される時点でネットワーク通信を確立している必要があります。
 ジョブは、VCドメイン グループのリソースのロックを解除して完了します。
プロファイル フェールオーバの機能および制限事項
プロファイル フェールオーバの機能を最大限に活用するには、その機能と制限事項を理解する必
要があります。
プロファイル フェールオーバが完了すると、ソース(稼動系)サーバのワークロードが別の(スペア)
サーバ ブレードで再開され、メモリ常駐ソフトウェアとデータがディスクから復元されます。その意味
は、次のとおりです。
 サーバ ハードウェアを変更することで、サーバ ハードウェアの障害による問題が解決される。
 異常なソフトウェアやデータ状態による問題のうち、ディスクからソフトウェアとデータを復元するこ
とで修正できるものが解決される。
 フェールオーバ時に確立されていたユーザ セッションは、中断される場合がある。
 HP SIMでは、フェールオーバの完了後、約10分以内にホスト名とIPアドレスの関連性がソース
サーバから削除され、スペアで確立されます。
プロファイル フェールオーバで解決されない問題には、次が含まれます。
 接続されているSANまたはEthernetに存在する従属リソースとの接続の損失。
 データまたはソフトウェアの破損または関連する状態一貫性の損失。
6
 操作エラーおよびシステム構成エラー
プロファイル フェールオーバは、以下の条件に依存します。
 フェールオーバは、SANブートしているProLiant c-Classサーバ ブレードだけに適用される。
 サーバが電源投入時にSANから起動するようにあらかじめ設定されている。
 サーバがローカル ドライブに依存しない。
 ソース サーバのシステム ドライブ イメージが、ソース サーバと同じモデルであるVCドメイン グ
ループ内の任意のスペア サーバのハードウェアとファームウェアの構成で動作する。これには、
BL465c G1とBL465c G5のような異なる世代のサーバ モデルも含まれます。
 ソフトウェアが、MACアドレスとWWNアドレスを除き、サーバのシリアル番号や同様のハードウェ
ア識別子に依存しない。
推奨事項およびベスト プラクティス
2台のサーバのファームウェアとハードウェア構成のわずかな違いにより、あるサーバで動作するシ
ステム ドライブ イメージが、他のサーバで動作しなかったり、性能が低下するなどの非互換性が発
生する場合があります。したがって、最善のフェールオーバ結果を得るには、以下の点を確認してく
ださい。
 すべてのVCドメイン グループについて、同じモデルのすべてのサーバで1つのハードウェア構成
に標準化します。各モデルについて、すべてのサーバですべてのファームウェアのリビジョン レベ
ルを同じに保つ手順を実装します。OA、iLO、およびサーバ ファームウェアを最新のリビジョンに
アップグレードするのが最善です。
 同じVCドメイン グループに、世代が異なる同じモデルのサーバを入れないようにします。同じ
モデルでも、世代が異なると、ハードウェアとファームウェアの内部構成が大きく異なる場合が
あります。
 十分にテストを実施して、使用される可能性があるすべてのサーバ構成で、ブート イメージが正
常に起動し、動作することを確認します。VCドメイン グループ内で、ハードウェアとファームウェア
構成が異なる同じサーバ モデルを使用する必要がある場合は、特に重要です。
HP SIM自動イベント処理を使用してフェールオーバを直接開始する方法は、段階的に導入してください。
イベントで開始するフェールオーバを実装する場合は、選択したフェールオーバ イベントが、操作手順
とサービス レベル目標に適合する問題検出精度を達成することを確認します。詳細については、後節
の「HP SIM自動イベント処理を使用したフェールオーバの開始」の項を参照してください。
7
ハードウェアの互換性に関する特記事項
VCEMプロファイル フェールオーバは、バーチャル コネクト ドメイン グループというコンセプトに基
づいています。これらのVCドメイン グループにより、その中で動作するVCサーバ プロファイルが、
現在どのVCドメインで動作していても、同じIPネットワークとSANネットワークにアクセスできることが
保証されます。ただし、1つのバーチャル コネクト ドメイン グループ内でも、HP BladeSystemサー
バを相互に交換できない場合があります。ドメイン グループには、プロセッサの種類とメモリ構成が
異なるサーバが含まれることがあります。また、サーバに異なるメザニン カードが搭載されているこ
とがあり、LANネットワークとSANネットワークへの接続方法が異なる可能性があります。
ソース サーバとターゲット サーバの他の違いが、移動後にオペレーティング システムやアプリ
ケーションの動作に影響する場合があります。ブレード サーバに基づくイメージを移動するときは、
以下の方法をお勧めします。
 特に、システムROM、ILOおよびHBAファームウェアについて、ソース システムとターゲット シス
テムの各システム コンポーネントで最新バージョンのファームウェアを実行します。
 各システム上のすべてのメザニン カードについて、各システム イメージにドライバを含めます。
ソース サーバにないメザニン カードがターゲット サーバに存在すると、OSから異なるドライバの
インストールを求められるため、ブート プロセスが中断される場合があります。ソース システムと
ターゲット システムで、同じスロットにメザニン カードを搭載する必要があります。
 できるだけ、ハードウェア構成を標準化します。ネットワーク インタフェース カードやホスト バス
アダプタの変更のような、モデル番号やバージョン番号に反映されないシステム ハードウェアの
わずかな違いにより、異なるドライバや構成変更が必要になるため、ブート プロセスが中断され
る場合があります。
可動性を最大化するために、一部のデータセンター設計者は、ほとんどのアプリケーション ワーク
ロード要件に適合するように選択された単一の仕様に従って、企業内の各サーバ ブレードを構成し、
実稼動の前に移動をテストします。HPは、実環境配備の前に、すべてのターゲット ハードウェア プ
ラットフォームでワークロードをテストすることお勧めします。
インストールと設定のチェックリスト
ここでは、VCEMを実行する前にインストールと設定を行う必要があるものについて説明します。
必要なコンポーネントをすべてインストール
『HP Virtual Connectユーザ ガイド』に記載されているすべての項目をインストールし、設定する必
要があります。「2 VCEMのインストールおよび設定」と「3 VCドメインの管理」を参照してください。
上記の要件に加えて、VCEMではすべてのエンクロージャ名が一意である必要があることに注意し
てください。
8
フェールオーバを実行する前のインストールと設定のチェックリスト
プロファイル フェールオーバ用のインストールおよび設定要件は、使用する開始方法によって異な
ります。フェールオーバを開始するすべての方法を使用したい場合は、構成項目2~7を実装する必
要があります。
表1 開始方法によるプロファイル フェールオーバ設定のサポートおよび要件
フェールオーバの開始方法
構成項目
1. VCEM 1.10を「スタンドアロン」
GUI
CLI:VCEM – failover - host
CLI:VCEM – failover - bay
CLI:VCEM – failover - ip
サポート
サポート
非サポート
サポート
サポート
必須
任意
必須
必須
任意
必須
必須
必須(CLIのみ)
必須
任意
任意
任意
必須
任意
任意
必須
HP SIM自動イベント処理
としてインストールする。
2. HP SIM の一部 として VCEM
1.10をインストールする。
3. 完全なHP SIMサーバ検出が
動作している。
4. 環境でDNSが正しく設定され
ている。
5. CLIユーザにHP SIM管理者
特権がある。
6. VCEMシステムでWindows
管理者アカウントを使用できる。
7. 管理対象システムでHP SIM
エージェントが動作している。
スペア ベイとスペア サーバの設定および管理
ユーザから開始されるフェールオーバの準備が整う前に、まだ1つの手順が残っています。それは、
スペア ベイを指定し、そこにサーバを追加する手順です。
プロファイル フェールオーバは、常にソース サーバのVCドメイン グループから利用可能なスペア
を選択します。利用可能なスペアとは、プロファイルがなく、電源が切れているサーバ ブレードが物
理的に存在し、ソース サーバと同じモデルであり、スペアに指定されているベイです。フェールオー
バで「利用可能なスペア」が見つからない場合、フェールオーバ処理は失敗します。
スペアの選択をよりきめ細かく制御するには、同一のVC構成を持つ複数のVCドメイン グループを
作成し、希望するサーバとスペアの組み合わせを入れます。前述の「推奨事項およびベスト プラク
ティス」を参照してください。
スペアを指定するには、VCEM GUIの[ベイ]タブを使用します。
 スペアを適用するVCドメイン グループ用のフィルタを設定します。
 インストールされているサーバのブレード モデルと電源ステータスを確認するには、左下にある
[詳細な情報の表示]ボックスを選択します。表示が更新されます。
 スペアに指定する各ベイのスペア ボックスを選択します。プロファイルがあるベイは、スペアに指
定できません。ストレージや拡張ブレードのようなサーバ ブレードのないベイは、スペアに指定で
きません。スペアに指定する時点でサーバが存在するベイを指定することを強くお勧めします。た
だし、これは必須ではありません。
9
 スペア ボックスの選択を解除すると、ベイのスペア指定が解除されます。なお、サーバ プロファ
イルをベイに割り当てたり、移動したりしても、ベイのスペア指定が解除されます。
 [スペアの適用]ボタンをクリックします。
[スペア]欄見出しを2回クリックすると、スペア ベイがリストの先頭へ移動します。
図2 スペアの指定
※本書の画面キャプチャ上では英語表記となっておりますが、日本語環境でHP SIM/VCEMを使用する場合は、日本語インターフェイスが利用
可能です。
手動によるフェールオーバの開始
プロファイル フェールオーバは、[プロファイル]タブから開始することができます。プロファイルを選
択し、右下にある[プロファイル フェイルオーバ]ボタンを押します。
10
プロファイル フェールオーバは、[ベイ]タブから開始することもできます。プロファイルがある特定の
ベイをチェックし、[プロファイル フェイルオーバ]ボタンを選択します。
VCEMプロファイル フェールオーバは、CLIを使用して開始することもできます。CLIには3つの形式
があります。
o
障害を起こしたシステムのホスト名を使用する
vcem –failover –host hostname
o
障害を起こしたシステムのIPアドレスを使用する
vcem –failover –ip ip_address
o
障害を起こしたシステムのエンクロージャ名とベイ番号を使用する
vcem –failover –bay enclosure_name:bay_number
コマンドを起動すると、標準出力にジョブID番号が返ります。これを別のVCEM CLIの入力に使用す
ると、フェールオーバのステータスを監視することができます。
vcem –list –details –job job_id_number
11
HP SIM自動イベント処理を使用したフェールオーバの開始
ここでは、通知とフェールオーバの自動開始のためにHP SIM自動イベント処理を設定し使用する方
法について説明します。
コンセプト
自動イベント処理でフェールオーバを開始するには、以下の項目を設定する必要があります。
 フェールオーバを開始したいイベントが選択されている。後述のイベントを考慮することをお勧めし
ます。これらのイベントを使用するか、独自のイベントを選択することができます。選択したイベント
は、HP SIMイベントに加えられます。
 HP SIMで、「イベント時処理」タスクが作成されます。このタスクの作成中に、フェールオーバ イベ
ントが管理対象システムに適用されます。任意のイベントが発生したときに実行される1つまたは
複数の処理が設定されます。これらの処理は、電子メール通知やカスタム ツールの実行などで
す。VCEMには、フェールオーバを開始するためのHP SIMカスタム ツールがあります。これらのカ
スタム ツールは、VCEMフェールオーバCLIコマンドの引数として、フェールオーバ イベントを通知
するシステムのホスト名またはIPアドレスを使用します。イベント時処理で、いずれかのカスタム
ツールが選択され、設定されます。
下記に、自動イベント処理を設定する手順を詳しく説明します。
次の図に、設定した自動フェールオーバ開始が動作する様子を示します。
図3 HP SIM自動イベント処理を使用した自動プロファイル フェールオーバ開始
図3の説明:
 HP SIMイベントが管理対象システムで発生し、Ethernet経由でHP SIMに通知されます。
 HP SIMは、イベントを処理し、選択されたフェールオーバ イベントであることを認識します。
 HP SIMは、任意のフェールオーバ イベントが初めて発生したとき、カスタム ツールを実行します。
(注:この「最初の発生」動作は、ユーザが作成するスクリプトで変更できます。後述を参照してくだ
さい)
12
 カスタム ツールは、VCEM CLIを使用して、VCEMフェールオーバ コマンドを起動し、フェールオー
バ イベントを通知したシステムのホスト名またはIPアドレスを渡します。
 ホスト名またはIPアドレスは、エンクロージャとベイの位置にマップされます。
 フェールオーバ ジョブが、そのエンクロージャとベイで開始されます。
 フェールオーバ ジョブは、前述のように動作します。フェールオーバ ジョブは、Ethernet経由で
ソース ベイとスペア ベイを含むエンクロージャのVCインターコネクトと通信して、ソース ベイから
スペア ベイへサーバ プロファイルを移動し、スペア サーバの電源を入れます。
フェールオーバ用のHP SIMイベントの選択
フェールオーバを開始するために使用するHP SIMイベントを選択する必要があります。下記のイベ
ントを考慮することをお勧めします。このイベントを記載する前に、イベントを使用して自動的にフェー
ルオーバを開始する際の実用的な留意事項を説明します。
HP SIMの監視機能
HP Insight Management(IM)エージェントは、ProLiantシステムの状態を監視します。これらのエー
ジェントには、WindowsやLinuxのようなホストオペレーティング システムが必要です。IMエージェン
トは、主にコンポーネント レベルでサーバ ハードウェアを監視し、HP SIMにイベント 2(SNMPトラッ
プまたはWBEMイベント)を送信してサーバ状態の変化を報告します。この通信用に、HP SIMには、
サーバとのIPネットワーク接続が必要です。HP SIMは、サーバ、ストレージ、NICなどのカテゴリ別に
イベントをグループ化します。また、各イベントに深刻度を割り当てます。
サーバからイベントを受信することに加えて、HP SIMは、数分周期で各サーバの状態をポーリングし
ます。このサーバ状態には、IMエージェントが監視するすべてのサブシステムの組み合わせが反映
されます。HP SIMは、監視対象サーバごとに、受信した最もクリティカルなイベントのカテゴリを反映
した状態を示すアイコンを表示します。
報告されるコンポーネント レベルの状態情報には、システムがサービス レベル目標に適合するた
めの全体的な機能に対する個々のコンポーネントの重要性は考慮されていません。さらに、HP SIM
は、本来、オペレータに警告を出すために設計されています。オペレータが、イベントを確認し、適切
な処置を決定する必要があります。
クリティカルなサーバハードウェア障害の決定
サーバのハードウェア コンポーネントが故障したとき、次の2通りの場合があります。
 サーバが故障し、サービスの提供が停止する。
 サーバが、サービス レベル目標に適合するように動作し続ける。
フェールオーバの目的上、ハードウェア コンポーネントの障害によりサーバがサービス レベル目標
に適合できなくなった場合、コンポーネントが「クリティカル」になり、その障害が「クリティカルなサー
バ ハードウェア障害」になります。フェールオーバにより効果的に復旧する必要があります。これに
対して、サーバが目標に適合して動作し続ける場合は、コンポーネントはクリティカルでなく、ただち
にフェールオーバを実行する必要はありません。たとえば、リダンダント パワー サプライが故障し
ても、サーバはそのまま動作するため、クリティカルな障害にならず、HP BladeSystemの場合は、動
作に影響を与えずに交換することができます。
HP SIMはどのコンポーネントがリダンダントであり、未使用であるかを認識しないので、すべてのコ
ンポーネント障害を「クリティカル」イベントと見なします。そのため、システム管理者は、最も効果的
な復旧を決定する必要があります。
HP Systems Insight Manager の 資 料 Microsoft Windows の イ ベ ン ト ID お よ び SNMP ト ラ ッ プ リ フ ァ レ ン ス ガ イ ド
http://bizsupport.austin.hp.com/bc/docs/support/SupportManual/c00630997/c00630997.pdf (製品番号 347870-198) を参照し
てください。
2
13
機能低下状態で動作しているコンポーネントに障害が発生し、サーバが物理的に故障したり、サー
バに保持されているデータの完全性が損なわれたりするおそれがある場合、サーバをフェールオー
バしてください。たとえば、異常な高温状態、特定のCPUエラーやメモリ エラー条件などの場合です。
HP SIMは、差し迫った障害を示す条件を「メジャー」イベントと見なします。ただし、フェールオーバの
目的上、これらのイベントも、クリティカルと見なすことができます。
また、サーバの構成やワークロードが、個々のサーバにとってどれがクリティカルなコンポーネントで
あるかを決定する場合があります。たとえば、ローカルのアレイ コントローラが故障したとします。
サーバがSANブートとして設定され、ワークロードがローカルドライブにアクセスしていない場合、
サーバは、その障害後もワークロードに影響を与えずにそのまま動作するため、アレイ コントローラ
はクリティカルなコンポーネントではありません。すでに述べたように、リダンダント構成のコンポーネ
ントも、リダンダント コンポーネントがプライマリ コンポーネントの動作を引き継ぐため、クリティカル
ではありません。
サーバからのクリティカル イベントの報告
単一CPUのようなリダンダントでないコンポーネントがただちに故障すると、そのサーバで動作する
HP SIMエージェントは、障害を報告することができなくなります。事実、HP SIMエージェントが報告し
ない多くのコンポーネント障害があります。
また、コンポーネント ステータスを報告するには、サーバのオペレーティング システムと、そのシス
テムとHP SIM間のネットワーク通信が動作している必要があります。
サーバは、ハードウェアがクラッシュしたり、オペレーティング システムがハングすると、サービスを
提供できなくなります。ただし、障害の原因が不明の場合、たとえば、ブート イメージが使用できなく
なった場合など、サーバを交換すれば問題が解決するかどうかわかりません。あるいは、再起動す
れば機能が復旧する場合、交換する必要はまったくありません。いずれの場合も、このようなシステ
ムは、HP SIMにイベントを送信できません。
HP SIMの「システム到達不能」イベント
システム到達不能イベントはオプションですが、一般にシステム ステータス変化イベントとして使用
されます。HP SIMの設定により、HP SIMのハードウェア ステータス ポーリング タスクが発行する
pingにシステムが応答しないとき、「システム到達不能」イベントが発生します。
システム到達不能イベントによりシステムのフェールオーバが開始されるように設定できます。ただ
し、システム到達不能は、「根本原因」となるイベントではありません。その根本原因は、クリティカル
なハードウェア障害、ワークロード ソフトウェア障害、中間の通信ネットワークの障害などです。(ネッ
トワーク障害の場合は、多くのサーバがフェールオーバを開始することがあります)。
フェールオーバ イベントとサービス レベルの評価
フェールオーバ イベントの理想は、以下のような、100%の精度です。
 クリティカルなサーバ ハードウェア障害が発生するすべての条件でフェールオーバが開始される
 サーバがサービス レベル目標に適合できる条件ではフェールオーバは開始されない
イベント検出でクリティカルなサーバ ハードウェア障害が見落とされる場合、他の方法で発見される
まで、たとえば、ユーザからヘルプ デスクに連絡があるまで、サービスは回復されません。
誤ってフェールオーバが必要と判断される場合は、フェールオーバの間、サービスが中断され、シス
テムが再起動されるため、サービス レベルの評価に不利に影響し、サービスを使用する必要があ
るときに使用できない場合があります。
14
イベントで開始されるフェールオーバに依存する前に、選択した障害検出イベントの精度が、ローカ
ルのインストール、構成、ワークロード、サービス レベル目標および操作ポリシーに照らして、許容
できるサービス レベルの評価を満たすことを確認することが必要です。
インストール済みのフェールオーバ イベントが選択された理由
推奨イベントには、HPがお客様にとって常に有用であると確信するイベントが含まれています。この
イベントをカスタマイズしたり、ローカル インストール用にイベントを追加することができます。
HPが推奨イベントを選択するために使用した要因と根拠は、次のとおりです。
 サーバ ハードウェア障害を示さないイベントは除外する。
 通常はリダンダントで構成されるコンポーネントに関連するイベントは除外する。(たとえば、HP
BladeSystem c7000エンクロージャには、リダンダント パワー サプライとファンがあります。電源
やファンの障害に関するエンクロージャ イベントは、HP SIMに報告され、障害を起こしたコンポー
ネントに対するする処置をただちに行う必要があります。ほとんどのデータ センターでは、サービ
スの提供に影響を与えずに短時間で交換を行うことができます)
 システムがサービスを提供するために依存していないコンポーネントに関連するイベントは除外す
る。フェールオーバはローカル ストレージがある構成をサポートしていないので、システム構成が
ローカル ストレージに依存していないことを前提にすることができ、ローカル ストレージに関連す
るイベントが発生しても、サービス提供機能には影響しないと考えられます。また、このカテゴリに
は、管理対象システム上のHP SIMエージェントの動作に関連するエラーも含まれます。
 システムの障害のためにイベントが送信できず、HP SIMが報告を受信する可能性が低いイベ
ントは除外する。このようなイベントには、HBA障害やほとんどのCPUおよびNICの障害が含ま
れます。
VCEM 1.10と同時にインストールされるフェールオーバ イベント
VCEMフェールオーバ イベントには、以下の推奨イベントがあらかじめ含まれています。これらのす
べてのイベントは、障害はまだ発生していないが、いつ発生してもおかしくない「障害予測」イベントと
見なすことができます。
表2 「常に有用な」推奨フェールオーバ イベント一覧
イベント
番号
イベント タイプ
イベント カテゴリ
1001
(SNMP)CPUエラー スレッショルドを超えた
ProLiantシステムおよび環境イベント
6001
(SNMP)訂正可能なメモリ エラーが発生した
ProLiantシステムおよび環境イベント
6015
(SNMP)訂正可能なメモリ エラーが発生した
ProLiantシステムおよび環境イベント
6029
(SNMP)訂正可能なメモリ エラーが発生した。メモリ
ProLiantシステムおよび環境イベント
モジュールの交換が必要
6056
メモリ エラーが訂正された。メモリ モジュールを交換してくだ
ProLiantシステムおよび環境イベント
さい。
フェールオーバを開始するには、下記「イベント時にフェールオーバを開始するHP SIM処理の設定」
の項を参照してください。
イベント時のフェールオーバでのHP SIM処理の使用
HP Systems Insight Managerには、SNMPトラップとWBEMイベントを監視する機能があります。これ
らを使用すると、管理者に通知したり、中央管理システムやリモート システムで実行可能ファイルを
起動するなどのより複雑な処理を実行することができます。ここでは、管理者がこの機能を利用して、
VCEMプロファイル フェールオーバを開始する方法について説明します。
15
VCEMでは、管理者がこの機能を利用するための操作性が強化されています。たとえば、ウィザード
へのリンク、カスタム ツールに対応するCLI、および管理者がカスタマイズできるイベントなどです。
このすべてを組み合わせると、VCEM環境での自動フェールオーバが実現できます。
要約すると、VCEM フェールオーバ機能でイベントに対応するには、主に3つの方法があります。
 イベントで管理者に通知するが、フェールオーバは開始しない。
 イベントでフェールオーバを開始するが、管理者には通知しない。
 イベントで管理者に通知し、フェールオーバを開始する。
イベント時にフェールオーバを開始するHP SIM処理の設定
ここでは、イベント時にVCEMのCLIを起動するSIM処理例を作成する方法について説明します。これ
は1つの例ですが、管理者が上記の3つのイベント使用方法のいずれを採用するかにかかわらず、
手順は同じです。
VCEMのホームページには、[フェイルオーバ]の下に"HP SIM自動イベントハンドリング - 管理タスク"
へのリンクがあります。これは、イベント時のSIMの処理への便利なリンクです。ここをクリックして開始
します。
16
同じフレームに次のページが読み込まれます。このGUIには、イベント時の現在の処理のリストと他
の処理を有効にするボタンが表示されます。イベント時の新しい処理を作成するには、[新規]ボタン
をクリックしてウィザードを開始します。
最初に、イベント時の処理に名前を付けます。イベント時にこの処理を適用するシステムに関連する
名前を選択します。
17
次に、処理を起動するために使用するイベントを選択します。監視対象システムからこれらのイベン
トのいずれかを受信すると、処理が起動されます。このイベント時の処理例では、VCEMが提供する
"Profile Failover Trigger Events"というイベント集合を使用します。ただし、管理者は、自由にイベント
集合を作成したり、フェールオーバの開始に使用したい個々のイベントを選択することができます。
[定義の表示]ボタンを使用して、イベント集合の内容を表示します。この集合には、CPUとメモリのエ
ラーSNMPトラップが入っています。
18
個々のイベントを選択するには、2番目の[指定するイベント属性を使用]ラジオ ボタンを選択します。
ウィザードで新しいページが表示され、管理者は、深刻度、イベント カテゴリ、またはイベント タイプ
でイベントを選択できます。イベント タイプを選択すると、フェールオーバ用に使用できるすべての
SNMPトラップが表示されます。共通のカテゴリは、システム固有の多数の警告や障害を含んでいる
"ProLiant System and Environmental Events"(ProLiantシステムおよび環境イベント)です。この例で
は、Profile Failover Trigger Events集合を使用します。
ウィザードの次の手順では、このイベント時の処理を適用するシステムまたはシステムの集合を選
択できます。この例では、2番目のラジオ ボタンの選択を使用して、特定のシステムを選択します。
19
2番目のラジオ ボタンを使用し、[次へ]を選択すると、次のGUIが表示されます。管理者は、多くの
システム属性を使用して、特定のシステムを選択することができます。この例では、IPアドレスが
170.50.0.69のシステム名を使用します。
ここでは、多くの処理が使用できます。選択したシステムで選択したいずれかのイベントが発生する
と、ここで選択したすべての処理が開始されます。管理者は、イベント発生の通知を受信したい場合、
ポケベル通知または電子メールの送信を選択できます。これらはカスタム ツールと組み合わせたり、
監視ツールとして使用することができます。
この例では、VCEMにすでに用意されているカスタム ツールを使用します。これらのカスタム ツー
ルは、選択したイベントがSIM CMSで受信されたときに使用できるパラメータを使用してVCEM CLIを
起動します。イベントを受信すると、送信元のシステムが認識され、ツールの起動に使用することが
できます。この例では、VCEM Profile Failover by IP Addressを使用しています。ウィザードで、"IP
Address"(IPアドレス)または"Hostname"(ホスト名)のいずれかを選択し、[次へ]を選択します。
20
ウィザードの次の手順は、時間フィルタです。時間フィルタを使用すると、管理者は、特定の時間帯
のイベント時の処理を有効にしたり、無効にすることができます。たとえば、管理者は、出勤しない週
末に、VCEMプロファイル フェールオーバを有効にすることができます。
ウィザードの最後の手順では、イベント時の処理を確認します。指定したシステム用のいずれかのイ
ベントが発生すると、この自動イベント ハンドラが起動されます。[終了]をクリックすると、[タスクの
管理]画面に戻ります。
21
独自のスクリプトを使用したフェールオーバの開始
管理者は、独自のスクリプトやバッチ ファイルを作成して、フェールオーバを開始することができま
す。これらのスクリプトは、VCEMプロファイル フェールオーバの前およびVCEMプロファイル フェー
ルオーバの後でタスクを実行するように論理的に作成することができます。カスタム スクリプトの基
本構造は、次のようになります。
 フェールオーバ前のコマンド。次のような場合があります。
o
ESXホストから仮想マシンを退避させる。
o
正しい順序でアプリケーションをシャットダウンする。
o
一時作業領域のデータをディスクに書き込む。
 VCEMフェールオーバ コマンド。次のいずれかを使用します。
o
vcem –failover –host hostname
o
vcem –failover –ip ip_address
o
vcem –failover –bay enclosure_name:bay_number
 フェールオーバ後のコマンド。次のような場合があります。
o
ESXホストに仮想マシンをインポートする。
o
ソース システムのメンテナンス用のトラブル チケットを作成する。
o
フェールオーバが実行されたことを管理者に通知する電子メールを送信する。
これらのカスタム スクリプトを使用して、Systems Insight Manageカスタムツールを作成し、上記のイ
ベント時処理と組み合わせると、システムヘルスイベントによって開始することができます。カスタム
ツールに関する詳細については、『Systems Insight Managerユーザ ガイド』を参照してください。
リモート システムを使用したフェールオーバの開始
リモート モニタリングとVCEMプロファイル フェールオーバ
管理者がリモート システムを使用してサーバを監視している場合でも、VCEMプロファイル フェー
ルオーバは可能です。たとえば、1台のシステムでサーバ状態を監視し、別のシステムでVCEM実装
を実行している場合です。システムのリモート監視は、VCEMシステムでSIMの検出が一定周期で自
動的に実行されるように設定されていないことを意味します。すなわち、VCEMは、ホスト名やIPアド
レスのようなサーバに関する、信頼できる情報にアクセスできません。この例では、管理者は、エン
クロージャとベイによる指定を使うことで、VCEM CLIを使用できます。
エンクロージャ名とベイ番号によるCLIの使用
別のシステムを使用してシステム情報を監視し、管理する場合は、エンクロージャ名とベイ番号によ
るCLI起動を使用することができます。管理者は、何らかの方法で、VCEMシステムで動作するCLIに
アクセスする必要があります。SSHがそれに適しています。リモート システムは、VCEMシステムに
ログインすると、障害のあるサーバのエンクロージャとベイを指定してVCEM CLIを起動することがで
きます。
22
たとえば、障害のあるサーバがDatabasesという名前のエンクロージャのベイ8にある場合、次のコ
マンドを使用します。
vcem –failover –bay Databases:8
これで、ベイ8に関連するVCEMプロファイル フェールオーバが開始します。
リモート システムを使用してシステムを監視する際の制限事項:
リモート システムからVCEMフェールオーバ を正常に開始するには、正確なデータが必要です。シ
ステムを監視し、データを収集するシステムには、以下の機能が必要です。
o
問題の発生を特定できる。
o
VCEM CLIをリモートから起動できる。
o
障害があるサーバのエンクロージャ名と該当するベイ番号に関する正確なデー
タを入手できる。
リモート システムが上記の条件を満たしていない場合は、システム監視用に Systems Insight
Managerを使用することをお勧めします。VCEMは、Systems Insight Managerの監視およびデータ
収集機能と緊密に統合されるように設計されています。
まとめ
VCEMプロファイル フェールオーバを使用すると、管理者は、システムの稼動時間と信頼性を維持
できます。指定したスペアに手動でまたは自動的にVCプロファイルをフェールオーバすることができ
ます。さらに、管理者は、フェールオーバを独自のスクリプトに組み込むことで、信頼できるコンポー
ネントとしてVCEMを使用して、より強力なソリューションを構築することができます。フェールオーバ
機能には、主に、関連付けられたVCプロファイルが異なるブレードに対して動作できなければならな
いという制限事項があります。VCEMプロファイル・フェールオーバを使用する前に、この可動性をテ
ストすることを強くお勧めします。プロファイルに関連するOSイメージが移動できる場合、VCEMプロ
ファイル フェールオーバは、管理者にとって有用なツールになります。
詳細情報
HP VCEMのWebサイトhttp://www.hp.com/jp/vcem または http://www.hp.com/GO/VCEM
(英語)を参照してください。
本書に関するご意見、ご感想は、www.hp.com/solutions/feedback にお送りください。
記載されている会社名および商品名は、各社の商標または登録商標です。
記載事項は2008年6月現在のものです。
本カタログに記載された内容は、予告なく変更されることがあります。
Intel、インテルおよびItaniumはインテル コーポレーションまたはその子会社のアメ
リカ合衆国およびその他の国における商標または登録商標です。
496805-001、2008年6月
23
Fly UP