...

設計ガイド

by user

on
Category: Documents
10

views

Report

Comments

Transcript

設計ガイド
CLUSTERPRO® D 1.1 for Windows
設計ガイド
改版履歴
版数
1
改版日付
内容
2016/12/9
新規作成
i
目次
第 1 章 はじめに........................................................................................................................... 1
1.1 対象読者と目的...................................................................................................................2
1.2 本書の構成 ..........................................................................................................................2
1.3 マニュアル体系...................................................................................................................2
1.4 表記規則 ..............................................................................................................................3
1.5 最新情報の入手先...............................................................................................................3
1.6 免責事項 ..............................................................................................................................3
1.7 商標情報 ..............................................................................................................................3
第 2 章 クラスターシステムを設計する................................................................................... 5
2.1 CLUSTERPRO D とは ........................................................................................................6
2.2 システム要件 ......................................................................................................................6
第 3 章 システム構成を設計する............................................................................................... 8
3.1 CLUSTERPRO の提供するシステム構成 .........................................................................9
3.1.1 共有ディスクを使用した 2 ノードクラスターの構成例.....................................10
3.1.2 ミラーディスクを使用した 2 ノードクラスターの構成例.................................10
3.1.3 オブジェクトストレージを使用した 2 ノードクラスターの構成例 .................11
第 4 章 運用形態を設計する..................................................................................................... 13
4.1 CLUSTERPRO の提供する運用形態 ...............................................................................14
4.1.1 片方向スタンバイクラスターのフェールオーバーの流れ.................................15
4.1.2 オンデマンド・スタンバイクラスターの運用の流れ.........................................16
4.1.3 双方向スタンバイクラスターのフェールオーバーの流れ.................................19
4.2 二重化するアプリケーションを決定する......................................................................20
4.2.1 運用形態ごとに該当する注意事項........................................................................21
4.2.2 障害発生後のデータ修復 .......................................................................................21
4.2.3 アプリケーションの終了 .......................................................................................21
4.2.4 データ格納位置.......................................................................................................21
4.2.5 複数のリソースグループ .......................................................................................22
4.2.6 アプリケーションとの相互干渉、相性問題 ........................................................22
4.2.7 注意事項に対する対策 ...........................................................................................24
4.2.8 業務形態の決定.......................................................................................................24
4.3 クラスター構成を設計する .............................................................................................24
4.3.1 ノードグループについて .......................................................................................25
ii
4.3.2 ハートビート経路について ...................................................................................26
4.3.3 リソースグループについて ...................................................................................27
4.3.4 ノード監視について ...............................................................................................27
4.3.5 リソース一覧...........................................................................................................27
4.4 業務のダウンタイムを設計する .....................................................................................28
4.5 データ保護方針を設計する .............................................................................................29
4.5.1 ミラーデータの保存先ディレクトリについて ....................................................31
第 5 章 CLUSTERPRO のインストール/アンインストール ............................................... 32
5.1 インストール前の事前準備 .............................................................................................33
5.1.1 ディスクリソースが利用するパーティションを設定する(ディスクリソース使
用時は必須)................................................................................................................33
5.1.2 ミラーリソースが利用するディスクを確認する (ミラーリソース使用時は必
須) ...............................................................................................................................33
5.1.3 クラウド環境を確認する .......................................................................................34
5.1.4 OS 起動時間を調整する (必須) .............................................................................37
5.1.5 ネットワーク設定を確認する (必須) ...................................................................37
5.1.6 パワーセービング機能をオフにする (必須) ........................................................37
5.1.7 ファイアウォールの設定を確認する(必須) .........................................................37
5.1.8 ノードの時刻を同期させる ...................................................................................38
5.2 インストール ....................................................................................................................38
5.3 アンインストール.............................................................................................................38
5.4 Advanced WebConsole の起動方法 ...................................................................................39
5.5 Web ブラウザーの接続設定 .............................................................................................40
5.6 ライセンスの登録について .............................................................................................40
5.7 注意・制限事項.................................................................................................................40
iii
第 1 章 はじめに
第1章
はじめに
目次
1.1 対象読者と目的..........................................................................................................................2
1.2 本書の構成 .................................................................................................................................2
1.3 マニュアル体系..........................................................................................................................2
1.4 表記規則 .....................................................................................................................................3
1.5 最新情報の入手先......................................................................................................................3
1.6 免責事項 .....................................................................................................................................3
1.7 商標情報 .....................................................................................................................................3
1
第 1 章 はじめに
1.1 対象読者と目的
本書は、CLUSTERPRO D を使用したクラスターシステムの導入を行うシステムエンジニア
を対象読者とし、CLUSTERPRO D をインストールするための準備作業からクラスターシス
テムの導入までについて説明します。
1.2 本書の構成
第 1 章 はじめに
対象読者と目的、最新情報の入手先などについて説明しています。
第 2 章 クラスターシステムを設計する
クラスターシステムを構築する製品である CLUSTERPRO D とそのシステム要件につい
て説明しています。
第 3 章 システム構成を設計する
CLUSTERPRO D を使用する場合に、システム構成を設計する方法について説明してい
ます。
第 4 章 運用形態を設計する
CLUSTERPRO D を使用する場合に、運用形態を設計する方法について説明しています。
第 5 章 CLUSTERPRO のインストール/アンインストール
CLUSTERPRO D をインストールする前に必要な作業と、インストール、アンインストー
ルの手順を説明しています。
1.3 マニュアル体系
CLUSTERPRO D のマニュアルと役割を以下に示します。
CLUSTERPRO D 設計ガイド
CLUSTERPRO D を使用したクラスターシステムの導入を行うシステムエンジニアを対
象読者とし、CLUSTERPRO D をインストールするための準備作業からクラスターシス
テムの導入までについて説明します。
CLUSTERPRO D ユーザーズガイド
CLUSTERPRO D を使用したクラスターシステムの導入を行うシステムエンジニアとク
ラスターシステム導入後の保守・運用を行うシステム管理者を対象読者とします。
CLUSTERPRO D の運用手順、各リソースの機能説明などを説明します。
2
第 1 章 はじめに
1.4 表記規則
本書では以下の表記法を使用します。
表記
[]角かっこ
使用方法
例
ダイアログボックス、メニューなど [スタート] をクリックします。 [プロパティ]
であることを示します
ダイアログボックス
モ ノ ス ペ ー ス パス、コマンドライン、メッセージ、 usercmd -s [-h <host_name>]
フォント
ファイル名、ファイルパス、関数な
どを示します
モ ノ ス ペ ー ス 角かっこ内の値が省略可能であるこ usercmd -s [-h <host_name>]
フォント中の[]角 とを示します
かっこで囲まれ
た部分
モ ノ ス ペ ー ス 山形かっこ内の値をユーザーが有効 usercmd -s [-h <host_name>]
フ ォ ン ト 中 の <> な値に置き換えて入力することを示
山 形 か っ こ で 囲 します
まれた部分
1.5 最新情報の入手先
最新の製品情報については、以下の Web サイトを参照してください。
http://jpn.nec.com/clusterpro
1.6 免責事項
本書の内容は、予告なしに変更されることがあります。
日本電気株式会社は、本書の技術的もしくは編集上の間違い、欠落について、一切責任をお
いません。
また、お客様が期待される効果を得るために、本書にしたがった導入、お客様が期待される
使用効果が得られるか否かにつきましては、お客様の責任とさせていただきます。
本書に記載されている内容の著作権は、日本電気株式会社に帰属します。本書の内容の一部
または全部を日本電気株式会社の許諾なしに複製、改変、および翻訳することは禁止されて
います。
1.7 商標情報
CLUSTERPRO®は日本電気株式会社の登録商標です。
Microsoft、Windows、SQL Server、Microsoft Azure、Azure DNS は、米国 Microsoft Corporation
の米国およびその他の国における登録商標です。
Linux は、Linus Torvalds 氏の米国およびその他の国における登録商標または商標です。
3
第 1 章 はじめに
Mozilla、Firefox は、米国 Mozilla Foundation の米国およびその他の国における商標または登
録商標です。
Amazon Web Services、"Powered by Amazon Web Services" ロゴ、Amazon EC2、Amazon S3、
Amazon VPC は、米国その他の諸国における Amazon.com, Inc.またはその関連会社の商標で
す。
本書に記載されたその他の製品名および標語は、各社の登録商標または商標です。
4
第 2 章 クラスターシステムを設計する
第2章
クラスターシステムを設計する
目次
2.1 CLUSTERPRO D とは ...............................................................................................................6
2.2 システム要件 .............................................................................................................................6
5
第 2 章 クラスターシステムを設計する
2.1 CLUSTERPRO D とは
CLUSTERPRO D(以下、CLUSTERPRO と記す)はシステムの障害を監視し、障害発生時には
健全なサーバーに業務を引き継ぐことで高可用性を実現するソフトウェアです。
CLUSTERPRO を使用せずに、サーバーを単独で運用している場合、次のような問題が発生
する可能性があります。
1.
サーバーの一時的な障害・故障によるサーバーへのアクセス不可
2.
障害からの復旧時にデータが存在しないことによるサーバーのデータ紛失
3.
局地的な災害によるデータの全損失
CLUSTERPRO を導入することでこれらの問題を次のように解消することが可能です。
サーバーの一時的な障害・故障によるサーバーへのアクセス不可
一時的なネットワーク障害やディスクの故障によりサーバーダウンが発生すると、サー
バーへアクセスができなくなります。
CLUSTERPRO を使用することで、稼働しているサーバーに障害が発生しても、サーバー
で起動している業務やサービスを待機しているサーバーに切り替えることが可能にな
り、常に業務やサービスにアクセスすることができます。
障害からの復旧時にデータが存在しないことによるサーバーのデータ紛失
バックアップデータからサーバーの障害復旧を行う場合、バックアップを行ってから障
害が発生した時間までのデータは紛失してしまいます。
CLUSTERPRO を使用することで、稼働しているサーバーのデータを待機しているサー
バーでも保持することが可能になり、万が一の場合でも待機しているサーバーからデー
タの復旧を行うことができます。
局地的な災害によるデータの全損失
洪水や地震などの災害発生時にはサーバーだけでなく、その施設全体に影響が発生しま
す。 被害の影響が大きな場合、データを迅速に復旧させることは困難です。 また、バッ
クアップデータを同じ施設内に保管しているとデータをすべて損失する可能性があり
ます。
CLUSTERPRO を使用することで、ネットワークで接続された遠隔地で待機している
サーバーにデータを保持することが可能です。 災害発生時においても遠隔地で待機し
ているサーバーに機能を引き継がせることで、継続的にサーバーを稼働させることがで
きます。
2.2 システム要件
CLUSTERPRO を動作させるための要件とコンソールの対応ブラウザーを次に示します。
6
第 2 章 クラスターシステムを設計する
• OS
アーキテクチャは、x86_64 に対応しています。
OS
Windows Server 2012
Windows Server 2012 R2
Windows Server 2016
• 必要スペック
項目
内容
必要メモリ容量
220MB 以上*1
必要ディスクサイズ
300MB 以上の空き容量
運用時最大:1.6GB*2
*1 利用するリソース数によって表中の値以上のメモリ容量が必要です。
*2 ミラーリソースを利用する場合、表中の値に加え[ミラーデータの保存先ディレクトリサ
イズ]に設定する値の合計値分が追加で必要です。
• 対応ブラウザー
言語
ブラウザー
Internet Explorer 10
日本語/英語/中国語
Internet Explorer 11
日本語/英語/中国語
Mozilla Firefox 45 以降
日本語/英語/中国語
7
第 3 章 システム構成を設計する
第3章
システム構成を設計する
目次
3.1 CLUSTERPRO の提供するシステム構成 ................................................................................9
8
第 3 章 システム構成を設計する
3.1 CLUSTERPRO の提供するシステム構成
構築するクラスターの用途や運用形態を確認してから、クラスターの構成を決定します。
CLUSTERPRO の提供するシステム構成には、ディスクリソースを利用する共有ディスク構
成とミラーリソースを利用するミラーディスク構成があります。
ミラーディスク構成には、ミラー方式として同期、非同期、スナップショット、オブジェク
トストレージを選択できます。
共有ディスク構成
共有ディスク構成は、クラスターを構成するノードから接続可能な共有ディスクにデー
タを格納し、フェールオーバーが発生したあとでも同じデータにアクセスする構成で
す。 業務アプリケーションを起動しているノードが共有ディスクの特定領域を利用し
ている場合、残りのノードは共有ディスクにアクセスできないようにします。
データの書き込みにおける性能劣化がないため、データベースサーバーなどのデータの
書き込み量が多いシステムで利用します。
ミラーディスク構成
ミラーディスク構成は、クラスターを構成するノードのディスク間で業務データをミ
ラーリングし、フェールオーバーが発生したあとでもミラーリングしている同じデータ
にアクセスする構成です。 ミラーディスク構成では、設定したミラー方式でのミラーリ
ングが困難になった場合やその状態が解消された場合に、自動的にミラー方式が切り替
わります(インテリジェントミラーリング)。
また、3 台以上のノードでミラーリングを行う場合、データ同期元の負荷分散として
1:M:N のミラーデータの同期経路(マルチステージ構成)を自動的に形成します。
待機系のノードを遠隔地に配置して遠隔クラスターを構成し災害対策を行う場合に、ミ
ラーディスク構成を利用します。 共有ディスクのように外部ディスクを利用すること
なく、ノードに内蔵されているディスクだけでクラスターを構築できるため、システム
の価格を安く抑えることが可能です。
オブジェクトストレージ構成
オブジェクトストレージ構成は、ミラーディスク構成でミラー方式にオブジェクト
ストレージを選択した場合の構成です。 オブジェクトストレージ構成では、ミラー
リングしているデータを一定間隔でクラウドサービス事業者の提供するオブジェク
トストレージに保存することができます。
待機系のノードが起動したタイミングでオブジェクトストレージに保存されたデー
タのミラーリングを行います。 ミラーデータがオブジェクトストレージに保存さ
れるため、待機系のノードを常に起動しておく必要がありません。
9
第 3 章 システム構成を設計する
クラウド環境など、ノードの稼働時間による従量課金のサービスを利用している場
合、システムの負荷が少ない時間帯に待機系のノードを停止してシステムの運用コ
ストを低減する手段として利用できます。
3.1.1 共有ディスクを使用した 2 ノードクラスターの構成例
Public LAN に接続されているクライアント(Management terminal)は、クラスターと接続する
ことが可能です。
クラスターを構築しているノード間に Interconnect LAN を用意し、ハートビート経路に設定
することでお互いの死活監視を実行します。
クラスターを構築するノードは、OS が同じであればサーバーの種類やモデルが別であって
もクラスターを構築可能です。
ミラーディスク構成に比べて、データが書き込まれたときにおけるノードの性能劣化がない
ため、データベースサーバーなど、データの書き込み量が多いシステムでの利用に適してい
ます。
ただし、ミラーディスク構成ではスナップショットによる過去データの参照が可能なため、
共有ディスクのバックアップを行う間隔によってはデータ保護の観点でミラーディスク構
成に劣ります。
Management terminal
Public LAN
Interconnect LAN*1
Node 2
Node 1
Fibre Channel*2
図 3-1 共有ディスクの構成例
*1 Interconnect LAN は、ノード間を直接接続する以外に、HUB を経由して接続することも可能
です。
*2 Fibre Channel 以外に、iSCSI などを利用した接続も可能です。
3.1.2 ミラーディスクを使用した 2 ノードクラスターの構成例
Public LAN に接続されているクライアント(Management terminal)は、クラスターと接続する
ことが可能です。
10
第 3 章 システム構成を設計する
クラスターを構築しているノード間に Interconnect LAN を用意し、ハートビート経路に設定
することでお互いの死活監視を実行します。
クラスターを構築するノードは、OS が同じであればサーバーの種類やモデルが別であって
もクラスターを構築可能です。
共有ディスク構成のように外部ディスクを利用することなく、ノードに内蔵されているディ
スクだけでクラスターを構築できるため、システムの価格を安く抑えることが可能です。
ミラーリソースは、ファイルシステムからの write 要求を 1 件ずつ順番に待機系ノードと同
期させて処理します。 ファイルシステムからの write 要求は、ミラーリソースが待機系の
ノードにデータを送信できたことを確認した時点で完了し、次の要求の処理に移ります。
ファイルシステムからの write 要求のサイズはファイルシステムに依存します。
また、ミラーディスク構成ではミラーリングしているデータのスナップショットを定期的、
または、任意で取得することが可能なため、必要に応じて過去データの参照が可能です。
ただし、ミラーディスク構成ではデータが書き込まれた際にミラーリングの処理を実行する
ため、共有ディスク構成と比較するとデータの書き込み性能が劣化します。 アプリケー
ションにおける Read 対 Write の比率が約 2:1 の場合、約 20%ほど性能が低下します。
ミラーディスク構成は、構成例のような物理環境のノード間だけでなく、物理環境と仮想環
境やクラウド上の環境が混在した場合でも構築可能です。
Management terminal
Public LAN
Interconnect LAN*1
Node 2
Node 1
図 3-2 ミラーディスクの構成例
*1 Interconnect LAN は、ノード間を直接接続する以外に、HUB を経由して接続することも可能
です。
3.1.3 オブジェクトストレージを使用した 2 ノードクラスターの構
成例
Public LAN に接続されているクライアント(Management terminal)は、クラスターと接続する
ことが可能です。
ミラーデータをノード間で直接同期せず、クラウド上のオブジェクトストレージを利用して
同期します。
11
第 3 章 システム構成を設計する
データ同期元のノードは、クラウド上のオブジェクトストレージにミラーデータを格納しま
す。 待機系のノードは、オブジェクトストレージ上のミラーデータを、クラスター基幹サー
ビスが起動したあとに取得し、同期します。 平常時の運用では、クラウド上の待機系のノー
ドを停止しておきます。
オブジェクトストレージに格納したミラーデータが削除されると、待機系のノードでクラス
ター基幹サービスが起動しても、ミラーデータの同期ができません。 また、オブジェクト
ストレージに格納されたミラーデータの量が大きくなればなるほど、データの同期にかかる
時間が増加します。
このため、クラウド上の待機系のノードは、定期的に起動し、ミラーデータを同期すること
を推奨します。
平常時に待機系のノードを停止しておくことが可能なため、クラウド環境上でのシステムの
運用コストを削減する手段として利用できます。 ただし、障害が発生した場合は、オブジェ
クトストレージ上に格納されているミラーデータで起動することになるため、ミラーディス
ク構成と比較してリアルタイム性に劣ります。
オブジェクトストレージ構成はクラウド上のノード間のみの構成に限らず、構成例のように
物理環境とクラウド上の環境が混在した場合でも構築可能です。
On-premise
Management terminal
Cloud
Public LAN
VPN
Object
Storage
Node 1
Node 2
図 3-3 オブジェクトストレージの構成例
12
第 4 章 運用形態を設計する
第4章
運用形態を設計する
目次
4.1 CLUSTERPRO の提供する運用形態 ......................................................................................14
4.2 二重化するアプリケーションを決定する.............................................................................20
4.3 クラスター構成を設計する ....................................................................................................24
4.4 業務のダウンタイムを設計する ............................................................................................28
4.5 データ保護方針を設計する ....................................................................................................29
13
第 4 章 運用形態を設計する
4.1 CLUSTERPRO の提供する運用形態
CLUSTERPRO では、以下に示す運用形態をサポートしています。 図中の実線で記載された
リソースグループは起動している状態、点線で記載されたリソースグループは待機している
状態を意味します。
片方向スタンバイクラスター
クラスターシステムで同一の業務アプリケーションを含むリソースグループ(RG_A)が
1 つしか起動しないシステムの運用形態です。 待機系にも同一の性能のノードを用意
することでフェールオーバー発生後もパフォーマンスの劣化などはありませんが、待機
系のノードを常に起動しておく必要があります。
RG_A
RG_A
Node 1
Node 2
図 4-1 片方向スタンバイクラスター
オンデマンド・スタンバイクラスター
オンデマンド・スタンバイクラスターは、オブジェクトストレージを利用する片方向ス
タンバイクラスターの運用形態のひとつです。 オンデマンド・スタンバイクラスターで
は、オブジェクトストレージと連携することで、待機系のノードの起動時間を最小化
し、運用コストを安く抑えることが可能です。 片方向スタンバイクラスターと比較する
と、待機系のノードの起動時間やオブジェクトストレージに格納されているデータと同
期するための時間が必要になるため、業務のダウンタイムが増加します。
On-premise
Cloud
RG_A
RG_A
Object
Storage
Node 1
Node 2
VPN
図 4-2 片方向スタンバイクラスター
双方向スタンバイクラスター(異種アプリケーション)
複数の種類の業務アプリケーションをそれぞれに含むリソースグループ(RG_A、RG_B)
が、それぞれ異なるノードで起動し、相互に待機するシステムの運用形態です。 フェー
ルオーバーが発生した場合、1 台のノードで複数の業務が動作するため、業務のパフォー
マンスが劣化します。 複数のリソースグループが同時に動作しても性能に影響がでな
いスペックが各ノードに必要です。
14
第 4 章 運用形態を設計する
RG_B
RG_B
RG_A
RG_A
Node 1
Node 2
図 4-3 双方向スタンバイクラスター(異種アプリケーション)
双方向スタンバイクラスター(同一アプリケーション)
クラスターシステムで同一の業務アプリケーションを含むリソースグループ(RG_A_1、
RG_A_2)が複数起動し、相互に待機するシステムの運用形態です。 この構成を構築する
には業務アプリケーションが多重起動に対応している必要があります。 フェールオー
バーが発生した場合、1 台のノードで複数の業務が動作するため、業務のパフォーマン
スが劣化します。 複数のリソースグループが同時に動作しても性能に影響がでないス
ペックが各ノードに必要です。
RG_A_2
RG_A_2
RG_A_1
RG_A_1
Node 1
Node 2
図 4-4 双方向スタンバイクラスター(同一アプリケーション)
4.1.1 片方向スタンバイクラスターのフェールオーバーの流れ
片方向スタンバイクラスターでは、業務が動作するリソースグループをクラスター内で常に
1 台のノードでしか起動しないように制限します。
以下に片方向スタンバイクラスターでフェールオーバーが発生した場合の例を示します。
1.
Node 1 で業務が動作するリソースグループ(RG_A)を起動します。
2.
Node 1 で障害が発生した場合、CLUSTERPRO がリソースグループ(RG_A)をフェール
オーバーします。
3.
フェールオーバーが完了すると、リソースグループ(RG_A)が Node 2 で起動し、業務
を継続します。
4.
障害が発生した Node 1 の復旧作業が完了した場合、リソースグループ(RG_A)を移動
します。
15
第 4 章 運用形態を設計する
1
RG_A
Node 1
RG_A
Node 2
2
RG_A
Node 1
RG_A
Node 2
3
RG_A
Node 1
RG_A
Node 2
4
RG_A
Node 1
RG_A
Node 2
図 4-5 片方向スタンバイクラスターのフェールオーバーの流れ
4.1.2 オンデマンド・スタンバイクラスターの運用の流れ
オンデマンド・スタンバイクラスターでは、待機系のノードを定期的に起動し、ミラーデー
タの同期をすることを推奨します。
以下にオンデマンド・スタンバイクラスターでの運用の例を示します。
1.
Node 1 で起動しているリソースグループ(RG_A)がオブジェクトストレージにミラー
データを格納します。
2.
Node 1 で障害が発生した場合に、運用担当者が待機系の Node 2 を起動します。 Node
2 の起動後、データ同期画面で Node 2 を選択したときに表示される同期開始ボタンを
16
第 4 章 運用形態を設計する
選択します。 同期開始ボタンを選択することで、オブジェクトストレージに格納され
ているミラーデータと Node 2 のミラーデータを同期できます。
3.
オブジェクトストレージに格納されているミラーデータと Node 2 のミラーデータの
同期が完了したあと、Node 2 でリソースグループ(RG_A)を起動します。 リソースグ
ループ(RG_A)が Node 2 で起動したあとは、Node 2 からオブジェクトストレージにミ
ラーデータを格納します。
4.
障害が発生した Node 1 の復旧作業が完了した場合、Node 1 の起動後、データ同期画面
で Node 1 を選択したときに表示される同期開始ボタンを選択します。 同期開始ボタ
ンを選択することで、オブジェクトストレージに格納されているミラーデータと Node
1 のミラーデータを同期できます。
5.
オブジェクトストレージに格納されているミラーデータと Node 1 のミラーデータの
同期が完了したあと、リソースグループ(RG_A)を移動します。 リソースグループ
(RG_A)の移動後、運用担当者が待機系の Node 2 を停止します。
17
第 4 章 運用形態を設計する
1
On-premise
Cloud
RG_A
RG_A
Object
Storage
Node 1
Node 2
VPN
2
On-premise
Cloud
RG_A
RG_A
Object
Storage
Node 1
Node 2
VPN
3
On-premise
Cloud
RG_A
RG_A
Object
Storage
Node 1
Node 2
VPN
4
On-premise
Cloud
RG_A
RG_A
Object
Storage
Node 1
Node 2
VPN
5
On-premise
Cloud
RG_A
RG_A
Object
Storage
Node 1
Node 2
VPN
図 4-6 オンデマンド・スタンバイクラスターのフェールオーバーの流れ
18
第 4 章 運用形態を設計する
4.1.3 双方向スタンバイクラスターのフェールオーバーの流れ
双方向スタンバイクラスターでは、各ノード上で業務が動作するリソースグループが起動し
ます。 フェールオーバーが発生し、リソースグループがあるノードに集中すると複数のリ
ソースグループを起動するノードの負荷が増大し、パフォーマンスが劣化する可能性があり
ます。
以下に双方向スタンバイクラスターでフェールオーバーが発生した場合の例を示します。
1.
Node 1、Node 2 で業務が動作するリソースグループ(RG_A、RG_B)を起動します。
2.
Node 1 で障害が発生した場合、CLUSTERPRO がリソースグループ(RG_A)をフェール
オーバーします。
3.
フェールオーバーが完了すると、リソースグループ(RG_A)が Node 2 で起動し、業務
を継続します。 このとき、Node 2 にリソースグループ(RG_A、RG_B)が集中するた
め、Node 2 の負荷が増大し、リソースグループが 1 つしか起動していなかった状態と
比較してパフォーマンスが劣化します。
4.
障害が発生した Node 1 の復旧作業が完了した場合、リソースグループ(RG_A)を移動
します。
19
第 4 章 運用形態を設計する
1
RG_B
RG_B
RG_A
RG_A
Node 1
Node 2
2
RG_B
RG_B
RG_A
RG_A
Node 1
Node 2
3
RG_B
RG_B
RG_A
RG_A
Node 1
Node 2
4
RG_B
RG_B
RG_A
RG_A
Node 1
Node 2
図 4-7 双方向スタンバイクラスターのフェールオーバーの流れ
4.2 二重化するアプリケーションを決定する
二重化するアプリケーションを決定するには、アプリケーションが CLUSTERPRO によるク
ラスターシステムで二重化の対象として適しているかどうか、以下の注意事項を十分に検討
して判断します。
20
第 4 章 運用形態を設計する
4.2.1 運用形態ごとに該当する注意事項
二重化する対象のアプリケーションをどのような運用形態で扱うかによって該当する注意
事項が異なります。採用する運用形態にあわせて注意事項を確認してください。
表内の Y の値は、その構成が注意事項に該当することを意味し、N は該当しないことを意味
します。
注意事項
片方向スタンバイ
クラスター
オンデマンド・スタ
ンバイクラスター
双方向スタンバイ
クラスター
「4.2.2 障害発生後のデータ修復(21 ペー
ジ)」
Y
Y
Y
「4.2.3 アプリケーションの終了(21 ペー
ジ)」
Y
Y
Y
「4.2.4 データ格納位置(21 ページ)」
Y
Y
Y
「4.2.5 複数のリソースグループ(22 ペー
ジ)」
N
N
Y
「4.2.6 アプリケーションとの相互干渉、
相性問題(22 ページ)」
Y
Y
Y
4.2.2 障害発生後のデータ修復
業務アプリケーションがデータを更新している状態で障害が発生し、フェールオーバーが発
生すると待機系で業務アプリケーションが起動したときにファイルのデータ更新が完了し
ていない場合があります。
単体ノードで運用中に障害が発生し、ノードが再起動した場合でも同様の問題が発生しま
す。 このため、業務アプリケーションはこのような障害に対処する機能を持っておく必要
があります。
クラスターシステムでは、この機能に加えて人手の関与なしに復旧を行う必要があるため、
場合によってはスクリプトなどを作り込む必要があります。
4.2.3 アプリケーションの終了
CLUSTERPRO は、共有ディスク、または、ミラーディスクを利用する業務アプリケーショ
ンを含むリソースグループを停止、または、移動する場合にリソースグループが使用してい
るファイルシステムをアンマウントします。 ファイルシステムが CLUSTERPRO によって
アンマウントされるため、業務アプリケーションの終了指示により、共有ディスク、また
は、ミラーディスクのすべてのファイルに対するアクセスは停止する必要があります。
業務アプリケーションの終了指示がアプリケーションの終了と非同期で完了する場合には
注意が必要です。
4.2.4 データ格納位置
CLUSTERPRO がノード間で引き継ぐことができるデータは次のとおりです。
21
第 4 章 運用形態を設計する
• 共有ディスク、または、ミラーディスク上のデータ
• ファイル共有リソースで使用するディスク上の共有設定情報
• レジストリ同期リソースで同期されたレジストリキーの値
業務アプリケーションのデータは、ノード間で共有するデータとノード固有のデータの 2 つ
に分けて、異なる配置場所に保存する必要があります。
ノード間で共有するユーザーデータなどは、共有ディスク、または、ミラーディスク上に保
存します。
ノード固有の設定情報などは、ノードのローカルディスクに保存します。
4.2.5 複数のリソースグループ
双方向スタンバイクラスターの運用形態では、障害によるフェールオーバーで 1 つのノード
上で同一アプリケーションによる複数のリソースグループが起動することを想定する必要
があります。
単一ノードで複数のリソースグループが起動した場合に業務アプリケーションを同時に実
行可能、かつ、次のいずれかの方法で業務を引き継げる必要があります。
以下は、共有ディスク構成、ミラーディスク構成のどちらの場合でも共通の注意事項です。
• 複数のプロセスを起動する
新たに別プロセスを起動する方法です。複数のリソースグループが同時に起動した場
合、業務アプリケーションが同時に動作できる必要があります。
• アプリケーションを再起動する
リソースグループがフェールオーバー、または、移動してきた場合に、すでに起動して
いる業務アプリケーションのプロセスを一度停止し、再起動する方法です。
業務アプリケーションの再起動によって、フェールオーバー、または、移動してきたリ
ソースグループの業務内容を単一のプロセスで引き継げる必要があります。
• 動的に追加する
リソースグループがフェールオーバー、または、移動してきた場合に、すでに起動して
いる業務アプリケーションに対して、自動またはスクリプトから業務アプリケーション
の追加を指示する方法です。
業務アプリケーションの追加の指示によって、業務アプリケーションのプロセスを再起
動することなく、フェールオーバー、または、移動してきたリソースグループの業務内
容を引き継げる必要があります。
4.2.6 アプリケーションとの相互干渉、相性問題
CLUSTERPRO の機能や動作に必要な OS 機能との相互干渉によってアプリケーション、ま
たは、CLUSTERPRO が動作できない場合があります。
22
第 4 章 運用形態を設計する
共有ディスクのアクセス制御
CLUSTERPRO がリソースグループで管理するアプリケーションは、同じリソースグ
ループに追加しているディスクリソースとの依存関係を制御することで、アプリケー
ションが起動するタイミングでマウント先ディレクトリにアクセス可能になります。
ディスクリソースが管理するマウント先ディレクトリに対して、ディスクリソースが停
止しているときに書き込んだファイルはディスクリソースの起動によって参照できな
くなります。
ディスクリソースが管理するマウント先ディレクトリに対して、ディスクリソースが停
止しているときにファイルを書き込むと、ディスクリソースの起動に失敗します。
ミラーディスクのアクセス制御
CLUSTERPRO がリソースグループで管理するアプリケーションは、同じリソースグ
ループに追加しているミラーリソースとの依存関係を制御することで、アプリケーショ
ンが起動するタイミングでマウント先ディレクトリにアクセス可能になります。
ミラーリソースが管理するマウント先ディレクトリは、ミラーリソースが停止している
場合、アクセスが制限され、読み込みと書き込みができません。
マルチホーム環境および IP アドレスの移動
CLUSTERPRO では、1 つのノードが複数の IP アドレスを持つ場合があります。また、
仮想 IP アドレスはノード間で移動するため、各ノードの IP アドレスの構成は動的に変
化します。 このようなマルチホーム環境に業務アプリケーションが対応していないと、
例えば自ノードの IP アドレスを取得しようとして誤って Interconnect LAN のアドレス
を取得し、クライアントとの通信に使用するアドレスと異なるために誤動作する、など
が発生する可能性があります。 ノード側の IP アドレスを意識する必要がある業務アプ
リケーションの場合、使用する IP アドレスを明示的に指定できる必要があります。
アプリケーションの共有ディスクまたはミラーディスクへのアクセス
業務アプリケーションと共存する別のアプリケーションにリソースグループの停止は
通知されません。 リソースグループを停止するタイミングで、もしも共存する別のアプ
リケーションがディスクリソースまたはミラーリソースが管理するマウント先ディレ
クトリにアクセスしている場合、アンマウントに失敗し、リソースグループの停止がで
きません。 システム監視のサービスを行うようなアプリケーションの中には、定期的に
OS に認識されたすべてのファイルシステムにアクセスするものがあります。 業務アプ
リケーションと共存する別のアプリケーションには、監視対象のディレクトリを指定で
きる機能などが必要です。
23
第 4 章 運用形態を設計する
4.2.7 注意事項に対する対策
障害発生後のデータ修復
• 問題:データファイル更新中に障害が発生し、フェールオーバーしたときに待機系の
ノードでアプリケーションが正常に動作しない
• 対策:プログラム修正、または、更新途中のデータを復旧する処理をフェールオー
バーが発生したときに実行するよう汎用リソースとスクリプトの追加/修正をする
アプリケーションの終了
• 問題:アプリケーションを停止しても一定時間の間、共有ディスク、または、ミラー
ディスクへアクセスし続ける
• 対策:汎用リソースの停止スクリプトのなかにアプリケーションの停止を待ち合わ
せる処理(timeout コマンドなど)を追加し、処理を待ち合わせる
データ格納位置
• 問題:一台のノード上で同一アプリケーションを複数起動できない
• 対策:双方向スタンバイクラスターの運用では、フェールオーバーが発生したときに
アプリケーションを再起動し、共有データを引き継げるようにする
4.2.8 業務形態の決定
注意事項を踏まえたうえで、業務形態を決定してください。
• どのアプリケーションをいつ起動するか
• 起動時やフェールオーバーが発生したときに必要な処理は何か
• 共有ディスク、ミラーディスクのマウント先ディレクトリに保存すべき情報は何か
4.3 クラスター構成を設計する
CLUSTERPRO は、業務アプリケーションをリソースグループと呼ばれるコンテナーで管理
します。 リソースグループは、仮想 IP リソースやディスクリソースといったリソースをま
とめて管理し、障害発生時にはリソースグループ単位でフェールオーバーします。
24
第 4 章 運用形態を設計する
Management terminal
Public LAN
RG_A
Interconnect LAN*1
Node 2
Node 1
Fibre Channel*2
RG_A
Disk
resource
Virtual IP
resource
Generic
resource
図 4-8 クラスターの構成例
*1 Interconnect LAN は、ノード間を直接接続する以外に、HUB を経由して接続することも可能
です。
*2 Fibre Channel 以外に、iSCSI などを利用した接続も可能です。
ディスクリソースと仮想 IP リソースを含むリソースグループでディスクリソースに障害が
発生し、フェールオーバーする場合、リソースグループ単位でフェールオーバーします。
ディスクリソースのみが、フェールオーバーすることはありません。また、同一のリソース
が、複数のリソースグループに含まれることはありません。
4.3.1 ノードグループについて
災害対策を行うために遠隔クラスターを構築した場合、業務アプリケーションが遠隔地にあ
るノードで起動するとクラスター間のレイテンシが大きくなります。
CLUSTERPRO では、オプション製品ライセンスである DR Option を購入することで、複数
のノードをまとめるノードグループを追加することができます。
ノードグループは平常時に業務アプリケーションが動作するノード群(ノードグループ A)、
遠隔地のノード群(ノードグループ B)のように設定します。
ノードグループを設定することで、ノードグループ間のミラー方式に非同期でのミラーリン
グまでしか動作しないなどの制限をかけることが可能です。 ミラー方式に非同期でのミ
ラーリングまでという制限をかけることで、ミラー方式が同期で動作している場合と比較し
てレイテンシを小さくすることが可能です。
また、平常時の運用では、ノードグループ A の中で自動でフェールオーバーを行い、ノー
ドグループ A 全体に障害が発生した場合に運用担当者の判断で、ノードグループ B に業務
アプリケーションを移動させることなどが可能です。
25
第 4 章 運用形態を設計する
4.3.2 ハートビート経路について
クラスターを構築するノードがおたがいの状態を確認せずに、それぞれのノードで業務アプ
リケーションを起動すると、データの書き込みで競合が発生したり、データの一貫性が失わ
れたりする可能性があります。 CLUSTERPRO では、ハートビート経路を設定することで、
クラスターを構築するノードがクラスターを構成する別のノードに対して、相互にハート
ビートを送信することで死活監視を行います。
クラスターを構築するノードは、自ノードが起動している間、ハートビートインターバルに
設定した間隔で各ノードにハートビートを送信します。 前回のハートビートの受信時刻か
ら、ハートビートタイムアウト時間に設定した時間が経過しても、新しいハートビートが届
かない場合にハートビート経路で異常が発生したと判断します。
ハートビート経路で異常が発生した場合、設定に応じて、リソースグループをフェールオー
バーします。 ただし、ハートビート経路で異常が発生した原因として、ノードの障害だけ
ではなく、ノード間のネットワークに障害が発生している可能性があります。 異常の原因
がネットワークの障害だった場合、フェールオーバーが実行されると複数のノードで業務ア
プリケーションが起動する場合があり、データの競合などの問題が発生してしまいます。
ハートビート経路の設定では、ノードごとのハートビートの送信のほかにハートビート経路
上に存在するゲートウェイサーバーなど、クラスターを構築するノード以外の ping 解決の
できる相手先を利用した経路診断を設定することができます。
経路診断は、ハートビート経路で異常が発生し、ノードの障害とネットワークの障害のどち
らかを区別する必要がある場合に動作する機能です。 経路診断先にノード間のハートビー
ト経路上とは関係のない相手先を指定した場合は、ノードの障害とネットワークの障害を正
しく区別できません。
ハートビート経路で異常が発生した場合、各ノードは経路診断先と通信できるかを確認しま
す。 経路診断が正常だったノードは、相手先ノードに障害が発生したと判断し、設定に応
じて、リソースグループをフェールオーバーします。 経路診断が異常だったノードは、自
ノードに障害が発生したと判断し、自ノードのクラスター基幹サービスを停止します。
経路診断は、ハートビート経路で異常が発生したときに動作します。 経路診断先との通信
で異常で発生した場合でも、ノード間のハートビートに異常がない場合はフェールオーバー
やクラスター基盤サービスの停止を実行することはありません。
経路診断先を設定し、ノードの障害とネットワークの障害の判断ができれば、業務アプリ
ケーションの複数同時起動によるデータの競合などの発生を予防することができるため、
CLUSTERPRO では経路診断の利用を推奨します。
また、ハートビート経路は複数設定することが可能です。 「3.1.1 共有ディスクを使用した
2 ノードクラスターの構成例(10 ページ)」にある Public LAN と Interconnect LAN のように
独立した 2 つのネットワークがある場合は、それぞれにハートビート経路を設定することを
推奨します。
26
第 4 章 運用形態を設計する
4.3.3 リソースグループについて
CLUSTERPRO でフェールオーバーを実現するには、フェールオーバーを行うリソースグ
ループを作成する必要があります。 リソースグループは一つ以上のリソースで構成されま
す。 リソースは、リソースグループごとに登録されるため、複数のリソースグループに重
複して同じリソースを登録することはできません。
クラスターシステムを作成するためには、業務の冗長化のために必要なリソースを選択し、
リソースグループを作成する必要があります。 CLUSTERPRO で提供するリソースは
「4.3.5 リソース一覧(27 ページ)」を参照してください。
4.3.4 ノード監視について
ノード監視は、指定したノードに対して監視を行います。監視対象の異常を検知した場合に
は、リソースグループの再起動やフェールオーバー、ノードの再起動などを行います。 ノー
ド監視は、クラスター基幹サービスが起動している間、常駐して監視を行います。
ノード監視は、ノード監視グループという複数のノード監視をまとめて管理するコンテナー
に登録することが可能です。 ノード監視グループを利用することで、複数のノード監視で
異常が発生した場合にのみ、リソースグループをフェールオーバーさせるといった設定が可
能です。 ノード監視は、複数のノード監視グループに所属することが可能です。
CLUSTERPRO で提供するリソースは「4.3.5 リソース一覧(27 ページ)」を参照してくださ
い。
4.3.5 リソース一覧
CLUSTERPRO で利用できるリソースの一覧を以下に示します。 表内の Y の値は、対象にリ
ソースを追加できることを意味し、N は対象にリソースが追加できないことを意味します。
リソースグループ
ノード監視
AWS ドメインネームリソース
Y
N
クラウド基盤監視リソース
N
Y
ダイナミック DNS リソース
Y
N
ディスクリソース
Y
N
ディスク監視リソース
N
Y
データベースリソース
Y
N
ネットワーク監視リソース
N
Y
ファイル共有リソース
Y
N
プロセス監視リソース
Y
Y
ミラーリソース
Y
N
レジストリ同期リソース
Y
N
仮想 IP リソース
Y
N
汎用リソース
Y
Y
リソース名
27
第 4 章 運用形態を設計する
4.4 業務のダウンタイムを設計する
業務のダウンタイムとは、障害などによる業務停止から業務が復旧するまでの時間です。
CLUSTERPRO は、業務を復旧するまでに、業務の異常の検知、同一ノード上で業務の復旧、
別ノードへの業務のフェールオーバーを行います。
このため、リソースの監視インターバル、監視タイムアウト、監視リトライ回数とリソース
グループの回復動作で、業務のダウンタイムを調整することが可能です。
RTO(Recovery Time Objective)を設定する目安として、監視異常を検知した場合と監視タイム
アウトが発生した場合の 2 つの例を示します。
例では、リソースグループの再起動時間とフェールオーバーにかかる時間を以下のように定
義し、30 秒と仮定しています。
• リソースグループの再起動時間:同一ノード上で業務を停止してから起動し、業務が開
始するまでの時間
• フェールオーバーにかかる時間:異常が発生したノードで業務を停止してから別のノー
ドで業務を起動し、業務が開始するまでの時間
構築するクラスターの運用形態や利用するリソースの種類によって、リソースグループの再
起動時間とフェールオーバーにかかる時間は異なります。 RTO(Recovery Time Objective)を
設計する場合には、構築した環境でそれぞれにかかる時間を計測してください。
なお、オンデマンド・スタンバイクラスターで運用する場合、待機系のノードの起動時間と
CLUSTERPRO の起動時間、オブジェクトストレージに格納されているデータと同期する時
間が業務のダウンタイムに追加されます。 これらの時間によって、業務のダウンタイムが
増加することに注意してください。
• 設定値の例
- 監視インターバル:30 秒
- 監視リトライ回数:1 回
- 監視タイムアウト時間:60 秒
- リソースグループの回復動作:再起動
• 実測値の例
- リソースグループの再起動時間:30 秒
- フェールオーバーにかかる時間:30 秒
• 監視異常を検知した場合:180 秒(=監視インターバル(障害検出にかかる最大時間 30 秒)
+監視リトライ回数による監視インターバルの待ち時間(30 秒)+リソースグループの再
起動(30 秒)+監視インターバル(障害検出にかかる最大時間 30 秒)+監視リトライ回数に
よる監視インターバルの待ち時間(30 秒)+フェールオーバーにかかる時間(30 秒))
28
第 4 章 運用形態を設計する
• 監視タイムアウトが発生した場合:180 秒(=監視タイムアウト時間(60 秒)+リソースグ
ループの再起動(30 秒)+監視タイムアウト時間(60 秒)+フェールオーバーにかかる時間
(30 秒))
また、ミラーディスク構成の場合は上記に加えて、リソースグループの設定に留意する必要
があります。
データ同期元のノードに障害が発生し、かつ、[最新のミラーデータを保持しない場合は起
動しない]の設定が有効(既定値)である場合、待機系のノードのうち、最新のミラーデータを
保持しているノードに自動でフェールオーバーします。 最新のミラーデータを保持してい
るノードがない場合は、フェールオーバーが発生せず、データ同期元のノードでリソースグ
ループを起動したまま、監視で異常を検出した場合の動作を行います。
この場合、障害の発生する直前のデータを利用して業務を再開するためには、最新のミラー
データを保持するノードを復旧する必要があります。 ノードを復旧したあと、待機系の
ノードでミラーデータの同期を実行し、業務を再開してください。
待機系のノードでミラーデータの同期を行わずにリソースグループを起動した場合は、[最
新のミラーデータを保持しない場合は起動しない]の設定が無効である場合と同様に業務
データの巻き戻りが発生します。
データ同期元のノードに障害が発生し、かつ、[最新のミラーデータを保持しない場合は起
動しない]の設定が無効である場合、最新のミラーデータを保持していない待機系のノード
にも自動でフェールオーバーします。 このときのフェールオーバー先には、待機系のノー
ドのなかで一番新しいミラーデータを保持しているノードを選択します。 一番新しいミ
ラーデータを保持しているノードが複数ある場合は、複数のノードのうち、リソースグルー
プの設定にある[リソースグループを起動するノード]の優先度が高いノードを選択します。
業務データの巻き戻りを許容し、自動でフェールオーバーを実行したい場合に適します。
業務データの巻き戻る目安は、フェールオーバーを実行したときのミラー方式によって異な
ります。 データの巻き戻る目安は、「4.5 データ保護方針を設計する(29 ページ)」を参照
してください。
4.5 データ保護方針を設計する
クラスターシステムに障害が発生した場合に備えて、業務データの保護方法について検討す
る必要があります。 業務データの保護方法は共有ディスク構成の場合と、ミラーディスク
構成の場合で異なります。
共有ディスク構成を利用する場合は、ストレージの持つクローン機能やレプリケーション機
能、あるいは、バックアップソフトウェアなど CLUSTERPRO 以外の製品を利用してデータ
を保護してください。 共有ディスク構成の場合は、障害が発生しても共有ディスク上にあ
るデータに異常や損失がなければ、フェールオーバーが発生しても最新データで業務継続が
可能です。 共有ディスク上にあるデータに問題が発生した場合は、CLUSTERPRO 以外の製
品を利用して復旧してください。
29
第 4 章 運用形態を設計する
ミラーディスク構成を利用した場合は、フェールオーバー発生時のミラー方式によって待機
系にミラーリングできている復旧時点が異なります。 フェールオーバー発生時のミラー方
式は、アラートログに表示されるミラー方式の切り替わりを示すログで確認できます。
• ミラー方式が同期の場合
データ同期元と待機系のミラーデータが完全に一致することを保証します。 そのた
め、障害が発生する直前のデータが待機系にミラーリングできています。
• ミラー方式が非同期の場合
データ同期元から待機系へのミラーデータの書き込み完了を待たずに処理を継続しま
す。 そのため、障害が発生する前に、非同期で通信した最新のデータが待機系にミラー
リングできています。 非同期で通信した最新のデータは、ネットワークの実効速度と
書き込みデータ量によって、ベストエフォートでミラーリングできた時点のデータで
す。 非同期で通信した最新のデータは、障害が発生する直前からデータ同期元で作成
された最新のスナップショットのデータの範囲に収まります。
スナップショットは、スナップショットの作成インターバル(既定値 12 時間)で定期的
に作られるほかに任意のタイミングで作成することが可能です。 ミラー方式が同期、
または、非同期の場合は、データ同期元でスナップショットを作成したタイミングで待
機系でもスナップショットを作成します。 スナップショットの作成インターバルは、
ミラーリソースの設定にある[スナップショットの作成インターバル]で変更可能です。
• ミラー方式がスナップショットの場合
データ同期元で作成されたスナップショットを待機系にミラーリングします。 待機系
のノードは、データ同期元に自身が持つスナップショットより新しいスナップショット
があるかどうか、差分データの同期インターバルごとに確認します。 新しいスナップ
ショットがある場合、待機系のノードはそのスナップショットを同期します。 待機系
のノードは、自身が持つ最新のスナップショットのデータまでミラーリングできていま
す。
スナップショットは、スナップショットの作成インターバル(既定値:12 時間)で定期的
に作られるほかに任意のタイミングで作成することが可能です。 作成したスナップ
ショットを、差分データの同期インターバル(既定値:5 分)に設定した間隔でノード間に
同期します。 スナップショットの作成インターバルは、ミラーリソースの設定にある
[スナップショットの作成インターバル]で変更可能です。 差分データの同期インター
バルは、ミラーリソースの設定にある[差分データの同期インターバル]で変更可能で
す。
待機系で最新のデータを持っている場合にのみ、自動でフェールオーバーを実行したい場合
は、リソースグループの設定で[最新のミラーデータを保持しない場合は起動しない]に
チェックを入れてください。(既定値:有効)。 待機系で最新のデータを持っていない場合に
も、データの巻き戻りを許容し、自動でフェールオーバーを実行したい場合は、リソースグ
ループの設定で[最新のミラーデータを保持しない場合は起動しない]のチェックを外してく
ださい。
30
第 4 章 運用形態を設計する
データの巻き戻りを許容した場合など、通常のスナップショットとは別に分岐スナップ
ショットを作成することがあります。 分岐スナップショットは、データ同期元と待機系の
ノードにそれぞれ別のデータが書き込まれている場合など、ミラーデータの最新性が保証出
来ない場合に作成します。 最後に書き込みがあったミラーデータのミラーボリュームを最
新とし、最新ではないと判断したミラーボリューム上のミラーデータを分岐スナップショッ
トとして作成します。
分岐スナップショットには、分岐スナップショットの作成日時から、その作成日時の次に作
成されたスナップショットの作成日時までに、更新があったデータが退避されています。
分岐スナップショットに退避されたデータが必要な場合は、分岐スナップショットをマウン
トすることで内容を確認できます。 手動で必要なデータを抽出し、ミラーボリューム上へ
反映することで退避されたデータを復元することが可能です。
4.5.1 ミラーデータの保存先ディレクトリについて
ミラーリソースでは、どのミラー方式(同期/非同期/スナップショット/オブジェクトストレー
ジ)を選択しても差分データの管理のためにスナップショットを作成します。 ミラーリソー
スは、書き込みデータの一時ファイルとしてスナップショットとは別に最大で 10GB のファ
イルを作成します。書き込みデータの一時ファイルは、スナップショットの作成と非同期ミ
ラーで利用します。
ミラーデータの差分情報は、スナップショットミラー時には最大でミラーボリュームと同じ
サイズになる可能性があります。
ミラーデータの保存先ディレクトリには、ミラーボリュームのほかにスナップショットやミ
ラーデータの差分情報などが作成されるため、ミラーボリュームよりも大きなサイズのディ
スクが必要です。
ミラーデータの保存先ディレクトリサイズに指定する目安サイズの例を以下に示します。
• ミラーボリュームのサイズ:100GB
• 1 日あたりのデータ更新量:1GB
• 過去データを保存したい日数:60 日
• ミラーデータの差分情報(最大):100GB
• 書き込みデータの一時ファイル(最大):10GB
• 目安サイズ:270GB(=ミラーボリュームのサイズ(100GB)+保存したい過去のデータ量
(1GBX60 日)+ミラーデータの差分情報(最大)(100GB)+書き込みデータの一時ファイル
(10GB))
なお、運用中のデータ書き込み量によっては、ミラーデータの保存先ディレクトリのサイズ
を超過し、ミラーデータの保存先ディレクトリを格納しているパーティションの容量が不足
する場合があります。
ミラーデータの保存先ディレクトリを格納するパーティションには、運用開始後にオンライ
ンで拡張できる記憶域スペース上の領域などを利用することを推奨します。
31
第 5 章 CLUSTERPRO のインストール/アンインストール
第5章
CLUSTERPRO のインストール/アンイン
ストール
目次
5.1 インストール前の事前準備 ....................................................................................................33
5.2 インストール ...........................................................................................................................38
5.3 アンインストール....................................................................................................................38
5.4 Advanced WebConsole の起動方法 ..........................................................................................39
5.5 Web ブラウザーの接続設定 ....................................................................................................40
5.6 ライセンスの登録について ....................................................................................................40
5.7 注意・制限事項........................................................................................................................40
32
第 5 章 CLUSTERPRO のインストール/アンインストール
5.1 インストール前の事前準備
5.1.1 ディスクリソースが利用するパーティションを設定する
(ディスクリソース使用時は必須)
CLUSTERPRO では、ディスクリソースが利用するパーティションを以下のように定義して
います。
• 共有パーティション:共有データを格納するためのパーティション
• 制御用パーティション:ディスクリソースが複数ノードで共有パーティションを制御す
るために必要なパーティション
ディスクリソースが利用する共有パーティションと制御用パーティションを共有ディスク
上に作成します。 共有パーティションと制御用パーティションは、ディスクリソースを使
用するノードのうち 1 台から作成します。
制御パーティションのサイズは、ディスクリソースの数に依存します。ディスクリソース一
つにつき 1MB のサイズが必要です。
共有パーティションと制御用パーティションのどちらも OS の[ディスクの管理]を使用して
作成します。 共有パーティションと制御用パーティションは、ドライブ文字を設定後、
フォーマットは実施せず RAW パーティションのまま作成してください。
共有パーティションは、クラスターを構築し、ディスクリソースを起動したタイミングで
NTFS フォーマットを実施します。 制御用パーティションは、RAW パーティションのまま、
フォーマットする必要はありません。
共有パーティションのマウント先ディレクトリは、ディスクリソースが起動するタイミング
で作成されるため、事前に作成しておく必要はありません。
5.1.2 ミラーリソースが利用するディスクを確認する (ミラーリ
ソース使用時は必須)
ミラーリソースが利用するディスクを用意します。ディスクは、ミラーリソースを利用する
すべてのノードで用意する必要があります。
CLUSTERPRO では、ミラーリソースが利用するディスクを以下のように定義しています。
• ミラーボリューム:ミラーリングの対象とする業務データを格納する仮想ディスク
• ミラーデータの保存先ディレクトリ:ミラーボリュームを構成するスナップショットな
どのファイル群を保存するディレクトリ
ミラーボリュームは CLUSTERPRO が自動で作成するため、事前のパーティションの作成と
ファイルシステムのフォーマットは必要ありません。
ミラーデータの保存先ディレクトリには、ドライブレター、または、ディレクトリを選択す
ることができます。 ドライブレターを使用する場合は、[ディスクの管理]から、NTFS で
33
第 5 章 CLUSTERPRO のインストール/アンインストール
フォーマットしドライブ文字を設定してください。 運用中のデータ書き込み量によって
は、ミラーデータの保存先ディレクトリのサイズを超過し、ミラーデータの保存先ディレク
トリを格納しているパーティションの容量が不足する可能性があります。 ミラーデータの
保存先ディレクトリに、ドライブレターではなくディレクトリを選択する場合、システムド
ライブとは別のドライブの利用を推奨します。
5.1.3 クラウド環境を確認する
クラウドにクラスターを構築する場合は、対象とするクラウドごとに以下のガイドも参照し
てください。
• 『CLUSTERPRO D Amazon Web Services 向け HA クラスター構築ガイド』
• 『CLUSTERPRO D Microsoft Azure 向け HA クラスター構築ガイド』
CLUSTERPRO では、クラウド環境での利用シーンに応じて、複数のリソースを提供してい
ます。 以下のリソースを利用する場合、クラウド環境に対する設定が必要です。
ミラーリソース
ミラー方式に[オブジェクトストレージ]を選択することで、クラウド環境が提供するス
トレージサービスを利用することができます。 対応クラウドは以下です。
• Amazon Web Services
• Microsoft Azure
• NEC Cloud IaaS
仮想 IP リソース
仮想 IP リソース種別に[AWS 仮想 IP]を選択することで、同じ Amazon VPC 内で利用可
能な仮想 IP アドレスを作成することができます。 なお、追加した仮想 IP アドレスに
Amazon VPC 外から直接接続することはできません。 対応クラウドは以下です。
• Amazon Web Services
AWS ドメインネームリソース
Amazon Web Services で利用する仮想ホスト名に対応する IP アドレスを登録し、同じ
Amazon VPC 内での利用と外部からの接続も可能な仮想ホスト名を作成することができ
ます。 外部からの接続を行う場合は、仮想ホスト名に対応する IP アドレスに Elastic IP
を指定する必要があります。 対応クラウドは以下です。
• Amazon Web Services
ダイナミック DNS リソース
DNS 種別に[Azure DNS]を選択することで、同じ Microsoft Azure 内での利用と外部から
の接続も可能な仮想ホスト名を作成することができます。 Azure DNS を利用する場合
34
第 5 章 CLUSTERPRO のインストール/アンインストール
は、各ノードの DNS サーバーに Azure DNS のサーバーを登録する必要があります。 対
応クラウドは以下です。
• Microsoft Azure
クラウド基盤監視リソース
Amazon Web Services のアベイラビリティーゾーンの状態を定期的に取得し、正常状態で
はない場合に警告または異常を通知します。 対応クラウドは以下です。
• Amazon Web Services
それぞれのリソースごとに必要な設定手順について説明します。
なお、Amazon Web Services を利用する場合、Amazon EC2 インスタンスの日時が正しく設定
されていないと AWS コマンドラインインターフェイスの実行に失敗する場合があります。
Amazon Web Services を利用する場合は、Amazon EC2 インスタンスの日時を正しく設定し、
NTP などによる時刻同期を実行してください。 詳細はインスタンスの時刻の設定を参照し
てください。
ミラーリソース
CLUSTERPRO でサポートしているオブジェクトストレージを以下に示します。
• Amazon S3
• Azure Blob Storage
• NEC Cloud IaaS オブジェクトストレージ(N)
• NEC Cloud IaaS オブジェクトストレージ(CN)
ミラーリソースでオブジェクトストレージを利用する場合は、次の準備が必要です。
クラウド環境の設定用コマンドは、CLUSTERPRO をインストール後、以下のディレクトリ
に格納されています。コマンドの詳細はユーザーズガイドを参照してください。
C:\Program Files\clznode\utility
• Amazon S3 の場合
- AWS コマンドラインインターフェイスのインストール
- Amazon Web Services 環境設定コマンドの実行
- ミラーリソースから利用する Amazon S3 のバケットの作成
• Azure Blob Storage の場合
- Azure コマンドラインインターフェイスのインストール
- Microsoft Azure 環境設定コマンドの実行
- ミラーリソースから利用する Azure Blob Storage のコンテナーの作成
35
第 5 章 CLUSTERPRO のインストール/アンインストール
• NEC Cloud IaaS オブジェクトストレージ(N)、または、NEC Cloud IaaS オブジェクトス
トレージ(CN)の場合
- AWS コマンドラインインターフェイスのインストール
- Amazon Web Services 環境設定コマンドの実行
- ミラーリソースから利用するオブジェクトストレージのバケットの作成
仮想 IP リソース
仮想 IP リソースで AWS 仮想 IP を利用する場合は、Amazon Web Services 環境設定コマンド
を利用前に実行します。
Amazon Web Services 環境設定コマンドは、CLUSTERPRO をインストール後、以下のディレ
クトリに格納されています。コマンドの詳細はユーザーズガイドを参照してください。
• C:\Program Files\clznode\utility
AWS ドメインネームリソース
AWS ドメインネームリソースを利用する場合は、Amazon Web Services 環境設定コマンドを
利用前に実行します。
Amazon Web Services 環境設定コマンドは、CLUSTERPRO をインストール後、以下のディレ
クトリに格納されています。コマンドの詳細はユーザーズガイドを参照してください。
• C:\Program Files\clznode\utility
ダイナミック DNS リソース
ダイナミック DNS リソースで Azure DNS を利用する場合は、Microsoft Azure 環境設定コマ
ンドを利用前に実行します。
Microsoft Azure 環境設定コマンドは、CLUSTERPRO をインストール後、以下のディレクト
リに格納されています。コマンドの詳細はユーザーズガイドを参照してください。
• C:\Program Files\clznode\utility
クラウド基盤監視リソース
クラウド基盤監視リソースを利用する場合は、Amazon Web Services 環境設定コマンドを利
用前に実行します。
Amazon Web Services 環境設定コマンドは、CLUSTERPRO をインストール後、以下のディレ
クトリに格納されています。コマンドの詳細はユーザーズガイドを参照してください。
• C:\Program Files\clznode\utility
36
第 5 章 CLUSTERPRO のインストール/アンインストール
5.1.4 OS 起動時間を調整する (必須)
クラスターを構成する各ノードに電源を投入してから、ノードの OS が起動するまでの時間
を以下より長く設定する必要があります。
• 外部接続する共有ディスク装置を使用する場合、共有ディスク装置に電源を投入してか
ら使用可能になるまでの時間
OS 起動時間を調整していない場合、以下の問題が発生する可能性があります。
• 共有ディスク装置とノードの電源の投入を同時に行った場合、クラスターシステムの起
動時に、ディスクリソースの起動に失敗する。
共有ディスク装置の起動時間を確認したあと、以下の手順で OS 起動時間を調整します。
bcdedit コマンドを利用して、起動時間を調整します。displayorder に表示される OS が 1 つ
しかない場合、起動待ち時間を設定しても無視されることがあります。 この場合は、
bcdedit コマンドの/copy オプションを利用してエントリーを追加してください。
5.1.5 ネットワーク設定を確認する (必須)
クラスター内のすべてのノードでネットワーク環境の状態確認に利用するコマンド
(ipconfig、ping など)コマンドを使用して、次のネットワークが正常に動作しているかど
うかを確認します。 構築予定のクラスターで使用する仮想 IP アドレスは、OS 側に事前に設
定する必要はありません。
• Public LAN:管理用端末との接続用
• Interconnect LAN:クラスターのノード間接続用
• ホスト名:名前解決の確認
5.1.6 パワーセービング機能をオフにする (必須)
CLUSTERPRO 環境では、スリープなどのパワーセービング機能は使用できません。 この機
能は次の手順で必ずオフに設定してください。
1.
[コントロールパネル]>[電源オプション]を選択します。
2.
業務を運用する際に利用する電源プランを選択し、[プラン設定の変更]を選択します。
3.
[ディスプレイの電源を切る]、[コンピューターをスリープ状態にする]の項目で[なし]
を設定します。
5.1.7 ファイアウォールの設定を確認する(必須)
CLUSTERPRO はモジュール間の通信にいくつかのポート番号を使用します。 ファイア
ウォールの設定を変更して CLUSTERPRO がポート番号を使用できるように設定してくだ
さい。 使用するポート番号については、ユーザーズガイドを参照してください。
37
第 5 章 CLUSTERPRO のインストール/アンインストール
5.1.8 ノードの時刻を同期させる
CLUSTERPRO では、次の理由により、クラスター内のすべてのノードの時刻を定期的に同
期する運用を推奨します。 1 日 1 回程度を目安に ntp などを使用してノードの時刻を同期
する設定にしてください。
• フェールオーバーやリソースグループが移動したときにクライアントから見たノード
側のシステム時間が変動し、業務アプリケーションの動作に支障をきたす可能性があり
ます。
• ノード間のログに時刻のずれが発生し、障害が発生したときの原因の解析に時間がかか
ることがあります。
5.2 インストール
CLUSTERPRO のインストール手順について説明します。
なお、インストール作業を行うユーザーは管理者権限が必要です。
1.
セットアップ媒体を準備します。
• セットアップ媒体がファイル(zip 形式)で提供されている場合
セットアップ媒体を任意のディレクトリ配下(例は C:\tmp 配下)に展開します。
• セットアップ媒体が CD-ROM で提供されている場合
CD-ROM をドライブに挿入します。
2.
インストールを実行します。
• セットアップ媒体を任意のディレクトリ配下(C:\tmp)に展開した場合
C:\tmp\Windows\installer 配下にある clznode-<version>.exe をダブルク
リックし、インストーラーを起動します。 インストーラーの指示に従い、インス
トールを行います。
• CD-ROM をドライブ(E:\)に挿入した場合
E:\Windows\installer 配下にある clznode-<version>.exe をダブルクリック
し、インストーラーを起動します。 インストーラーの指示に従い、インストール
を行います。
インストール完了後にマシンの再起動を指示するダイアログが表示されることを確認
し、マシンの再起動を行います。
3.
CD-ROM を利用した場合は、インストールの実行後に CD-ROM を取り出します。
5.3 アンインストール
CLUSTERPRO のアンインストール手順を説明します。
38
第 5 章 CLUSTERPRO のインストール/アンインストール
なお、アンインストール作業を行うユーザーは管理者権限が必要です。
1.
構築したクラスターを停止します。
a.
構築したクラスターが起動している場合、クラスターを停止します。すでにクラ
スターが停止している場合、本手順は必要ありません。
b.
ブラウザーのアドレスバーに、CLUSTERPRO をアンインストールするノードの
物理 IP アドレスとポート番号を入力します。
c.
Advanced WebConsole が起動します。TOP 画面から[クラスターを運用する]を選
択します。
d.
運用管理の詳細ペインから構築したクラスターのアイコンを選択します。画面
上部の[クラスター基幹サービス停止]を押下し、クラスターの停止を実行しま
す。
構築したクラスターのアイコンが停止状態に変更されることを確認します。
2.
CLUSTERPRO をアンインストールするノードにアクセスし、クラスター基盤サービ
スを停止します。
[スタート]ボタンを選択し、メニューから[管理ツール]を選択します。 [サービス]をダ
ブルクリックして、サービス画面を開きます。 サービスの一覧から clznode を選択し、
操作メニューからサービスの停止を選択します。
3.
CLUSTERPRO をアンインストールします。
[スタート]ボタンを選択し、メニューから[コントロールパネル]を選択します。 [プロ
グラムと機能]をクリックして、画面を開きます。
CLUSTERPRO D を右クリックし、アンインストールを実行します。
アンインストール完了後にマシンの再起動を指示するダイアログが表示されることを
確認し、マシンの再起動を行います。 マシンの再起動後、[プログラムと機能]の一覧
から CLUSTERPRO D が削除されていることを確認します。
5.4 Advanced WebConsole の起動方法
Advanced WebConsole を起動する手順を示します。
1.
CLUSTERPRO をインストールしたサーバーでクラスター基盤サービスを起動しま
す。
clznode サービスはインストール後の再起動で自動起動されます。
[スタート]ボタンを選択し、メニューから[管理ツール]を選択します。 [サービス]をダ
ブルクリックして、サービス画面を開きます。
サービスの一覧から clznode を検索し、状態が実行中になっていることを確認します。
2.
クラスターの運用管理を行うサーバーで Web ブラウザーを起動します。
39
第 5 章 CLUSTERPRO のインストール/アンインストール
3.
ブラウザーのアドレスバーに、CLUSTERPRO をインストールしたサーバーの物理 IP
アドレスとポート番号を入力します。
例)https://10.0.0.10:20000
クラスターをすでに構築済みで仮想 IP アドレスを設定している場合は、物理 IP アドレスの
代わりに仮想 IP アドレスを利用して起動することが可能です。 仮想 IP アドレスを利用し
て起動した場合は、仮想 IP リソースが動作しているノードに接続します。
複数のブラウザーを利用しての操作は、画面に正しい情報が表示されなくなる可能性があり
ますので単一のブラウザーからの操作を推奨します。
5.5 Web ブラウザーの接続設定
CLUSTERPRO ではデフォルトで自己署名証明書を使用しているため、Web ブラウザーから
Advanced WebConsole を起動する際に、サーバー証明書のエラー画面が表示される場合があ
ります。 その場合はエラー画面で Advanced WebConsole の閲覧を続行するか、または、Web
ブラウザーの設定により Advanced WebConsole 接続先をセキュリティ例外対象に設定して
ください。
サーバー証明書・秘密鍵に任意のファイルを利用する方法については、ユーザーズガイドを
参照してください。
5.6 ライセンスの登録について
CLUSTERPRO のライセンスは、Advanced WebConsole を利用して登録します。
詳細は、ユーザーズガイドを参照してください。
5.7 注意・制限事項
• インストール時に Windows PowerShell スクリプトの実行ポリシーを RemoteSigned に変
更します。
• フォーマットしていないパーティションにドライブレターを割り当てている場合、
CLUSTERPRO をインストールした際にフォーマットを促すポップアップが表示される
ことがあります。 フォーマットしない場合はキャンセルをクリックしてください。
• インストール時に Windows Error Reporting によるユーザーモードのダンプ採取を有効
化します。 ユーザーモードのダンプを採取したくない場合は、以下のレジストリを設
定してください。
- キー: HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows\Windows Error Rep
orting\LocalDumps
- 名前: DumpCount
40
第 5 章 CLUSTERPRO のインストール/アンインストール
- 種類: REG_DWORD
- 値: 0
• アンインストール時、Windows Error Reporting によるユーザーモードのダンプ採取が無
効化される場合があります。 ユーザーモードのダンプ採取を有効にしたい場合は、ア
ンインストール後に以下のレジストリを設定してください。
- キー: HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows\Windows Error Rep
orting\LocalDumps
• アンインストール時にクラスターの設定ファイルは削除されます。 クラスターの設定
ファイルが必要な場合は、アンインストール前に以下のファイルのバックアップを取得
してください。
C:\Program Files\clznode\etc\cluster.conf
• 仮想 IP アドレスを利用して Advanced WebConsole を起動した場合、クラスター基幹
サービスやクラスターの停止が必要になる操作を行うと Advanced WebConsole へのア
クセスが切断され、画面が更新されなくなります。 クラスター基幹サービスやクラス
ターの停止が必要になる操作を行う場合は、物理 IP アドレスを使用して Advanced
WebConsole を起動してください。
• デ フ ォ ル ト 証 明 書 を 使 用 し て い る と き に 仮 想 IP ア ド レ ス を 利 用 し て Advanced
WebConsole を起動した場合、仮想 IP リソースを含むリソースグループを移動させると
Advanced WebConsole の画面が更新されません。 ブラウザーを更新、または、再起動し
てください。
• アンインストール、または、ミラーリソースを削除する前にミラーリソースのボリュー
ム上のデータを任意の場所に退避することを推奨します。 アンインストール、または、
ミラーリソースを削除した場合、ミラーリソースのボリューム上のデータは参照できま
せん。
41
CLUSTERPRO® D 1.1 for Windows
設計ガイド
2016 年 12 月 01 版 発行
日本電気株式会社
©日本電気株式会社 2016
Fly UP