Splunk 5.0.2 インデクサーとクラスタの管理

by user

on 28 марта 2017

Category: Documents

>> Downloads: 87

639

views

Report

Comments

Description

Download Splunk 5.0.2 インデクサーとクラスタの管理

Transcript

Splunk 5.0.2 インデクサーとクラスタの管理

Splunk 5.0.2
インデクサーとクラスタの管理
作成：2013 年 3 月 13 日午前 8 時 5 分
Copyright (c) 2013 Splunk Inc. All Rights Reserved
Table of Contents
インデックスの概要
9
インデックス、インデクサー、およびクラスタ
インデックス
インデクサー
クラスタ
9
9
9
10
インデックス作成の仕組み
イベント処理
インデックスには何がある？
インデックスのデフォルトセット
回答
10
10
11
12
12
インデックス時とサーチ時
インデックス時
サーチ時
12
12
13
分散環境でのインデクサー
インデクサーへのデータ転送
Search across multiple indexers
13
13
14
インデックスの管理
14
インデックスの管理について
インデックス作成処理の詳細
14
15
複数のインデックスの設定
複数のインデックスを利用する理由
インデックスの作成と編集
特定のインデックスへのイベントの送信
特定のインデックスのサーチ
15
15
15
17
18
Splunk からのインデックスとデータの削除
今後のサーチからイベントを削除する
1 つまたは複数のインデックスからのデータの削除
インデックス全体の削除
インデックスを削除せずに無効化する
リタイアポリシーに基づいて古いデータを削除
19
19
20
20
21
21
インデックスの最適化
21
インデックスストレージの管理
21
Splunk によるインデックスの保管方法
注意事項
Splunk のデータ過時間の仕組み
21
22
22
インデックスディレクトリの内容
バケツと Splunk の管理
バケツのトラブルシューティング
その他の参考情報
23
24
24
26
インデックスストレージの設定
26
インデックスデータベースの移動
*nix ユーザーの場合
Windows ユーザーの場合
Splunk 管理を使ったインデックスへのパスの更
28
28
29
29
インデックスデータ用の複数パーティションの使用
複数のパーティションの設定
クラスタと coldPath
30
30
31
インデックスサイズの設定
各インデックスのインデックスサイズの設定
バケツタイプによるインデックスサイズの設定
ボリュームによるインデックスサイズの設定
すべてをまとめる
31
31
31
31
32
ディスク使用量の制限の設定
最低空きディスクスペースの設定
インデックスストレージの制御
33
33
34
ブルームフィルタの設定
なぜブルームフィルタを使用するのか？
ブルームフィルタの設定
34
34
35
インデックスのバックアップとアーカイブ
35
インデックス作成されたデータのバックアップ
データの時間過
インデックスデータベースディレクトリの場所
バックアップ方針の選
ホットバケツのウォームへの手動移行
復元の推事項
インデックスのバックアップ方法
クラスタ化されたデータのバックアップ
35
36
36
37
37
38
38
38
リタイアおよびアーカイブポリシーの設定
コールドからフローズンへの移行動作の属性の設定
データのアーカイブ
その他のバケツ移行条件
アーカイブポリシーのトラブルシューティング
38
39
39
39
40
インデックス作成されたデータのアーカイブ
Splunk によるデータのアーカイブ方法
アーカイブへの署名
クラスタ化データのアーカイブ
40
40
42
42
アーカイブされたインデックスデータの復元
42
アーカイブを別の Splunk インスタンスに復元する場合の制限事 42
項
アーカイブバケツに 4.2 以降のデータが含まれているかどうか 43
の判断
4.2 以降のアーカイブの解凍
43
4.2 より前のアーカイブの解凍
44
クラスタ化データの復元
45
クラスタとインデックスレプリケーションの概要
45
クラスタとインデックスレプリケーションについて
クラスタの内容
クラスタの設定方法
クラスタのサーチ方法
先に進む前に
非クラスタ Splunk デプロイ環境から移行しますか？
45
45
46
47
47
47
基本的なクラスタのアーキテクチャ
クラスタのコンポーネント
重要な概念
インデックス作成の仕組み
サーチの仕組み
クラスタでのノード障害の取り扱い
47
47
49
50
51
51
クラスタのデプロイ
52
デプロイの概要
非クラスタ Splunk デプロイ環境から移行しますか？
クラスタのデプロイ
その他のデプロイシナリオ
52
52
52
54
最初にお読みください：クラスタ構成と非クラスタ構成の Splunk デ 54
プロイの主な相違点
クラスタピアでデプロイサーバーやサードパーティ製のデプロ 54
イツールを使用しないでください
システム要件の相違
54
その他の討事項と非クラスタデプロイとの相違点
55
非クラスタ構成インデクサーの移行
55
システム要件とその他のデプロイに関する討事項
ハードウェア要件
Splunk バージョンの互換性
必要な Splunk インスタンス
ネットワーク要件
ストレージの討事項
ライセンス情報
サーバーとクラスタのデプロイ
55
55
55
55
55
56
57
57
マスターノードを有効にする
58
マスターを有効にする
マスターダッシュボードの表示
追加設定
58
58
59
ピアノードを有効にする
ピアを有効にする
ピアダッシュボードの表示
ピアの設定
59
59
59
59
サーチヘッドを有効にする
サーチヘッドを有効にする
サーチヘッドダッシュボードの表示
複数クラスタサーチを有効にする
複数のサーチヘッドの設定
追加設定
60
60
60
60
60
61
ピアのインデックスレプリケーションの準備
61
フォワーダーを使ったデータの取り込み
フォワーダーからピアノードへの接続の設定
フォワーダーのデータ入力の設定
インデクサー答確認の仕組み
ロードバランシングの仕組み
ピア上で直接入力を設定する
61
61
63
63
63
64
クラスタを使ったインデックスの強
クラスタピア管理とデプロイサーバーの比較
処理能力強デプロイのためのクラスタの設定
64
64
65
非クラスタインデクサーのクラスタ化環境への移行
従来のデータの管理
クラスタへの App の移行
65
65
65
クラスタのアップグレード
アップグレード順序
5.0.1 以前からのアップグレード
66
67
68
クラスタの設定
68
マスターの設定
デプロイ後の設定の実施
スタンバイマスターの設定
68
68
68
ピアノードの設定
すべてのピアの共通設定の管理
ピア単位での設定の管理
69
69
70
ピアインデックスの設定
71
すべてのピアが同じ indexes.conf ファイルセットを使用する必 71
要があります
ピアのインデックスセットの設定
indexes.conf の編集
新しい indexes.conf ファイルのピアへの配布
72
72
73
サーチヘッドの設定
複数クラスタサーチの設定
クラスタ化サーチヘッドと非クラスタ化サーチヘッドの違い
分散サーチの [管理 ] ページ
マウントされたバンドルおよびサーチピアの設定
73
73
74
74
74
詳細設定
74
server.conf によるクラスタの設定
クラスタノードを有効にする
秘密鍵の設定
クラスタノードの再起動
警告：マスター上で複製データ保持数またはサーチ可能データ
保持数をやさないでください
74
75
76
76
76
CLI を使ったクラスタの設定
CLI コマンドのヘルプ
クラスタノードを有効にする
クラスタ設定の編集
クラスタ情報の表示
クラスタの管理
76
76
77
77
77
77
クラスタの管理
78
マスターダッシュボードの表示
ダッシュボードへのアクセス
ダッシュボードの表示
ピアノードダッシュボードのマスタービューへのアクセス
78
78
78
80
ピアダッシュボードの表示
ピアダッシュボードへのアクセス
ダッシュボードの表示
81
81
81
サーチヘッドダッシュボードの表示
ダッシュボードへのアクセス
ダッシュボードの表示
サーチピア上の情報の表示
82
82
82
82
ピアをオフラインにする
83
一時的にピアをオフラインにする場合
83
永久的にピアをオフラインにする場合
83
offline コマンド
83
ピアの一時停止：高速な offline コマンド
84
ピアの永久停止： enforce-counts を指定した offline コマンド 84
共通のピア設定と App の更新
設定バンドルの構造
85
85
クラスタ App の制限事項
設定バンドルの配布
ピア起動時のバンドルの配布
86
87
88
クラスタ全体または 1 台のクラスタノードの再起動
クラスタ全体の再起動
単一ピアの再起動
88
88
88
クラスタの仕組み
89
高度なユーザー向けの基本概念
89
複製データ保持数
89
サーチ可能データ保持数
90
バケツとクラスタ
データファイル
バケツの移行
バケツのサーチの可否と優先度状態
世代
90
91
92
92
93
クラスタの状態
94
クラスタでのインデックス作成の仕組み
ピアノード起動時
ピアノードのホットバケツの移行時期
ピアノードとフォワーダーのやり取り
95
95
95
96
クラスタ化サーチの仕組み
クラスタにまたがるサーチ
単一ピアのサーチ
96
96
97
クラスタノードの起動方法
マスターノードの開始時
ピアが新しいクラスタに参加した場合
ピアが既存のクラスタに参加した場合
97
97
97
97
ピアノード停止時の処理
ピアノードを意図的にオフラインにした場合
予期せずにピアノードが停止した場合
バケツ修復のシナリオ
97
98
99
99
ピアノードが復した場合の処理
マスターのバケツのカウント方法
バケツの修復とピア上のコピー
102
102
102
マスターノード停止時の処理
マスターが停止した場合
マスターが復した場合
103
103
103
インデックスの概要
インデックス、インデクサー、およびクラスタ
このマニュアルでは、Splunk のデータリポジトリとそれを作成、管理するための Splunk コンポーネントについて
明していきます。
インデックスは、Splunk データのリポジトリです。Splunk は到着したデータをイベントに換します。イベントは
インデックスに保管されます。
インデクサーは、データのインデックスを作成する Splunk インスタンスです。インデクサーは、データの入力や
サーチの管理など、他の Splunk 機能も頻繁に実行しています。ただし、分散環境の場合、一般的にデータ入力と
サーチ管理は他の Splunk コンポーネントが担当します。これらは、フォワーダーおよびサーチヘッドと呼ばれて
います。このマニュアルでは、インデックス作成機能についてのみ明していきます。
クラスタは、相互のデータを複製するように設定されたインデックスのグループです。このプロセスは、インデッ
クスレプリケーションとして知られています。クラスタは Splunk データの複数の同一コピーを保持することによ
り、データ消失を防止しながら、サーチ用データの可用性を向上します。
インデックス
Splunk がデータのインデックスを作成するにつれて、一連のファイルが作成されます。これらのファイルは、2
つのカテゴリに分類できます。
縮形式の raw データ (rawdata)
raw データを指すインデックスといくつかのメタデータファイル (インデックスファイル)
Splunk のインデックスは、これらのファイルにより構成されています。一連のディレクトリに保管されている
ファイルは、その過時間で管理されています。これらのディレクトリは、バケツと呼ばれています。詳細は、こ
のマニュアルの「Splunk によるインデックスの保管方法」を参照してください。
Splunk は、柔軟なサーチと高速なデータ取得を目的にインデックスを管理しています。インデックスは、ユー
ザーが設定可能なスケジュールにより順次アーカイブされます。Splunk はすべてをフラットファイルで管理して
います。バックグラウンドでサードパーティ製のソフトウェアを実行する必要はありません。
インデックス作成処理中に、Splunk は高速なサーチ/分析を可能にするために、到着したデータを処理して、その
結果をインデックス内にイベントとして保管します。インデックス作成時に、Splunk はデータをさまざまな方法
で張します。以下に例を示します。
データストリームを個別のサーチ可イベントに分割する。
タイムスタンプを作成、判別する。
ホスト、ソース、ソースタイプなどのフィールドを抽出する。
到着したデータにして、カスタムフィールドの識別、重要なデータのマスキング、新規または更されたキー
の書き込み、複数行イベントの分割ルールの適用、不要なイベントのフィルタリング、イベントの特定イン
デックスまたはサーバーへのルーティングなどの、ユーザー定義のアクションを実行する。
このインデックス作成プロセスは、イベント処理としても知られています。
インデックス作成を開始するには、単に目的のデータ入力を指定します。その他の入力をいつでも追加することが
できます。追加したデータ入力にしてもインデックスが作成されます。データ入力の追加方法については、
『Getting Data In Manual』の「What Splunk can index」を参照してください。『Getting Data In Manual』には、
データのニーズをたすための、インデックス時イベント処理の設定方法についても明されています。「Overview
of event processing」を参照してください。
デフォルトで Splunk はすべてのユーザーデータを、単一の事前設定されたインデックスに保管します。また、内
部処理目的で他の複数のインデックスも作成します。新しいインデックスを追加したり、既存のインデックスを
データ要件に合わせて管理したりすることができます。詳細は、このマニュアルの「インデックスの管理」を参照
してください。
インデクサー
インデクサーは、インデックスの作成と管理を行う Splunk コンポーネントです。インデクサーの主な機能を以下
に示します。
9
到着データのインデックス作成。
インデックスデータのサーチ。
1 つの Splunk インスタンスからのみ構成される単一マシン環境では、データの取り込みおよびサーチ管理機能も
インデクサーが担当します。
大規模環境でのニーズに合わせて、インデックス作成処理をデータの取り込み機能や、必要にじてサーチ管理機
能からも切り離すことができます。このような大規模な分散環境では、Splunk インデクサーはしばしば独自のマ
シン上に常駐し、そのインデックスデータのサーチとともにインデックス作成処理のみを担当します。このような
場合、インデックス作成以外の処理は他の Splunk コンポーネントが担当します。フォワーダーがデータを取り込
んで、インデクサーがデータのインデックス作成とサーチを行い、サーチヘッドがインデクサー全体のサーチを調
整します。大規模環境へのデプロイ例を以下に示します。
インデクサーを使った分散デプロイの詳細は、このマニュアルの「分散デプロイ環境のインデクサー」を参照して
ください。
Splunk インデクサーのインストール方法については、『Installation Manual』を参照してください。
クラスタ
クラスタは、連携して冗長インデックス作成およびサーチ機能を提供する、Splunk ノードのグループです。クラ
スタ内には 3 種類のノードが存在しています。
クラスタを管理する単一のマスターノード。マスターノードは、特別なタイプのインデクサーです。
クラスタのインデックス作成機能を担当し、複数のインデックスデータのコピーを保持し、データをサーチ
する複数のピアノード。
すべてのピアノードにまたがってサーチを調整、管理する 1 つまたは複数のサーチヘッド。
Splunk のクラスタ機能では、あるノードから別のノードに自動フェイルオーバーを行います。つまり、1 つまた
は複数のピアに障害が発生した場合でも、引き続き到着データのインデックスが作成され、サーチが可能になりま
す。
このマニュアルの前半に記載されているインデックス作成に関する情報は、クラスタに参加しているかどうかにか
かわらず、すべてのインデクサーに関連しています。ただし、クラスタに参加しているインデクサーは、スタンド
アロンインデクサーと比べて追加の設定を行う必要があります。クラスタの詳細は、このマニュアルの後半の「ク
ラスタとインデックスレプリケーションについて」以降の明を参照してください。
インデックス作成の仕組み
Splunk は任意の種類の時系列データ (タイムスタンプを持つデータ) のインデックスを作成できます。データのイ
ンデックスを作成する際には、タイムスタンプに基づいてデータがイベントに分割されます。
イベント処理
イベント処理は、パーシングとインデックス作成の 2 つのステージに分かれて行われます。Splunk に取り込まれ
るデータはすべて、大きなチャンク (10,000 バイト) としてパーシングパイプラインを通過します。パーシング中
に、これらのチャンクはイベントに分割されます。分割されたイベントは、インデックス作成パイプラインに渡さ
れて、最終処理が行われます。
パーシング中、Splunk はさまざまなアクションを実行します。以下に例を示します。
各イベントにして、host、source、および sourcetype などの、一連のデフォルトフィールドを抽出する。
文字コードを設定する。
改行ルールを使って行の終端を識別する。大半のイベントは短く、1 2行程度ですが、中には長いイベントも
10
存在しています。
タイムスタンプを識別する、また存在しない場合は作成する。タイムスタンプ処理と同時に、イベント境界
の識別が行われます。
このステージで、重要なイベントデータ (クレジットカード情報や社会保障番号など) をマスクするように
Splunk を設定することができます。また、受信したイベントにカスタムメタデータを適用するように設定す
ることもできます。
インデックス作成パイプラインでは、以下のような追加処理が行われます。
すべてのイベントを、サーチ可能なセグメントに分割する。セグメント分割レベルを指定することができま
す。この設定は、インデックス作成/サーチ速度、サーチ能力、およびディスクの縮効率に影響します。
インデックスデータ構造を作成する。
raw データとインデックスファイルをディスクに書き込む。ディスクでは、インデックス作成後の縮処理が
行われます。
パーシングパイプラインとインデックス作成パイプラインへの分割は、主にフォワーダーの展開に関連していま
す。ヘビーフォワーダーは、データのパーシングを行い、最終的なインデックス作成処理を行うためにそのデータ
をインデクサーに転送します。
イベントの詳細およびインデックス作成処理時に何が行われるかについては、『Getting Data In Manual』の
「Configure event processing」を参照してください。
注意：インデックスの作成処理は I/O リソースを消費します。
インデックス作成の主要プロセスを以下の図に示します。
注意：この図は、インデックス作成アーキテクチャの簡単なビューを表しています。これは、アーキテクチャの機
能的なビューで、完全な Splunk の内部動作を表している訳ではありません。特に、パーシングパイプラインは、
実際にはパーシング、マージング、およびタイピングの 3 つのパイプラインが成り立っており、これらが連携して
パーシング機能を担当しています。このような区別はトラブルシューティングの際に関係してきますが、一般的な
Splunk の設定やデプロイには何も影響することはありません。
インデックスには何がある？
11
Splunk は、処理するデータすべてをインデックスに格納しています。インデックスはデータベースの集合体
で、$SPLUNK_HOME/var/lib/splunk のサブディレクトリに存在しています。インデックスは raw データファイ
ルとインデックスファイルの、2 種類のファイルタイプから成り立っています。詳細は、このマニュアルの
「Splunk によるインデックスの保管方法」を参照してください。
インデックスのデフォルトセット
Splunk には、さまざまな事前設定されたインデックスが用意されています。以下に例を示します。
main：これは、デフォルトの Splunk インデックスです。特に指定のない限り、処理されたデータはすべて
ここに保管されます。
_internal：Splunk 内部ログおよび処理指標を保管します。
_audit：ファイルシステム更監視、追跡、およびすべてのユーザーサーチ履歴に関連するイベントが含まれ
ます。
Splunk 管理者は、新規インデックスの作成、インデックスプロパティの編集、不要なインデックスの削除、およ
び既存のインデックスの移動などの作業を行えます。Splunk 管理者は、Splunk 管理、CLI、および indexes.conf
などの設定ファイルを使ってインデックスの管理を行います。詳細は、このマニュアルの「インデックスの管理」
を参照してください。
回答
何か質問がありますか？「Splunk Answers」から、Splunk コミュニティに寄せられた、インデックス作成に関す
る質問と回答をご覧ください。
インデックス時とサーチ時
Splunk ドキュメントでは、頻繁に「インデックス時」および「サーチ時」と言う用語について言及されていま
す。これらの用語は、インデックス作成時に発生した処理のタイプとサーチ実行時に発生した処理のタイプを区別
するために用いられます。
Splunk を管理する際には、これらの違いを理解しておくことが重要です。たとえば、データのインデックス作成
をまだ開始していない時点で、処理するカスタムソースタイプやホストが大量に存在していると考えられる場合、
あらかじめそれらを定義しておくことができます。そのためには、インデックス処理中にカスタムソースタイプと
ホストが適切に処理されるように、それらを事前に定義します (ルールベースのソースタイプ割り当て、ソースタ
イプの優先設定、入力ベースのホスト割り当て、およびホストの優先設定などを使用)。
一方、すでにデータのインデックス作成を開始している場合は、サーチ時にこのような問題を処理することができ
ます。そうしない場合は、カスタムソースタイプ/ホストを既存のデータや新規データに適用するために、イン
デックスを再作成する必要があります。インデックスの作成後は、ホスト/ソースタイプ割り当てを更することは
できません。ただし、それらに代替値でタグを設定し、それを利用して問題を管理することができます。
一般的に、フィールド抽出などのナレッジ作成アクティビティは、サーチ時に実行することをお勧めします。カス
タムフィールドの抽出などの作業をインデックス時に実行すると、インデックス時とサーチ時の両方でパフォーマ
ンスが低下してしまいます。インデックス作成中に抽出フィールドを追加すると、インデックス作成処理速度が低
下してしまいます。また、他のフィールドの追加によりインデックスが巨大化し、当然大きなインデックスのサー
チには時間がかかるため、その後のインデックスにするサーチ速度も低下してしまいます。サーチ時にフィール
ドの抽出を実行することで、このようなパフォーマンス上の問題を回避することができます。サーチ時のフィール
ド抽出の詳細は、『Knowledge Manager manual』の「About fields」および「Create search-time field
extractions」を参照してください。
インデックス時
インデックス時の処理は、イベントデータのインデックスを実際に作成する直前に行われます。
インデックス時 (またはその前) には、以下の処理が行われます。
デフォルトのフィールド抽出 (host、source、sourcetype、および timestamp など)
特定の入力にする静的または動的なホスト割り当て
デフォルトのホスト割り当てへの優先設定
ソースタイプのカスタマイズ
インデックス-時間フィールド抽出
イベントのタイムスタンプ
イベントの改行処理
イベントのセグメント化 (サーチ時にも行われる)
12
サーチ時
サーチ時の処理は、サーチ実行時にサーチによるイベントの収集に伴い行われます。サーチ時には以下の処理が行
われます。
イベントのセグメント化 (インデックス時にも行われる)
イベントタイプのマッチング
サーチ時のフィールド抽出 (自動およびカスタムフィールド抽出、複数値フィールドのパーシングを含む)
フィールドのエイリアス設定
外部データソースからのフィールドルックアップ
ソースタイプ名の更
タグの設定
分散環境でのインデクサー
インデクサーは、インデックスの作成と管理を行う Splunk コンポーネントです。インデクサーの主な機能を以下
に示します。
到着データのインデックス作成。
インデックスデータのサーチ。
1 つの Splunk インスタンスからのみ構成される単一マシン環境では、データの取り込みおよびサーチ管理機能も
インデクサーが担当します。
大規模環境でのニーズに合わせて、インデックス作成処理をデータの取り込み機能や、必要にじてサーチ管理機
能からも切り離すことができます。このような大規模な分散環境では、Splunk インデクサーはしばしば独自のマ
シン上に常駐し、そのインデックスデータのサーチとともにインデックス作成処理のみを担当します。このような
場合、インデックス作成以外の処理は他の Splunk コンポーネントが担当します。
たとえば、イベントを生成する一連の Windows および Linuxマシンが存在しており、それらのイベントを単一の
Splunk インデクサーに送って集中処理する場合を考えてみましょう。一般的にこれを実現するための最良の方法
は、フォワーダーとして知られる量の Splunk インスタンスを、イベントを生成する各マシン上にインストールす
ることです。これらのフォワーダーはデータ入力を担当し、ネットワーク上のデータを専用のマシンに常駐する
Splunk インデクサーに送信します。
同に、インデックス作成された大量のデータが存在しており、それにして多数のユーザーが同時にサーチを実行
するような場合は、サーチ管理機能とインデックス作成機能を切り離す方が合理的です。このような分散サーチ環
境では、1 つまたは複数のサーチヘッドが、サーチリクエストを複数のインデクサーにまたがって分配します。イ
ンデクサーは引き続き各自のインデックスにする実際のサーチを処理しますが、サーチヘッドがすべてのインデ
クサーにまたがって総合的なサーチプロセスを管理し、ユーザーに統合されたサーチ結果を提供します。
大規模環境へのデプロイ例を以下に示します。
分散環境でもインデックス作成とイベント処理に関する問題の基本はわりありませんが、インデックス作成略を
策定する際には、デプロイのニーズを討することが重要です。
注意：大規模な分散デプロイ環境では、クラスタがその中核を為すことが多いですが、クラスタコンポーネント自
体はすべて単一の高速ネットワーク上に配置する必要があります。クラスタの詳細は、「クラスタとインデックス
レプリケーションについて」を参照してください。
インデクサーへのデータ転送
リモートデータをインデクサーに転送するには、フォワーダーを使用します。フォワーダーは、データ入力を受け
取り、それをまとめたデータを Splunk インデクサーに送信します。フォワーダーは、2 種類に分類できます。
13
ユニバーサルフォワーダー：これらは、各自のホストマシンでリソースの消費量が少なくなっています。到
着したデータストリームにして最低限の処理を行ってから、それをインデクサー (レシーバー) に転送しま
す。
ヘビーフォワーダー：これらは、完全な Splunk インスタンスの大部分の機能を保有しています。インデク
サーにデータを転送する前に、パーシングを行うことができます。(パーシングとインデックス作成の違いに
ついては、「インデックス作成の仕組み」を参照してください。)これらは、インデックス作成したデータを
ローカルに保管したり、パーシングしたデータをレシーバーに転送し、そのマシン上で最終的なインデック
ス処理を行ったりできます。
どちらの種類のフォワーダーでも、インデクサーにデータを転送する前に、ホスト、ソース、ソースタイプなどの
メタデータでデータにタグを設定します。
フォワーダーにより、リモートソースから到着する大量のデータまたは多彩な種類のデータを処理する場合に、リ
ソースを効率的に使用することができます。また、ロードバランシング、データのフィルタリング、およびルー
ティングなどの機能により、さまざまなデプロイトポロジを採用することができます。
設定や使用事例も含めたフォワーダーの詳細については、『Distributed Deployment manual』の「About
forwarding and receiving」を参照してください。
Search across multiple indexers
分散サーチでは、Splunk サーチヘッドはサーチリクエストを Splunk インデクサーに送信し、結果を結合してユー
ザーに返します。これは、水平スケーリング、アクセス制御、および地理的に分散したデータの管理など、さまざ
まな目的に役立ちます。
設定や使用事例も含めた分散サーチの詳細については、『Distributed Deployment manual』の「About distributed
search」を参照してください。
インデクサーのクラスタは、サーチヘッドを使ってクラスタのピアノード間のサーチを管理/調整しています。
「クラスタとインデックスレプリケーションについて」を参照してください。
インデックスの管理
インデックスの管理について
Splunk にデータを追加すると、Splunk はそれを処理してインデックスに格納します。デフォルトでは、Splunk
に取り込んだデータはメイン (main) インデックスに保管されます。ただし、他のインデックスを作成して、異な
るデータ入力で使用するようにそれを設定することができます。
インデックスは、ディレクトリとファイルの集合体です。これらは、$SPLUNK_HOME/var/lib/splunk 下にありま
す。インデックスディレクトリは「バケツ」とも呼ばれており、その過時間で編成管理されています。インデッ
クスストレージの詳細は、「Splunk によるインデックス保管の仕組み」を参照してください。
main インデックスの他に、Splunk には事前設定されたさまざまな内部インデックスが用意されています。内部イ
ンデックスは、アンダースコア (_) から始まる名前が付けられています。Splunk Web では、インデックスの全リ
ストを参照できます。Splunk Web の右上にある [管理] リンクをクリックして、次に [インデックス] をクリックし
てください。これには、以下の事項が含まれています。
main：デフォルトの Splunk インデックスです。特に指定のない限り、処理された外部データはすべてここ
に保管されます。
_internal：このインデックスには、Splunk プロセッサからの内部ログや指標が含まれています。
_audit：ファイルシステム更監視、追跡、およびすべてのユーザーサーチ履歴に関連するイベントが含まれ
ます。
このマニュアルのさまざまなトピックで、さまざまなインデックスの管理方法が明されています。特にインデッ
クス管理においては、以下のトピックが役に立ちます。
複数のインデックスの設定
Splunk からのインデックスとデータの削除
インデックスストレージの設定
インデックスデータベースの移動
インデックスデータ用の複数パーティションの使用
インデックスサイズの設定
ディスク使用量の制限の設定
インデックス作成されたデータのバックアップ
リタイアおよびアーカイブポリシーの設定
14
インデックス作成処理の詳細
インデックスの詳細については、以下の項目を参照してください。
このマニュアルの「インデックス作成の仕組み」。
このマニュアルの「Splunk によるインデックス方法」。
このマニュアルの「クラスタとインデックスレプリケーションについて」。
『Getting Data In Manual』の「Configure event processing」。
とても巨大なデータセットに関する作業については、『Knowledge Manager Manual』の「Set up and use
summary indexes」。
複数のインデックスの設定
Splunk には、main と言う名前のインデックスが用意されています。デフォルトでは、このインデックスにすべて
のイベントが格納されます。Splunk は他にも、内部システムが使用するその他の各種インデックス、およびサマ
リーインデックスやイベント追跡などの他のSplunk 機能も作成します。
Enterprise ライセンスの Splunk では、追加のインデックスを無制限に追加することができます。main インデック
スは、インデックスが指定されていない任意の入力またはサーチコマンドのデフォルトインデックスとしての役割
を果たします。このデフォルトは更することができます。インデックスは、Splunk Web、Splunk CLI、または
indexes.conf を使って追加することができます。
ここでは、以下の事項を取り上げていきます。
複数のインデックスを利用する理由。
新しいインデックスの作成方法。
特定のインデックスへのイベントの送信方法。
特定のインデックスのサーチ方法。
複数のインデックスを利用する理由
複数のインデックスを利用するさまざまな理由が存在しています。
ユーザーのアクセスを制御する。
さまざまな保持ポリシーを採用する。
特定の状況下でサーチを高速化する。
複数のインデックスを設定する主な理由は、ユーザーのデータにするアクセスを制御することにあります。ユー
ザーをロールに割り当てる場合、ユーザーのサーチを各自のロールに基づいて特定のインデックスに制限すること
ができます。
また、異なるデータセットにして異なる保持ポリシーを適用する場合、データを異なるインデックスに送信し
て、各インデックスにして異なるアーカイブ/保持ポリシーを設定することができます。
また、Splunk のサーチ方法にじて複数のインデックスの設定が必要な場合もあります。大量の高ノイズデータ
ソースと、少量のデータソースを同じインデックスに取り込み、たいていの場合は少量のデータソースにして
サーチを行う場合、Splunk は大量のボリュームソースからのデータもサーチする必要があるため、サーチ速度は
通常よりも低下します。この問題を緩和するために、各データソース専用のインデックスを作成し、各ソースから
専用のインデックスにデータを送信することができます。これで、サーチするインデックスを指定することができ
ます。これにより、サーチ速度を改善することができます。
インデックスの作成と編集
Splunk Web、Splunk CLI を使用するか、または indexes.conf を直接更して、インデックスを作成、編集するこ
とができます。
注意：クラスタに新しいインデックスを追加するには、indexes.conf を直接編集する必要があります。Splunk
Web または CLI を使ってインデックスを追加することはできません。クラスタ向けの indexes.conf の設定方法に
ついては、「ピアインデックスの設定」を参照してください。このトピックには、新しいクラスタインデックスの
作成例が記載されています。
Splunk Web の使用
1. Splunk Webで、[管理] > [インデックス] に移動して、[新規] をクリックします。
2. 新しいインデックスを作成するには、以下の項目を入力します。
15
インデックスの名前。インデックス名には、ASCII 文字のみを使用する必要があります。数字、英字、アン
ダースコア、およびハイフンのみを使用できます。新しいインデックスの先頭に、アンダースコアまたはハ
イフンを使用することはできません。
インデックスデータストレージのパス：
ホームパス：空にするとデフォルトの $SPLUNK_DB/<index_name>/db を使用
コールド DB パス：空にするとデフォルトの $SPLUNK_DB/<index_name>/colddb を使用
解除み/再生み DB パス：空にするとデフォルトの $SPLUNK_DB/<index_name>/thaweddb を使用
インデックス全体の最大サイズ。デフォルトは 500000 MB です。
このインデックスのホット (現在書き込まれている) 部分の最大サイズ。最大サイズを設定する場合、量が多
いインデックス (main インデックスなど) には auto_high_volume を、それ以外の場合は auto を使用してく
ださい。
フローズン ( 更不可) バケツアーカイブパス。フローズンバケツをアーカイブする場合にこのフィールド設定
します。バケツのアーカイブの詳細は、「インデックス作成されたデータのアーカイブ」を参照してくださ
い。
注意：これらの設定の詳細は、「インデックスストレージの設定」を参照してください。
3. [保存] をクリックします。
Splunk Web の [管理] の [インデックス] セクションで、インデックス名をクリックしてインデックスを編集するこ
とができます。[管理] で更できないプロパティは灰色表示されます。それらのプロパティを更するに
は、indexes.conf を編集して、Splunk を再起動してください。
注意：一部のインデックスプロパティは、indexes.conf ファイルを編集することによってのみ設定できます。プ
ロパティの全一覧については、indexes.conf のトピックを参照してください。
CLI の使用
$SPLUNK_HOME/bin/
ディレクトリに移動して、add index コマンドを実行します。最初に Splunk を停止する必要
はありません。
新しいインデックス「fflanda」を追加するには、以下のコマンドを入力します。
splunk add index fflanda
注意：新しいインデックス名には、数字、英字、アンダースコア、およびハイフンのみを使用できます。先頭にア
ンダースコアまたはハイフンを使用することはできません。
新しいインデックスにしてデフォルトパスを使用したくない場合は、パラメータを使って別の場所を指定しま
す。
./splunk add index foo -homePath /your/path/foo/db -coldPath /your/pat/foo/colddb
-thawedPath /your/path/foo/thawedDb
CLI からインデックスのプロパティを編集することもできます。たとえば、インデックス「fflanda」を編集するに
は、CLI で以下のように入力します。
splunk edit index fflanda -<parameter> <value>
インデックス設定の詳細は、「インデックスストレージの設定」を参照してください。
indexes.conf の編集
新しいインデックスを追加するには、$SPLUNK_HOME/etc/system/local にある indexes.conf に、新しいインデッ
クス名でスタンザを追加します。例：
[newindex]
homePath=<path for hot and warm buckets>
coldPath=<path for cold buckets>
thawedPath=<path for thawed buckets>
...
インデックス設定の詳細は、「インデックスストレージの設定」および indexes.conf ファイルの明を参照してく
ださい。
indexes.conf
を編集したら、Splunk を再起動する必要があります。
重要：クラスタノードのインデックス設定の追加、編集については、「ピアインデックスの設定」を参照してくだ
さい。
16
特定のインデックスへのイベントの送信
デフォルトでは、Splunk はすべてのイベントを main インデックスに送ります。しかし、一部のイベントを別の
インデックスに送りたい場合もあるでしょう。たとえば、特定のデータ入力からのデータを独自のインデックスに
送ることができます。また、データをセグメント化したり、ノイズの多いソースからのイベントデータを専用のイ
ンデックスに送ったりできます。
重要：イベントを特定のインデックスに送るには、インデクサー上にそのインデックスがすでに存在していなけれ
ばなりません。存在しないインデックスにイベントを送った場合、インデクサーはそれらのイベントを破棄しま
す。
データ入力から特定のインデックスへのすべてのイベントの送信
特定のデータ入力からのすべてのイベントを特定のインデックスに送るには、システムにデータを取り込んでいる
Splunk コンポーネント (インデクサーまたはインデクサーにデータを送信するフォワーダー) 上のinputs.conf の
データ入力用スタンザに以下の行を追加します。
index = <index_name>
以下の inputs.conf スタンザの例では、/var/log からのすべてのデータをインデックス fflanda に送ります。
[monitor:///var/log]
disabled = false
index = fflanda
特定のイベントを別のインデックスに送る
イベントを特定のキューに送るように、特定のイベントを特定のインデックスに送ることができます。これは、イ
ンデクサー自体に設定します。インデクサーにデータを送信するフォワーダーではありません。
特定のイベントを特定のインデックスに送るには、インデクサー上で props.conf と transforms.conf を編集しま
す。
1. 目的のイベントを識別するための、共通の属性を判断します。
2. props.conf で、ソース、ソースタイプ、またはホストのスタンザを作成します。このスタンザ
は、transforms.conf で作成する正規表現を含むスタンザにする transforms_name を指定します。
3. transforms.conf に、ステップ 2 で指定した transforms_name と言う名前のスタンザを作成します。このスタン
ザは：
ステップ 1 で指定した属性に一致する正規表現を指定します。
属性に一致するイベントを送る代替インデックスを指定します。
以下のセクションは、ステップ 2 と 3 の詳細を記載しています。
props.conf の編集
$SPLUNK_HOME/etc/system/local/props.conf
に以下のスタンザを追加します。
[<spec>]
TRANSFORMS-<class_name> = <transforms_name>
以下の事項に注意してください。
<spec>
は、以下のいずれかになります。
<sourcetype>、イベントのソースタイプ
host::<host>、<host>
はイベントのホスト
はイベントのソース
source::<source>、<source>
<class_name>
は、任意の一意の識別子です。
<transforms_name>
は、transforms.conf 内で換に割り当てる任意で一意の識別子です。
transforms.conf の編集
$SPLUNK_HOME/etc/system/local/transforms.conf
に以下のスタンザを追加します。
17
[<transforms_name>]
REGEX = <your_custom_regex>
DEST_KEY = _MetaData:Index
FORMAT = <alternate_index_name>
以下の事項に注意してください。
<transforms_name>
は、props.conf に指定されている <transforms_name> 識別子と一致する必要がありま
す。
<your_custom_regex>
DEST_KEY
には、ステップ 1 で指定した属性の一致条件を指定します。
にはインデックス属性 _MetaData:Index を指定する必要があります。
<alternate_index_name>
には、イベントをルーティングする代替インデックスを指定します。
例
この例では、windows_snare_log ソースタイプのイベントを、そのログタイプに基づいて適切なインデックスに送
ります。アプリケーション (Application) ログは代替インデックスに送られます。セキュリティ (Security) などのそ
の他のログタイプは、デフォルトのインデックスに送られます。
このように仕分けるにためには、props.conf を使用します。windows_snare_log ソースタイプのイベントにし
て、transforms.conf の AppRedirect スタンザ (「Application」ログタイプを探す正規表現を指定) を介して送り先
を指示します。適切な場所で「Application」に一致したイベントは、代替インデックス「applogindex」に送られ
ます。その他のイベントはすべてデフォルトのインデックスに送られます。
1. 属性の識別
この例のイベントは以下のようになります。
web1.example.com
MSWinEventLog
1
Application
4156
MSDTC
Unknown User
N/A
Information
message: Session idle timeout over, tearing down the session.
721
WEB1
Wed Sep 06 17:05:31 2006
Printers
179
web1.example.com
MSWinEventLog
1
Security
722
Wed Sep 06 17:59:08 2006
576
Security
SYSTEM
User
Success Audit
WEB1
Privilege Use
Special privileges assigned to new logon:
User Name:
Domain:
Logon
ID: (0x0,0x4F3C5880)
Assigned: SeBackupPrivilege
SeRestorePrivilege
SeDebugPrivilege
SeChangeNotifyPrivilege
SeAssignPrimaryTokenPrivilege 525
一部のイベントには値「Application」が、他のイベントには同じ場所に値「Security」が存在しています。
2. props.conf の編集
$SPLUNK_HOME/etc/system/local/props.conf
に以下のスタンザを追加します。
[windows_snare_syslog]
TRANSFORMS-index = AppRedirect
これは、windows_snare_syslog ソースタイプのイベントに、transforms.conf 内の AppRedirect スタンザを指示し
ています。
3. transforms.conf の編集
$SPLUNK_HOME/etc/system/local/transforms.conf
に以下のスタンザを追加します。
[AppRedirect]
REGEX = MSWinEventLog\s+\d+\s+Application
DEST_KEY = _MetaData:Index
FORMAT = applogindex
このスタンザは、props.conf によりここに誘導されたイベントを処理します。正規表現に一致したイベント (文字
列「Application」を含む) は、代替インデックス「applogindex」に送られます。その他のイベントはすべて、通常
通りにデフォルトのインデックスに送られます。
特定のインデックスのサーチ
特定のインデックスを明示的に指定しない限り、Splunk はデフォルトのインデックス (デフォルトでは main) を
象にサーチを実施します。たとえば、以下のサーチコマンドは、hatch インデックスをサーチします。
18
String
index=hatch userid=henry.gale
また、特定のロールの作成/編集時に別のデフォルトインデックスを設定して、それにしてサーチを実行すること
も可能です。
Splunk からのインデックスとデータの削除
インデックス作成したデータまたはインデックス全体を Splunk から削除できます。主なオプションを以下に示し
ます。
今後のサーチからイベントを削除する。
1 つまたは複数のインデックスからすべてのデータを削除する。
インデックス全体を削除または無効にする。
リタイアポリシーに基づいて古いデータを削除する。
警告：削除したデータを元にすことはできません。ここで明している方法で削除したデータを元にしたい場合
は、適切なデータソースからデータのインデックスを再作成する必要があります。
今後のサーチからイベントを削除する
Splunk には、今後のサーチからイベントデータを削除するための特別な演算子 delete が用意されていま
す。delete を使用する前に、このセクションを注意深くお読みください。
注意：リアルタイムサーチ時には delete 演算子を実行できず、到着するイベントを削除することはできません。
リアルタイムサーチ時に delete の使用を試みると、エラーメッセージが表示されます。
削除できるユーザーは？
演算子は、「delete_by_keyword」限を持つユーザーのみが実行できます。Splunk にはデフォルトで、特
殊ロール「can_delete」が用意されており、このロールがこの限を保有しています (他は保有していない)。デフォ
ルトで、管理者ロールにはこの限が与えられていません。インデックスデータを削除する際にログインする、特
別なユーザーを作成しておくことをお勧めします。
delete
詳細は、『Security Manual』の「Add and edit roles」を参照してください。
削除方法
まず、削除象イベントを返すサーチを実行します。このサーチは削除象イベントのみを返し、その他のイベント
は返さないことを入念に確認してください。確認できたら、パイプを使ってサーチ結果を delete 演算子に渡しま
す。
たとえば、ソース /fflanda/incoming/cheese.log からインデックス作成したイベントを削除して、今後のサーチ
に表れないようにする場合は、以下の作業を行います。
1. 今後インデックスが作成されないように、象のソースを無効化または削除します。
2. インデックスから、当該ソースのイベントをサーチします。
source="/fflanda/incoming/cheese.log"
3. 削除象データが正しく返されているかどうか、結果を確認します。
4. これらのデータが目的の削除データだと確認できたら、パイプ文字を使ってサーチを delete に渡します。
source="/fflanda/incoming/cheese.log" | delete
その他の例については、『Search Reference Manual』の delete 演算子に関する項目を参照してください。
サーチを delete 演算子に渡すことにより、そのサーチから返されるすべてのイベントがマークされます。マーク
されたイベントは、今後のサーチでは返されません。Splunk でサーチを実行して、このデータを参照できるユー
ザーは存在しません (管理限を持つユーザーを含む)。
注意：パイプ文字を使って delete に結果を渡してもディスクスペースがえることはありません。
また、delete 演算子はイベントのメタデータを更新することもありません。そのため、任意のメタデータサーチ
には引き続きそれらのイベントが含まれますが、それらはサーチ不可となっています。メインのすべてのインデッ
クスデータダッシュボードには、削除されたソース、ホスト、またはソースタイプのイベント数が引き続き表示さ
れます。
19
1 つまたは複数のインデックスからのデータの削除
ディスクからインデックスデータを永久に削除するには、CLI の clean コマンドを使用します。このコマンドは
<index_name> 引数の指定内容にじて、1 つまたはすべてのインデックスからデータを完全に削除します。一般的
に clean は、すべてのデータのインデックスを再作成する前に実行します。
注意：CLI の clean コマンドは、Windows 版も含めてすべてのバージョンの Splunk で使用できます。Windows
版の Splunk で CLI コマンドを発行する際には、以下に記載されている例のスラッシュ (/) の代わりに、円記号 (\)
を使用してください。
clean コマンドの使用方法
ここでは、clean コマンドの主な使用方法について明していきます。
clean
のヘルプを表示するには、以下のコマンドを入力します。
splunk help clean
すべてのインデックスからイベントデータを削除するには、以下のコマンドを入力します。
splunk clean eventdata
1 つのインデックスからイベントデータを削除するには、以下のコマンドを入力します。
splunk clean eventdata -index <index_name>
ここで、<index_name> は象となるインデックス名を表しています。
clean
で確認のメッセージを表示しない場合は、-f パラメータを追加します。
重要：clean コマンドを実行する前には、Splunk を停止する必要があります。
注意：5.0 より前のバージョンの Splunk では、clean コマンドを実行するとインデックスの次のバケツ ID 値が 0
にリセットされました。バージョン 5.0 以降では、そのような問題がなくなりました。最新のバケツ ID が 3 の場
合、clean を実行すると次のバケツ ID は 0 ではなく 4 になります。バケツの命名規則とバケツ ID の詳細は、この
マニュアルの「インデックスディレクトリの内容」を参照してください。
例
この例では、すべてのインデックスからイベントデータを削除します。
splunk stop
splunk clean eventdata
この例では、_internal インデックスからイベントデータを削除します。また、削除を確認するメッセージは表示
しません。
splunk stop
splunk clean eventdata -index _internal -f
インデックス全体の削除
インデックス全体を削除するには (それに含まれているデータのみではなくすべてを削除)、CLI コマンドの remove
index を使用します。
splunk remove index <index_name>
このコマンドは、インデックスのデータディレクトリを削除し、また indexes.conf からインデックスのスタンザ
を削除します。
このコマンドを実行する前に、すべての inputs.conf ファイルを参照して (インデクサーおよびインデクサーに
データを転送するフォワーダー上のファイル)、削除象インデックスにデータを送るように指示しているスタンザ
がないことを確認してください。たとえば、インデックス「nogood」まを削除する場合、データ入力スタンザ内
に属性/値のペア index=nogood が指定されていないことを確認します。. インデックスが削除されたら、以降その
インデックスに送信されるデータは破棄されます。
remove index
を実行する場合、インデクサー上の任意のデータ取り込み設定が、そのインデックスにデータを送
20
るように設定されていると、警告のメッセージが表示されます (フォワーダー上の設定は確認されません)。以下の
ようなメッセージが表示されます。
03-28-2012
03-28-2012
03-28-2012
03-28-2012
23:59:22.973
23:59:22.973
23:59:22.973
23:59:22.973
-0700
-0700
-0700
-0700
WARN
WARN
WARN
WARN
IndexAdminHandler
IndexAdminHandler
IndexAdminHandler
IndexAdminHandler
-
Events from the following 3 inputs will now be discarded, since they
type: monitor, id: /home/v/syslog-avg-1000-lines
type: monitor, id: /mnt/kickstart/internal/fermi
type: monitor, id: /mnt/kickstart/internal/flights
の動作中に remove index を実行することができます。コマンド実行完了後、splunkd を再起動する必要は
ありません。
splunkd
インデックス削除処理は比較的高速ですが、処理完了までにかかる時間はさまざまな要因によって異なります。
削除象データの量。
同じディスク上の他のインデックスに大量の書き込みを行っているかどうか。
削除象インデックスに小さな .tsidx ファイルが大量に存在しているかどうか。
インデックスを削除せずに無効化する
インデックスを削除しないで無効化する場合は、disable index CLI コマンドを使用します。
splunk disable index <index_name>
コマンドと違い、disable index コマンドはインデックスデータを削除しません。無効化したデータ
は再び有効にすることができます (enable index コマンドを使用)。ただし、インデックスを無効化する
と、splunkd はそのインデックスを象にしたデータを受け付けません。
remove index
Splunk Web でインデックスを無効化することもできます。この場合は、[管理] > [インデックス] に移動した後、
目的のインデックスの右側にある [無効] をクリックします。
リタイアポリシーに基づいて古いデータを削除
インデックス内のデータが指定期間を過した場合、またはインデックスのサイズが指定値に達した場合、それは
「フローズン」状態に移行します。この時点で、そのデータはインデックスから削除されます。リタイアポリシー
の設定内容によっては、データを削除する前に、それをアーカイブに移動することもできます。
詳細は、このマニュアルの「リタイアおよびアーカイブポリシーの設定」を参照してください。
インデックスの最適化
Splunk によるデータインデックスの作成中に、splunk-optimize プロセスの 1 つまたは複数のインスタンスが断
続的に実行され、データサーチ時のパフォーマンスを最適化するためにインデックスファイルが結合されま
す。splunk-optimize プロセスはほんの短時間ですが、CPU を大幅に使用することがあります。splunk-optimize
の同時インスタンス数は、indexes.conf の maxConcurrentOptimizes 値を更して減らすことができますが、一般的
にはこの作業は必要ありません。
splunk-optimize
が十分な頻度で実行されない場合は、サーチ効率が低下してしまいます。
は、ホットバケツ上でのみ実行されます。大量のインデックス (.tsidx) ファイルがある場合 (一
般的には 25 以上) は、ウォームバケツで手動実行することも可能です。splunk-optimize を実行するに
は、$SPLUNKHOME/bin に移動して以下のコマンドを入力します。
splunk-optimize
splunk-optimize -d|--directory <bucket_directory>
には、さまざまなオプションパラメータを指定できます。利用できるパラメータを表示するに
は、以下のコマンドを入力します。
splunk-optimize
splunk-optimize
バケツの詳細は、「Splunk によるインデックスの保管方法」を参照してください。
インデックスストレージの管理
Splunk によるインデックスの保管方法
21
Splunk がデータのインデックスを作成するにつれて、一連のファイルが作成されます。これらのファイルには、2
種類のデータが含まれています。
縮形式の raw データ (rawdata)
raw データを指すインデックスといくつかのメタデータファイル (インデックスファイル)
Splunk のインデックスは、これらのファイルにより構成されています。一連のディレクトリに保管されている
ファイルは、その過時間で管理されています。一部のディレクトリには、新たに作成されたインデックスデータ
が含まれています。他のディレクトリには、以前に作成されたインデックスデータが含まれています。このような
ディレクトリ数は、インデックスを作成するデータ量にじて、とても大きくなる場合があります。
注意事項
実際にはさほど気にする必要はありません。Splunk はデフォルトで、インデックスデータをさまざまな段階をて
管理、処理します。一般的に数年後など、長期間の過後には、Splunk は古いデータをシステムから削除します。
デフォルトのスキーマでも十分に役立ちます。
ただし、大量のデータのインデックスを作成する、特別なデータ保持要件がある、またはその他過時間に関する
ポリシーを入念に討する必要があるような場合は、このトピックを参考にしてください。また、データをバック
アップするような場合にも、どこにデータがあるのかを理解するためにこの記事が役立ちます。どうぞご一読くだ
さい。
Splunk のデータ過時間の仕組み
各インデックスディレクトリは、バケツと呼ばれています。現在まで学習したことをまとめると：
Splunk のインデックスには、縮された raw データと関連するインデックスファイルが含まれている。
Splunk インデックスは、多数の過時間が指定されたインデックスディレクトリにまたがって存在してい
る。
インデックスディレクトリはバケツである。
バケツはその過時間の過に伴い、さまざまなステージに移行します。
ホット
ウォーム
コールド
フローズン
バケツは、その過時間が過するにつれて、あるステージから別のステージへと移行していきます。嵐にインデッ
クスが作成されたデータはホットバケツに保管されます。ホットバケツは、サーチ可で積極的に書き込まれます。
ホットバケツが一定のサイズに達すると、それはウォームバケツになり (ウォームに移行)、新たなホットバケツが
作成されます。ウォームバケツはサーチ可ですが、積極的には書き込まれません。ウォームバケツは多数存在して
います。
Splunk が作成したウォームバケツが最大数に達すると、その過時間に基づいてウォームバケツからコールドバケ
ツへの移行が開始されます。常に一番古いバケツがコールドバケツに移行されます。バケツはこのようにして、時
間の過に伴い順次コールドバケツに移行していきます。設定されている期間が過すると、コールドバケツはフ
ローズンバケツに移行します。この時点でバケツはアーカイブまたは削除されます。indexes.conf 内の属性を編集
することで、バケツの過時間ポリシーを指定することができます。このポリシーは、バケツのあるステージから
次のステージへの移行時期を示します。
バケツが移行する各ステージを以下に示します。
バケツの
ステージ
明
サーチ可？
ホット
新たにインデックスが作成されたデータを保管し
ています。書き込み可能。各インデックスにし
はい
て 1 つまたは複数のホットバケツ。
ウォーム
ホットから移行されたデータ。ウォームバケツは
はい
多数存在しています。
コールド
ウォームから移行されたデータ。コールドバケツ
はい
は多数存在しています。
フローズ
ン
コールドから移行されたデータ。デフォルトで
は、フローズンデータは削除されますが、アーカ
いいえ
イブすることも可能です。アーカイブされたデー
タは、後ほど解凍することができます。
22
特定のステージのバケツの集合体は、データベースまたは DB と呼ばれることもあります。たとえば、ホット
DB、ウォーム DB、コールド DB などのように呼ばれます。
注意：ホットバケツは、splunkd の再起動時に常に移行されます。
インデックスディレクトリの内容
各バケツには、サブディレクトリが存在しています。Splunk は、ホット/ウォーム/コールドバケツを区別するため
に、ディレクトリを編成管理しています。また、バケツディレクトリ名は、データの過時間に基づいています。
デフォルトインデックス (defaultdb) のディレクトリ構造を以下に示します。
バケツ
タイプ
デフォルトの場所
メモ
ホット $SPLUNK_HOME/var/lib/splunk/defaultdb/db/*
複数のホットサブディレクトリが存在する場合
があります。各ホットバケツは独自のサブディ
レクトリを保有しています。サブディレクトリ
の命名規則を以下に示します。
hot_v1_<localid>
ウォー
$SPLUNK_HOME/var/lib/splunk/defaultdb/db/*
ム
各ウォームバケツ個別のサブディレクトリが存
在しています。これらの名前は、「ウォーム/
コールドバケツの命名規則」の明に従って付け
られます。
複数のコールドサブディレクトリが存在してい
ます。ウォームバケツがコールドに移行される
と、データはこのディレクトリに移動されます
が名前は更されません。
コール
$SPLUNK_HOME/var/lib/splunk/defaultdb/colddb/*
ド
注意：クラスタ内で、バケツの複製されたコ
ピーはすべて colddb ディレクトリに保管されま
す。ホット、ウォーム、またはコールドかどう
かは関係ありません。ただし、元のクラスタバ
ケツのコピーは、この表に記載されている標準
の場所に保管されます。たとえば clusterpeer1
が新しいホットバケツを作成し、それを
clusterpeer2 に複製した場合、clusterpeer1 上の
元のホットバケツのコピーは db ディレクトリに
保管されます。clusterpeer2 上の複製された
ホットバケツのコピーは、colddb ディレクトリ
に保管されます。クラスタとバケツの詳細は、
このマニュアルの「バケツとクラスタ」を参照
してください。
フロー N/A：フローズンデータは、削除されるかまたは指定
ズン
ディレクトリにアーカイブされます。
デフォルトでは削除されます。代わりにデータ
をアーカイブする方法については、「インデッ
クスデータのアーカイブ」を参照してくださ
い。
解凍
アーカイブされて、後ほど解凍されたデータの
場所。アーカイブされたデータの解凍状態への
復元については、「アーカイブされたデータの
復元」を参照してください。
$SPLUNK_HOME/var/lib/splunk/defaultdb/thaweddb/*
ホット/ウォーム、およびコールドディレクトリへのパスは更することができます。たとえば、コールドバケツを
ホット/ウォームバケツとは個別の場所に保管することができます。「インデックスストレージの設定」および
「インデックスデータへの複数パーティションの使用」を参照してください。
重要：すべてのインデックス保管場所は書き込み可能でなければなりません。
ウォーム /コールドバケツの命名規則
バケツ名は、それに含まれているデータの時間範を表しています。バケツの命名規則は、インでクサーがクラス
タピアとして機能している間にウォームに移行されたかどうかによって、わずかに異なっています。
23
非クラスタバケツの場合： db_<newest_time>_<oldest_time>_<localid>
クラスタ化された元のバケツコピーの場合： db_<newest_time>_<oldest_time>_<localid>_<guid>
クラスタ化された複製バケツコピーの場合： rb_<newest_time>_<oldest_time>_<localid>_<guid>
ここで：
および <oldest_time> は、保管されているデータの過時間を表すタイムスタンプです。タイ
ムスタンプは、UTC エポック時 (秒) で表されています。例：db_1223658000_1223654401_2835 は、2008 年
10 月 10 日からの期間が午前 9 時午前 10 時のデータを含む、非クラスタウォームバケツです。
<localid> は、元のバケツが存在しているインデクサーが生成したバケツの ID です。
<guid> は、元のバケツが存在しているピアノード (インデクサー) の guid です。guid はピアの
$SPLUNK_HOME/etc/instance.cfg ファイルにあります。
<newest_time>
クラスタ内で、元のバケツと複製されたコピーは同じ名前を持ちますが、プリフィックスが異なっています (元の
バケツは db、複製されたコピーは rb)。
注意：クラスタ内で、データが元のピアからターゲットピアに転送される場合、データはまずターゲットピアの一
時ディレクトリに保管されます。このディレクトリは、元のピアの <localid> および <guid> で示されます
(例：<localid>_<guid>)。. これは、データの転送元バケツの種類に関係なく当てはまります。複製が完了した
ら、このディレクトリがウォームバケツに移行され、前述のようにプリフィックス rb_ が付けられます。クラスタ
のアーキテクチャと複製されたデータの転送の概要は、「基本的なクラスタアーキテクチャ」を参照してくださ
い。
重要：バケツの命名規則は更される可能性があります。
バケツと Splunk の管理
Splunk を管理する際には、Splunk がバケツにどのようにインデックスを保管するのかを理解しておくと役立ちま
す。特に、さまざまな管理作業を行うためには、バケツを正しく理解しておく必要があります。
リタイアおよびアーカイブポリシーの設定方法については、「リタイアおよびアーカイブポリシーの設定」を参照
してください。リタイアポリシーは、データのサイズまたは過時間に基づいて設定することができます。
インデックスデータのアーカイブ方法の詳細は、「インデックスデータのアーカイブ」を参照してください。署名
のアーカイブについては、『Security Manual』の「Configure archive signing」を参照してください。アーカイブ
からのデータの復元方法については、「アーカイブされたデータの復元」を参照してください。
データのバックアップ方法については、「インデックスデータのバックアップ」を参照してください。このトピッ
クでは、手動によるホットバケツからウォームバケツへの移行 (バックアップできるようにするため) 方法につい
ても明されています。また、Community Wiki の「Best practices for backing up」も参照してください。
ディスク使用量の制限値の設定については、「ディスク使用量の制限の設定」を参照してください。
バケツの設定項目の一覧については、「インデックスストレージの設定」を参照してください。
バケツのトラブルシューティング
ここでは、バケツに関するさまざまな問題の処方法について明していきます。
クラッシュ後の回復
通常 Splunk は、ユーザーの介入なしでクラッシュ後の回復を行えます。予期しない問題でインデクサーが停止し
た場合、最後の方で受信したデータをサーチできないことがあります。Splunk を再起動すると、バックグラウン
ドで fsck が自動実行されます。このコマンドは、バケツのヘルス状態を診断して、必要にじてサーチデータを再
構築します。
の手動実行が必要になるようなことはほとんどありません。このコマンドを手動実行する場合は、Splunk を
停止する必要があります。また、インデックスが大きい場合は、コマンドの完了までに数時間かかることもありま
す。それまでの間は、データにアクセスできません。ただし、Splunk サポートからこのコマンドの実行が指示さ
れた場合に備えて、このセクションの残りの部分では実行方法を明しています。(また、4.2.x インデクサーを回復
する場合も、fsck を手動実行する必要があります。このコマンドは、Splunk インデクサー 4.3 以上でのみ自動的
に実行されます。)
fsck
を手動実行するには、まず Splunk を停止する必要があります。次に、象のバケツにして fsck を実行しま
す。すべてのインデックスのバケツにして fsck を実行するには、以下のコマンドを使用します。
fsck
splunk fsck --repair --all
この場合、すべてのインデックスのすべてのタイプのバケツ (ホット/ウォーム/コールド/解凍) が再構築されます。
24
注意：fsck コマンドは、Splunk 4.2 以上で作成されたバケツのみを再構築します。
fsck
コマンドの詳細、および利用できるオプションの一覧を表示するには、以下のコマンドを実行してくださ
い。
splunk fsck
警告：インデックスのサイズによっては、fsck --repair コマンドの完了までに数時間かかることもあります。こ
のことが、可能な場合は Splunk にバックグラウンドでこのコマンドを実行させる理由です。また、一部のバケツ
のみを再構築する必要がある場合は、次の「バケツの再構築」の明に従って、それらのバケツにしてのみ
rebuild コマンドを実行することができます。
単にインデックスの状態を診断したいだけの場合は (復旧措置を行わない)、--repair フラグを指定しないで fsck
を実行します。
splunk fsck --all
バケツの再構築
バケツ内のインデックスおよびメタデータファイル (バージョン 4.2 以上) が何らかの理由で壊れた場合、raw デー
タファイルからバケツを再構築することができます。以下のコマンドを使用してください。
splunk rebuild <bucket directory>
古いインデックスおよびメタデータファイルが自動的に削除、再構築されます。自分でファイルを削除する必要は
ありません。
重要：rebuild コマンドを実行する前に、Splunk を停止する必要があります。
注意事項：
バケツの再構築は、ライセンスのカウント象ではありません。
バケツの再構築を完了するまでに、長時間かかることがあります。ハードウェアの仕などシステム上のさま
ざまな要因により、10 GB のバケツの再構築に約 30 分数時間かかる場合もあります。
4.2 より前の無効なホットバケツの回復
メタデータファイル (Sources.data, Hosts.data, SourceTypes.data) が壊れているまたは不正だと判断される
と、ホットバケツは無効なホット (invalid_hot_<ID>) バケツになります。通常不正なデータは不正な時間範を指
しています。このことは、イベント数も不正確であることを表しています。
無効なホットバケツは無視されます。このようなバケツにデータは追加されず、サーチすることもできません。無
効なバケツは、maxTotalDataSizeMB などのバケツの制限値を決定する際にも考慮されません。無効なバケツがシ
ステム内のデータフローに影響を与えることはありませんが、これによりディスクストレージが、設定されてい
る最大値を超えてしまう可能性もあります。
無効なホットバケツを回復するには、recover-metadata コマンドを使用します。
1. メタデータファイル Sources.data, Hosts.data, SourceTypes.data ののバックアップコピーを作成します。
2. raw データ情報からメタデータを再構築します。
splunk cmd recover-metadata path_to_your_hot_buckets/invalid_hot_<ID>
3. 成功したら、バケツを通常の名前に更します。
インデックスレベルのバケツマニフェストの再構築
インデックスレベルのマニフェストを再構築する必要はほとんどありませんが、必要な場合に備えてそのためのコ
マンドがいくつか用意されています。
警告：これらのコマンドは、Splunk サポートから指示された場合にのみ使用してください。独自にマニフェスト
を再構築しないようにしてください。
インデックスレベルのマニフェストファイルには、.bucketManifest と .metaManifest の 2 種類のファイルがあり
ます。.bucketManifest ファイルには、インデックス内のすべてのバケツのリストが含まれています。たとえば、
バケツをインデックスに手動コピーしたような場合に、これの再構築が必要になります。.metaManifest ファイル
には、インデックスレベルのメタデータファイルに寄与するバケツのリストが含まれています。
25
以下のコマンドは、.bucketManifest および .metaManifest ファイル、そして main インデックスの homePath 内
のすべての *.data ファイルのみを再構築します。個別のバケツのメタデータを再構築することはありません。
splunk _internal call /data/indexes/main/rebuild-metadata-and-manifests
.metaManifest
および homePath/*.data ファイルのみを再構築する場合は、代わりに以下のコマンドを使用しま
す。
splunk _internal call /data/indexes/main/rebuild-metadata
.bucketManifest
ファイルのみを再構築する場合は、以下のコマンドを使用します。
splunk _internal call /data/indexes/main/rebuild-bucket-manifest
すべてのインデックスのマニフェストを再構築する場合、ワイルドカードのアスタリスク (*) を使用できます。
例：
splunk _internal call /data/indexes/*/rebuild-metadata-and-manifests
その他の参考情報
インデックスストレージとバケツの詳細については、以下の各トピックを参照してください。
インデックスストレージの設定
インデックスデータ用の複数パーティションの使用
インデックスストレージの設定
バケツとクラスタ
また、『管理マニュアル』の「indexes.conf」および Community Wiki の「Understanding buckets」も参照してく
ださい。
インデックスストレージの設定
インデックスは、indexes.conf で設定します。indexes.conf の編集方法は、インデックスレプリケーション (クラ
スタ化インデックス) を使用しているかどうかによって異なります。
クラスタ化されていないインデックスの場合、$SPLUNK_HOME/etc/system/local/ 内または
$SPLUNK_HOME/etc/apps/ 内のカスタム App ディレクトリ内の indexes.conf のコピーを編集しま
す。$SPLUNK_HOME/etc/system/default 内のコピーは編集しないでください。設定ファイルとディレクトリ
の場所については、「設定ファイルについて」を参照してください。
クラスタ化インデックスの場合、クラスタのマスターノード上の indexes.conf のコピーを編集し、次にそれ
をすべてのピアノードに配布します (「ピアインデックスの設定」を参照)。
この表には、バケツに影響する主な indexes.conf 属性とその設定が記載されています。また、これらの属性の使
用方法を表しているトピックへのリンクも記載されています。他も含めて、これらの属性の詳細情報の大半は、常
に indexes.conf ファイルを参照します。
属性
設定内容
デフォルト
ホットおよびウォームバケツ
を保管しているパス (必須)。
homePath
この場所は書き込み可能でな
ければなりません。
$SPLUNK_HOME/var/lib/splunk/
(デフォルトのイ
ンデックスのみ)
defaultdb/db/
詳細は、以下
の項目を参照...
インデックス
データ用の複
数パーティ
ションの使用
コールドバケツを保管するパ
ス (必須)。
coldPath
クラスタでは、これはすべて
の複製されたバケツのコピー
の場所にもなります。この場
所は書き込み可能でなければ
なりません。
26
$SPLUNK_HOME/var/lib/splunk/
(デフォルト
のインデックスのみ)
defaultdb/colddb/
インデックス
データ用の複
数パーティ
ションの使用
解凍されたバケツを保管する
パス (必須)。
thawedPath
この場所は書き込み可能でな
ければなりません。
$SPLUNK_HOME/var/lib/splunk/
(デフォル
トのインデックスのみ)
defaultdb/thaweddb/
インデックス
データ用の複
数パーティ
ションの使用
repFactor
インデックスを他のクラスタ
ピアに複製するかどうかを指
定します。(クラスタピアノー
ド上のインデックスにして必
須。)
0 (インデックスは他のピアに複
製されない、非クラスタイン
デックスの場合の正しい動作)。
ピアインデッ
クラスタ化インデックスの場合
クスの設定
は、インデックスを複製するた
めに repFactor に auto を設
定する必要があります。
maxHotBuckets
ホットバケツの最大数。アー
カイブデータを処理するため
に、この値には 2 以上を設定
する必要があります。たとえ
ば、デフォルトの main イン
デックスの場合、これに 10 が
設定されています。
新しいカスタムインデックスの
場合は、3 になります。
maxDataSize
ホットからウォームへの移行
動作を決定します。ホットバ
ケツの最大サイズ。ホットバ
ケツがこのサイズに達する
と、ウォームに移行します。
この属性は、すべてのバケツ
の概算サイズも決定します。
状況により異なります。
indexes.conf を参照。
maxWarmDBCount
ウォームからコールドへの移
行動作を決定します。ウォー
ムバケツの最大数。ウォーム
バケツが最大数に達すると、
コールドへの移行が開始され
ます。
300
インデックス
データ用の複
数パーティ
ションの使用
maxTotalDataSizeMB
コールドからフローズンへの
移行動作を決定します。イン
デックスの最大サイズ。この
限度に達すると、コールドバ
ケツのフローズンへの移行が
開始されます。
500000 (MB)
リタイアおよ
びアーカイブ
ポリシーの設
定
frozenTimePeriodInSecs
コールドからフローズンへの
移行動作を決定します。フ
ローズンに移行してからの、
バケツの最大過時間。
188697600 (秒、約 6 年)
リタイアおよ
びアーカイブ
ポリシーの設
定
coldToFrozenDir
アーカイブしたデートの保管
場所。バケツがコールドから
フローズンに移行した時の動
作を決定します。設定した場
合、フローズンバケツをイン
デックスから削除する直前
に、そのバケツをこのディレ
クトリにアーカイブします。
coldToFrozenScript
コールドバケツをフローズン
バケツに移行する直前に実行
するスクリプト。この属性と
coldToFrozenDir の両方を設定
した場合、coldToFrozenDir が
使用され、この属性は無視さ
れます。
(ホット/ウォームバケ
ツストレージ) または coldPath
homePath
27
Splunk のデー
タ過時間の仕
組み
インデックス
データ用の複
数パーティ
ションの使用
リタイアおよ
びアーカイブ
ポリシーの設
定
この属性または
のどちらも
設定しない場合、バケツがフ
ローズンに移行されると、バケ
ツのディレクトリ名のみがログ
に記され、バケツは削除されま
す。
coldToFrozenScript
インデックス
作成された
データのアー
カイブ
この属性または
のどちらも設
定しない場合、バケツがフロー
ズンに移行されると、バケツの
ディレクトリ名のみがログに記
され、バケツは削除されます。
coldToFrozenDir
インデックス
作成された
データのアー
カイブ
homePath.maxDataSizeMB (コールドバケツストレージ) の
最大サイズ。どちらかの属性
なし
coldPath.maxDataSizeMB が存在しない、または 0 が設
定されている場合、そのパス
はサイズによる制約を受けま
せん。
maxVolumeDataSizeMB
ボリュームの最大サイズ。属
性が指定されていない場合、
個別のボリュームのサイズに
制約はありません。
なし
バケツタイプ
によるイン
デックスサイ
ズの設定
ボリュームに
よるインデッ
クスサイズの
設定
注意：非クラスタインデックスの場合のみ、Splunk 管理を使ってインデックスへのパスを設定することができま
す。[Splunk 管理] > [システム設定] > [全般設定] に移動してください。[インデックス設定] で、[インデックスへの
パス] フィールドを設定します。この作業を行った後は、CLI から Splunk を再起動する必要があります ([管理] か
らではない)。
インデックスデータベースの移動
インデックスデータベース全体を、ある場所から別の場所に移動できます。ここでは、そのための手順について
明していきます。この手順では、インデックスデータベースがインストール時に作成されるデフォルトの場所に存
在していることを前提にしています。
個別のインデックスまたはインデックスの一部を別の場所に移動することも可能です。いったん移動すると、その
後の移動操作はここで明している手順とは異なります。Splunk インデックスの構造の詳細は、「Splunk によるイ
ンデックスの保管方法」を参照してください。単一のインデックスの場所の更方法については、「インデックス
ストレージの設定」を参照してください。
*nix ユーザーの場合
1. ターゲットファイルシステムに十分なスペースがあることを確認してください。最低でもインデックス作成の
象となる raw データの合計サイズの 1.2 倍以上のスペースが必要です。
2. ターゲットディレクトリを作成し、それにして Splunk が実行するユーザーにする書き込み限があることを確
認してください。たとえば、Splunk がユーザー「splunk」として実行される場合、そのユーザーにディレクトリ
の所有を与えてください。
mkdir /foo/bar
chown splunk /foo/bar/
Splunk を実行するユーザーの設定については、このトピックを参照してください。
3. 新しいインデックスホームの準備が完了したら、Splunk を停止します。$SPLUNK_HOME/bin/ ディレクトリに移
動して、以下のコマンドを実行します。
splunk stop
4. 既存のインデックスファイルシステムを新しいホームにコピーします。
cp -rp $SPLUNK_DB/* /foo/bar/
5. SPLUNK_DB 環境数の設定を解除します。
unset SPLUNK_DB
6. 新しいインデックスディレクトリを反映するように、./etc/splunk-launch.conf を編集します。このファイル
の SPLUNK_DB 属性を、新たなインデックスディレクトリを指すように更します。
SPLUNK_DB=/foo/bar
7. Splunk を開始します。$SPLUNK_HOME/bin/ に移動して、以下のコマンドを実行します。
splunk start
Splunk サーバーは新しいインデックスのコピーの読み込み、書き込みを行う場所を認識します。
28
8. Splunk が新しい場所から読み取り/書き込みできることを確認したら、古いインデックスデータベースを削除す
ることができます。
Windows ユーザーの場合
1. ターゲットドライブまたはディレクトリに十分な利用可能スペースがあることを確認します。
警告：インデックスの保管場所としてマップされているネットワークドライブを使用することはまったくお勧めで
きません、またサポートされてもいません。
2. コマンドプロンプトから、ターゲットドライブに移動して、ターゲットドライブ内のファイルに splunkd プロセ
スが書き込めるように、正しく限が設定されていることを確認します。
C:\Program Files\Splunk> D:
D:\> mkdir \new\path\for\index
D:\> cacls D:\new\path\for\index /T /E /G <the user Splunk runs as>:F
Splunk を実行するユーザーについては、Windows への Splunk のインストールに関するトピックを参照してくだ
さい。
注意： Windows Vista、7、Server 2003、および Server 2008 ユーザーは、icacls を使ってディレクトリ限が正
しいかどうかを確認できます。Microsoft TechNet の記事に、特定のコマンドライン引数に関する情報が記載され
ています。
3. Splunk を停止します。%SPLUNK_HOME%\bin ディレクトリに移動して、以下のコマンドを実行します。
splunk stop
注意：コントロールパネルの [サービス] を使用して、splunkd および SplunkWeb サービスを停止することもでき
ます。
4. 既存のインデックスファイルシステムを新しいホームにコピーします。
xcopy C:\Program Files\Splunk\var\lib\splunk\*.* D:\new\path\for\index /s /e /v /o /k
5. SPLUNK_DB 環境数の設定を解除します。
set SPLUNK_DB=
6. 新しいインデックスディレクトリを反映するように、%SPLUNK_HOME%\etc\splunk-launch.conf を編集します。
このファイルの SPLUNK_DB 属性を、新たなインデックスディレクトリを指すように更します。
SPLUNK_DB=D:\new\path\for\index
注意：設定ファイル内の SPLUNK_DB 属性を含む行の先頭にシャープ記号 (#) がある場合、その行は注釈行とし
て取り扱われているため、# を削除する必要があります。
7. Splunk を開始します。%SPLUNK_HOME%\bin ディレクトリに移動して、以下のコマンドを実行します。
splunk start
Splunk サーバーは新しいインデックスのコピーの読み込み、書き込みを行う場所を認識します。
8. Splunk が新しい場所から読み取り/書き込みできることを確認したら、古いインデックスデータベースを削除す
ることができます。
Splunk 管理を使ったインデックスへのパスの更
Splunk 管理を使って、インデックスへのパスを更することができます。インデックスを実際に移動する前に明し
た手続きとは異なり、Splunk 管理でパスを更した場合、その更は新たにインデックスに到着したデータにのみ適
用されます。そのため、このような目的で Splunk 管理を使用することは、データの取り込みを開始する前の新し
いインデクサーにのみ限定することをお勧めします。
パスを更するには：
1. [管理] > [システム設定] > [全般設定] に移動します。
2. このページの [インデックス設定] にある [インデックスへのパス] フィールドに移動します。
29
3. このフィールドに新しいパスを入力します。ここに、新たなインデックスデータが保管されます。
4. ご利用の環境で SPLUNK_DB 環境数が設定されている場合は、その設定を解除します。
*nix の場合、コマンドラインから以下のコマンドを入力します。
unset SPLUNK_DB
Windows の場合、コマンドラインから以下のコマンドを入力します。
set SPLUNK_DB=
5. CLI を使って Splunk を再起動します。$SPLUNK_HOME/bin/ (*nix) または %SPLUNK_HOME%\bin (Windows) に移動し
て、以下のコマンドを実行します。
splunk restart
重要：Splunk 管理内で再起動機能を使用しないでください。これには、目的としているインデックスディレクト
リを更する効果はありません。CLI から再起動する必要があります。
インデックスデータ用の複数パーティションの使
用
Splunk は、インデックスデータ用に複数のディスクおよびパーティションを利用できます。複数のインデックス
やバケツタイプに基づいて、多数のディスク/パーティション/ファイルシステムを使用するように設定することが
できます。ただし、それらを正しくマウントして、indexes.conf からそれらを正しく指すように設定する必要が
あります。しかし、最良の結果を得るためには、単一の高性能ファイルシステムを使って Splunk インデックス
データを保持/管理することをお勧めします。
複数のパーティションを使用する場合、Splunk のインデックスデータを配置するもっとも一般的な方法は、ロー
カルマシン上にホット/ウォームバケツを保持し、コールドバケツを別個のディスクアレイに格納することです (長
期保存用)。高速な読み取り/書き込みパーティションを持つマシン上にホット/ウォームバケツを配置することをお
勧めします。大半のサーチはここで行われます。コールドバケツは、信頼性の高いディスクアレイに配置してくだ
さい。
重要：クラスタを使用している場合、コールドストレージの要件はまったく異なっています。後述する「クラスタ
と coldPath」を参照してください。
複数のパーティションの設定
複数のパーティションを設定するには：
1. 普段 OS で設定しているように、パーティションを設定します。
2. ディスク/パーティションをマウントします。
3. パーティションの正しいパスを指すように、indexes.conf を編集します。パスはインデックス単位で設定しま
す。そのため、インデックスごとに個別のパーティションを設定することができます。各インデックスには、独自
の [<index>] スタンザが存在し、<index> がインデックス名となっています。これらは、設定可能なパス属性で
す。
homePath = <path on server>
これは、インデックスのホットおよびウォームデータベースを含むパスです。
警告：パスは書き込み可能でなければなりません。
coldPath = <path on server>
これは、インデックスのコールドデータベースを含むパスです。
警告：パスは書き込み可能でなければなりません。
重要：クラスタの場合、このパスはすべての複製されたバケツのコピーの保管場所としての役割も果
たします。(クラスタバケツの元のコピーは、バケツの種類にじて標準のディレクトリに保管されてい
ます。)そこで、coldPath ディレクトリにして使用するストレージの種類には、クラスタとはまったく
異なる要件が存在しています。「クラスタと coldPath」を参照してください。
thawedPath = <path on server>
これは、インデックスの解凍されたデータベースを含むパスです。
30
クラスタと coldPath
クラスタ内で、coldPath ディレクトリにして使用するストレージには、homePath のストレージと同じ特性がなけ
ればなりません。バケツの複製されたコピーはすべて、coldPath ディレクトリに保管されるためです。ホット、
ウォーム、またはコールドかどうかは関係ありません。coldPath にしていストレージを使用した場合、クラスタ
の総合的なパフォーマンスが低下してしまいます。
通常 coldPath にさほど頻繁にはアクセスされないデータが含まれているため、低速なディスクアレイに配置でき
る、非クラスタ構成のインデクサーとは違い、クラスタの場合はそのニーズをたすために、coldPath にしてパ
フォーマンスの高いストレージを使用する必要があります。たとえば、クラスタピアの coldPath に存在するバケ
ツの一部が、引き続き書き込まれている複製されたホットバケツである場合があります。他のバケツはウォームコ
ピーに複製され、サーチヘッドはそれらに頻繁にアクセスします。また、クラスタの設定および今後何が行われる
か (ピアがオフラインになるなど) にじて、ピアのバケツコピーをサーチ不可からサーチ可に換しなければなら
ず、coldPath データの処理にかなりの時間がかかることもあります。
クラスタ動作の詳細は、「クラスタおよびインデックスレプリケーションについて」およびそれ以降のトピックを
参照してください。特に、「システム要件」にはクラスタストレージのハードウェアに関する詳細な情報が記載さ
れています。
インデックスサイズの設定
インデックスストレージサイズは、さまざまな方法で設定できます。
インデックス単位
ホット/ウォームバケツ用とコールドバケツ用を個別に
ボリュームを使ってインデックス間にまたがって
インデックスストレージサイズを設定するには、indexes.conf に属性を設定します。このトピックで取り上げてい
る属性の詳細は、「インデックスストレージの設定」を参照してください。
警告：インデックスの処理中には、短時間ですが設定されている最大値を超える場合があります。制限を設定する
際には、いくらかのバッファ領域を確保するようにしてください。また、大部分の UNIX システムなど特定のシス
テムでは、そのパーティション上に設定可能な予約スペースが維持されていることに注意してください。インデッ
クスサイズを決定する際には、そのような予約スペースも考慮する必要があります。
各インデックスのインデックスサイズの設定
インデックス単位に最大インデックスサイズを設定するには、maxTotalDataSizeMB 属性を使用します。この限度
に達すると、バケツのフローズンへの移行が開始されます。
バケツタイプによるインデックスサイズの設定
(ホット/ウォームバケツストレージ) または coldPath (コールドバケツストレージ) の最大サイズを設定す
るには、maxDataSizeMB 属性を使用します。
homePath
# set hot/warm storage to 10,000MB
homePath.maxDataSizeMB = 10000
# set cold storage to 5,000MB
coldPath.maxDataSizeMB = 5000
属性はグローバルに、または各インデックスにして設定できます。インデックスレベルの設定は、
グローバル設定に優先します。インデックスのグループにまたがってバケツストレージを設定するには、後述の
maxVolumeDataSizeMB 属性を使用します。
maxDataSizeMB
ボリュームによるインデックスサイズの設定
ボリュームを作成して、最大データサイズを設定することにより、複数のインデックスにまたがってディスク使用
量を管理できます。ボリュームは、インデックス作成したデータを保管するファイルシステム内のディレクトリを
表します。
ボリュームには、複数のインデックスからのデータを保管できます。一般的には、ホット/ウォームバケツ用と
コールドバケツ用に個別のボリュームを使用します。たとえば、あるボリュームにすべてのインデックス用のホッ
ト/ウォームバケツを格納し、別のボリュームにはコールドバケツを格納するように設定できます。
ボリュームを使って homePath および coldPath を定義することができます。これを使って thawedPath を定義する
ことはできません。
31
また、bloomHomePath を明示的に定義する場合は、ボリュームを使用する必要があります。bloomHomePath の詳細
は、このマニュアルの「ブルームフィルタの設定」を参照してください。
ボリュームの設定
ボリュームを設定するには、以下の構文を使用します。
[volume:<volume_name>]
path = <pathname_for_volume>
必要にじて、ボリュームの最大サイズを指定する maxVolumeDataSizeMB 属性を入れることもできます。
例：
[volume:hot1]
path = /mnt/fast_disk
maxVolumeDataSizeMB = 100000
この例では、/mnt/fast_disk にあるボリューム「hot1」に最大サイズ 100,000 MB を割り当てています。
同に、以下のスタンザは最大 150,000 MB を使用するボリューム「cold1」を定義しています。
[volume:cold1]
path = /mnt/big_disk
maxVolumeDataSizeMB = 150000
ボリュームの使用
これで、インデックスの homePath および coldPath をボリュームで定義できるようになりました。たとえば、上記
で定義したボリュームを使って、以下の 2 つのインデックスを定義できます。
[idx1]
homePath = volume:hot1/idx1
coldPath = volume:cold1/idx1
[idx2]
homePath = volume:hot1/idx2
coldPath = volume:cold1/idx2
ボリュームを使って、自分のニーズに合わせてインデックスストレージスペースを管理できます。ただし、一般的
にボリュームは、ホット/ウォームおよびコールドバケツと相関しています。処理するバケツタイプによって、ス
トレージ要件も異なります。そのため、通常は一部のボリュームを homePath (ホット/ウォームバケツ) 専用として
指定し、coldPath (コールドバケツ) 用も別途指定します。
ウォームバケツを保管するボリュームが maxVolumeDataSizeMB に達すると、コールドへの移行が開始されます。
コールドバケツを保管するボリュームが maxVolumeDataSizeMB に達すると、フローズンへの移行が開始されます。
ボリュームにウォームバケツとコールドバケツの両方が存在している場合は (インデックスの homePath と
coldPath の両方に同じボリュームが設定された場合)、もっとも古いバケツがフローズンに移行されます。
すべてをまとめる
この例では、インデックス単位の homePath.maxDataSizeMB および coldPath.maxDataSizeMB 属性とボリュームを使
用した、インデックスストレージのきめ細かい管理方法について明していきます。特に、あるインデックスへの
データの集中により、他のインデックスからの頻繁なバケツ移動の発生を防止することを重視しています。イン
デックス単位の設定は、負荷を減らすためにどのインデックスも指定サイズを超えてスペースを専有しないように
することを目的にしています。
# global settings
# Inheritable by all indexes: no hot/warm bucket can exceed 1 TB.
# Individual indexes can override this setting.
homePath.maxDataSizeMB = 1000000
# volumes
[volume:caliente]
path = /mnt/fast_disk
maxVolumeDataSizeMB = 100000
[volume:frio]
path = /mnt/big_disk
32
maxVolumeDataSizeMB = 1000000
# indexes
[i1]
homePath = volume:caliente/i1
# homePath.maxDataSizeMB is inherited from the global setting
coldPath = volume:frio/i1
# coldPath.maxDataSizeMB not specified anywhere:
# This results in no size limit - old-style behavior
[i2]
homePath = volume:caliente/i2
homePath.maxDataSizeMB = 1000 # overrides the global default
coldPath = volume:frio/i2
coldPath.maxDataSizeMB = 10000 # limits the size of cold buckets
[i3]
homePath = /old/style/path
homePath.maxDataSizeMB = 1000
coldPath = volume:frio/i3
coldPath.maxDataSizeMB = 10000
ディスク使用量の制限の設定
Splunk はさまざまな方法でディスクスペースを制御しています。インデックスは、ディスクスペースの大半を消
費します。ディスクスペースが不足すると、インデックスの作成が停止されます。最低空きスペースの制限値を設
定して、インデックスの作成を停止するまでの空きディスクスペース量を制御することができます。空きスペース
量が制限値以上に回復すると、インデックスの作成が再開されます。
注意：インデックスに必要なスペース量を判断するには、『Installation Manual』の「Estimate your storage
requirements」を参照してください。
最低空きディスクスペースの設定
インデックスデータを保管するディスクの最低空きディスクスペース量を設定できます。制限値に達すると、
Splunk は動作を停止します。これはインデックスとサーチの両方に影響します。
Splunk は定期的に、インデックスを保管しているすべとのパーティションの空きスペースをチェックしま
す。いずれかのパーティションで空きディスクスペース制限値に達すると、その値より多くのスペースが利
用できるようになるまでの間、データのインデックス作成が中止されます。ディスクスペースを確保する必
要があることを知らせる、UI バナーおよび splunkd 警告が表示されます。
サーチを実行する前に、ディスパッチディレクトリが保管されている
$SPLUNK_HOME/var/run/splunk/dispatch のファイルシステム上で、指定された量の空きディスクを確保する
必要があります。
デフォルトの最低空きディスクスペース量は 2,000 MB です。
注意：
この方法では、Splunk がデータの消去によりディスクスペースを確保することはありません。単により多く
の空きスペースが確保されるまで、処理を停止します。
インデックスの作成が停止中に到着したデータは失われる可能性があります。
最低空きディスクスペース量は、Splunk Web、CLI、または server.conf 設定ファイルを使って設定することがで
きます。
Splunk Web
Splunk Web で最低空きディスクスペースを指定するには：
1. Splunk Web の右上にある [管理] をクリックします。
2. [システム設定] をクリックします。
3. [全般設定] をクリックします。
4. [インデックス設定] セクションで、[空きディスクスペースがこの値 (MB) を下回ったらインデックスの作成を一
時停止] フィールドを設定します。
33
5. 最低空きディスクスペース量をメガバイトで入力します。
6. [保存] をクリックします。
7. 更内容を有効にするために、Splunk を再起動します。
コマンドラインインターフェイス (CLI) の使用
Splunk の CLI を使って最低空きディスクスペース量を設定することができます。この例では、最低空きディスク
スペースとして 20,000 MB (20 GB) を設定します。
splunk set minfreemb 20000
splunk restart
CLI の使用方法の詳細は、『管理マニュアル』の「CLI について」を参照してください。
server.conf
server.conf ファイルに最低空きディスクスペースを設定することもできます。関連するスタンザ/属性を以下に示
します。
[diskUsage]
minFreeSpace = <num>
<num>
はメガバイトです。デフォルトは 2000 です。
インデックスストレージの制御
indexes.conf ファイルには、インデックス設定が含まれています。最大インデックスサイズやデータの最大過時
間などを指定して、ディスクストレージの使用を調整することができます。これらのいずれかの制限値に達する
と、もっとも古いインデックスデータが削除 (デフォルト) またはアーカイブされます。事前定義されているアー
カイブスクリプトを使用または独自のスクリプトを作成して、データをアーカイブすることができます。
を使った最大インデックスサイズまたは過時間の設定方法については、「リタイアおよびアーカイ
ブポリシーの設定」を参照してください。
indexes.conf
インデックスストレージの詳細は、「Splunk によるインデックス保管の仕組み」を参照してください。
ブルームフィルタの設定
ここでは、ブルームフィルタの概要およびそれを使ったパフォーマンス改善 (特に希な単語をサーチする場合) に
ついて明していきます。
このトピックを読む前に、Splunk によるデータの保管方法およびデータの過時間について理解しておく必要があ
ります。基本的に、インデックス作成されたデータはバケツと呼ばれるサブディレクトリから構成されるデータ
ベースディレクトリに保管されます。各インデックスには、独自のデータベースセットが存在しています。データ
はその過時間の過とともに、さまざまな種類のバケツに移行されます (ホット、ウォーム、コールド、フローズ
ン)。詳細は、「Splunk によるデータの保管」および「データの時間過」を参照してください。
なぜブルームフィルタを使用するのか？
ブルームフィルタは、エレメントがセットのメンバーかどうかをテストするために用いられるデータ構造です。ブ
34
ルームフィルタは、ディスク上の各バケツ内にファイルとして保管されます。サーチを実行する場合、特に希に登
場する単語をサーチする場合に、ブルームフィルタを使用するとインデックスからイベントを取得するまでの時間
を大幅に短縮することができます。
Splunk が時系列データのインデックスを作成するにつれて、raw データをタイムスタンプにより分類した raw
データを含む縮ファイルと一連の時系列インデックス (tsidx) ファイルが作成されます。tsidx ファイルは、データ
内のすべてのキーワード (エラーコード、答時間など) の辞書としての役割を果たす用語目ファイルで、raw デー
タ内のイベントの場所への参照が含まれています。サーチを実行すると、tsidx ファイル内のキーワードが索さ
れ、参照先の raw データファイルからイベントが取得されます。
ブルームフィルタはバケツレベルで機能し、個別のファイル bloomfilter を使用します。基本的にこれは、キー
ワードがバケツ内に存在しないことを知らせるハッシュテーブルです。そのため、サーチを実行する際には、ブ
ルームフィルタにより除外されていないバケツの tsidx ファイルのみをサーチするだけでみます。ディスクからイ
ベントを取得する実行コストは、tsidx ファイルのサイズと数に伴って加します。ブルームフィルタにより Splunk
がサーチする必要がある tsidx ファイル数が減るため、各バケツのサーチにかかる時間も減少します。
ブルームフィルタは、バケツの tsidx ファイルに見つかった一意のキーワードをすべて保管する代わりに、各キー
ワードのハッシュを計算します。複数のキーワードが同じハッシュになる場合もあります。そのため、誤判定の可
能性はありますが、出漏れは回避できます。ブルームフィルタはこのようにして、特定のバケツに存在しない単
語を素早く除外するため、Splunk は次のバケツのサーチに即座に取りかかることができます。ブルームフィルタ
が除外できなかったバケツ (バケツにキーワードが実際に存在するかどうかが分からない) にしては、通常のよう
にサーチが行われます。
ブルームフィルタの設定
ブルームフィルタは、バケツがホットからウォームに移行する際に作成されます。デフォルトでは、バケツがフ
ローズンに以降するとフィルタが削除されます (別の保持設定を指定していない場合)。ここでは、ブルームフィル
タファイルの設定と管理に使用できる設定パラメータについて明していきます。
ブルームフィルタを使用するかどうかを指定するには、limits.conf の use_bloomfilter パラメータを使用してく
ださい。
[search]
use_bloomfilter = true|false
* Control whether to use bloom filters to rule out buckets.
* Defaults to True.
特定のインデックスのブルームフィルタを作成するには、indexes.conf の Per Index オプションを編集します。
bloomHomePath = <path on index server>
* An absolute path that contains the bloomfilter files for the index.
* If not specified, it defaults to homePath.
* May contain a volume reference (see volume section below).
* MUST be defined in terms of a volume definition (see volume section below).
* CAUTION: Path must be writable.
* Must restart splunkd after changing this parameter; index reload will not suffice.
createBloomfilter = true|false
* Control whether to create bloomfilter files for the index.
* TRUE: bloomfilter files will be created. FALSE: not created.
* Defaults to TRUE.
また、bloomHomePath を明示的に定義する場合は、ボリュームを使用する必要があります。ボリュームは、イン
デックス作成したデータを保管するファイルシステム内のディレクトリを表します。詳細は、『インデクサーとク
ラスタの管理マニュアル』の「インデックスサイズの設定」を参照してください。
注意：バケツをホットからウォームに移行する時に、マーカーファイル corrupt.bloomOnly.maker が一時的に現れ
ます。このファイル名は紛らわしいですが、ブルームフィルタを破壊する訳ではありません。何も処する必要は
ありません。単に無視してください。
インデックスのバックアップとアーカイブ
インデックス作成されたデータのバックアップ
インデックスデータのバックアップ方法を決めるためには、まず Splunk によるデータの保管方法、および時間の
過によるデータの取り扱いの仕組みを理解しておくことが大切です。その後、バックアップ方法を決定します。
このトピックを参照する前に、「Splunk によるインデックスの保管方法」を参照してインデックス構造とその設
35
定オプションを理解するようにしてください。その時間がない方のために、次のセクションにはそのトピックの要
点が記載されています。
データの時間過
インデックス作成されたデータはバケツと呼ばれるサブディレクトリから構成されるデータベースディレクトリに
保管されます。各インデックスには、独自のデータベースセットが存在しています。
データは、時間が過するにつれて、さまざまな種類のバケツに移行します。時間の過に伴うデータの取り扱いに
ついては、indexes.conf の属性で設定します。indexes.conf の設定の詳細は、「インデックスストレージの設
定」を参照してください。
ここでは、Splunk インデックスでの、時間の過に伴うデータの取り扱いについて簡単に明しています。
1. 最初にデータのインデックスが作成されると、それはホットバケツに格納されます。設定によっては、複数のバ
ケツが同時に存在することもあります。ホットバケツは積極的に書き込まれるため、バックアップすることはでき
ません。ただし、スナップショットを取得することは可能です。
2. ホットバケツ内のデータは、ポリシーに設定されている条件をたすと「ウォーム」データに再分類されます。
これは、データのウォームバケツへの「移行」と呼ばれています。これは、ホットバケツが指定サイズまたは過
時間に達した場合、または splunkd が再起動された時に行われます。ホットバケツの移行が実施されると、ディレ
クトリ名が更されウォームバケツとなります。(手動でバケツをホットからウォームに移行することもできます。
詳細は以下を参照してください。)ウォームバケツのバックアップを行うこともできます。
3. インデックスが設定されている何らかの制限値に達した場合 (通常はウォームバケツ数)、もっとも古いバケツが
「コールド」バケツになります。バケツは colddb ディレクトリに移動されます。デフォルトのウォームバケツ数
は 300 です。
4. 最後に、定義されているポリシー要件に基づいて、バケツがコールドから「フローズン」に移行されます。
Splunk は、フローズンになったバケツを削除します。ただし、データを保持する必要がある場合は、バケツを削
除する前にデータをアーカイブすることができます。詳細は、「インデックスデータのアーカイブ」を参照してく
ださい。
インデックスやバケツのサイズまたはデータの過時間などの各種パラメータを利用して、リタイアおよびアーカ
イブポリシーを設定することができます。
要約：
ホットバケツ - 現在書き込まれているバケツ、バックアップしないでください。
ウォームバケツ - ホットから移行されます、安全にバックアップできます。
コールドバケツ - ウォームから移行されます。バケツは別の場所に移動されます。
フローズンバケツ - これらのバケツは削除されますが、その前にアーカイブすることができます。
インデックスデータベースの場所は、indexes.conf に設定します。(デフォルトインデックスのデータベースの場
所の詳細については、後述しています。)また、ここにはホットバケツの最大サイズや過時間など、さまざまな属
性を指定することができます。
インデックスデータベースディレクトリの場所
デフォルトインデックス (defaultdb) のディレクトリ構造を以下に示します。
バケツ
タイプ
デフォルトの場所
メモ
ホット $SPLUNK_HOME/var/lib/splunk/defaultdb/db/*
複数のホットサブディレクトリが存在する場合
があります。各ホットバケツは独自のサブディ
レクトリを保有しています。サブディレクトリ
の命名規則を以下に示します。
hot_v1_<ID>
ウォー
$SPLUNK_HOME/var/lib/splunk/defaultdb/db/*
ム
各ウォームバケツ個別のサブディレクトリが存
在しています。これらの名前は、「ウォーム/
コールドバケツの命名規則」の明に従って付け
られます。
複数のコールドサブディレクトリが存在してい
ます。ウォームバケツがコールドに移行される
と、データはこのディレクトリに移動されます
36
が名前は更されません。
コール
$SPLUNK_HOME/var/lib/splunk/defaultdb/colddb/*
ド
注意：クラスタ内で、バケツの複製されたコ
ピーはすべて colddb ディレクトリに保管されま
す。ホット、ウォーム、またはコールドかどう
かは関係ありません。ただし、元のクラスタバ
ケツのコピーは、この表に記載されているディ
レクトリ内の標準の場所に保管されます。
フロー N/A：フローズンデータは、削除されるかまたは指定
ズン
ディレクトリにアーカイブされます。
デフォルトでは削除されます。代わりにデータ
をアーカイブする方法については、「インデッ
クスデータのアーカイブ」を参照してくださ
い。
解凍
アーカイブされて、後ほど解凍されたデータの
場所。アーカイブされたデータの解凍状態への
復元については、「アーカイブされたデータの
復元」を参照してください。
$SPLUNK_HOME/var/lib/splunk/defaultdb/thaweddb/*
ホット/ウォーム、およびコールドディレクトリへのパスは更することができます。たとえば、コールドバケツを
ホット/ウォームバケツとは個別の場所に保管することができます。「インデックスストレージの設定」および
「インデックスデータへの複数パーティションの使用」を参照してください。
重要：すべてのインデックス保管場所は書き込み可能でなければなりません。
バックアップ方針の選
基本的には討する必要がある 2 種類のバックアップシナリオが存在しています。
続的な、ウォームデータの分バックアップ。
すべてのデータのバックアップ (たとえば、Splunk のアップグレード前)
実際のバックアップ実行方法は、ご自分の組織で利用しているツールや手順によって異なりますが、ここでは必要
な作業に関するガイドラインを提供しています。
分バックアップ
一般的には、適切な分バックアップユーティリリティを使って、新しいウォームバケツを定期的にバックアップ
するようにスケジュールすることをお勧めします。バケツが頻繁に移行されるような環境では、バックアップされ
る前にコールドバケツに移行されたデータを見逃さないように、コールドデータベースのディレクトリもバック
アップ象にする必要があります。ウォームからコールドに移行する際に、バケツディレクトリ名は更されないた
め、単に名前でフィルタリングすることができます。
ホットバケツもバックアップする場合は、VSS (Windows/NTFS) や ZFS (ZFS) などのツール、またはその他のス
トレージサブシステムが提供するスナップショット機能を使って、ファイルのスナップショットを取得する必要が
あります。利用できるスナップショットツールがない場合は、手動でホットバケツをウォームバケツに移行して、
それをバックアップすることができます (後述)。ただし、一般的にこのような行為は、後述する理由によりお勧め
できません。
すべてのデータのバックアップ
Splunk をアップグレードする前には、すべてのデータをバックアップすることをお勧めします。これには、ホッ
ト、ウォーム、およびコールドバケツが含まれます。
この作業を行うためには、データのサイズやどのくらいの時間システムを停止できるかなどの条件にじて、さま
ざまな方法を利用できます。基本的なガイドラインを以下に示します。
データが少量の場合は、Splunk をシャットダウンして、データベースディレクトリのコピーを作成してか
ら、アップグレードを実施してください。
大量のデータがある場合は、アップグレード前にホットバケツのスナップショットを取得する方が良いかも
しれません。
どのような場合でも、ホットから移行されたウォームバケツの分バックアップを行っている場合は、この時点で
のみホットバケツをバックアップする必要があります。
ホットバケツのウォームへの手動移行
インデックスのバケツを手動でホットからウォームに移行するには、以下の CLI コマンドを使用しま
37
す。<index_name> には、移行するインデックス名を指定してください。
splunk _internal call /data/indexes/<index_name>/roll-hot-buckets a€“auth <admin_username>:<admin_password>
重要：強制的な移行はデータのサーチパフォーマンスを永久的に低下させるため、通常ホットバケツの手動移行は
お勧めできません。一般的には、バケツが大きいほどサーチを効率的に行えます。早期にバケツを移行すると、小
さくて非効率的なバケツを作成することになります。ホットデータをバックアップする必要がある場合は、スナッ
プショットの取得が推するバックアップ手法になります。
復元の推事項
致命的ではないディスク障害が発生した場合 (たとえば、一部のデータは残っているけれども Splunk を実行でき
ない場合) は、一部が壊れたデータストアの最上位から復元する代わりに、インデックスディレクトリを別の場所
に移動してバックアップから復元することをお勧めします。Splunk は起動時に必要にじてホットバケツを自動的
に作成し、インデックスの作成作業を再開します。監視象ファイルとディレクトリは、バックアップ時の場所で
取得されます。
インデックスのバックアップ方法
インデックス内のすべてのデータを日確実にバックアップするための手段については、Splunk ブログの「Index
backup strategy」を参照してください。
クラスタ化されたデータのバックアップ
クラスタにはすでにデータの冗長コピーが含まれていますが、クラスタのデータを他の場所にバックアップしたい
場合もあります (たとえば、障害策の一環としてサイト外にコピーを保持する場合)。
このためのもっとも簡単な方法は、このトピックの前半で明したように、非クラスタ化インデクサーのデータを
バックアップするのと同じ手段で、クラスタ内の個別の各ピアノードのデータをバックアップすることです。ただ
し、この方法ではバックアップデータが重複してしまいます。たとえば、複製データ保持数が 3 のクラスタがある
場合、そのクラスタは一連のピアノードのすべてのデータにして、3 つのコピーを保持します。このような環境で
個別の各ノードに保管されているデータをバックアップした場合、結果的に 3 つのデータコピーを含むバックアッ
プができてしまいます。1 台のノードのデータをバックアップするだけではこの問題を解決することはできませ
ん。そのノードにクラスタ内のすべてのデータが保管されている保証がないからです。
この問題を解決するには、クラスタ上の各バケツのコピーをそれぞれ 1 つ識別して、それらのコピーのみをバック
アップすることが考えられます。ただし、このような作業は複でとても手間がかかります。1 つの手段として、各
ピアのインデックスストレージを調べ、バケツ名に含まれているバケツ ID 値を使って、各バケツのコピーを 1 つ
のみ識別するスクリプトを作成することがげられます。バケツ ID は、すべてのバケツのコピーで同じになりま
す。バケツ ID の詳細は、「ウォーム/コールドバケツの命名規則」を参照してください。クラスタバックアップス
クリプトの設計時には、バケツの raw データのみをバックアップするのか、または raw データとインデックス
ファイルの両方をバックアップするのかも討する必要があります。後者の場合は、各バケツのサーチ可コピーも
識別するようにスクリプトを設計する必要があります。
クラスタバックアップは複なため、Splunk プロフェッショナルサービスに、クラスタ化データの単一のコピーを
バックアップするためのガイダンスを依頼することをお勧めします。サービスチームは、お客の環境のニーズに
合わせたソリューションの設計をお手伝いいたします。
リタイアおよびアーカイブポリシーの設定
データリタイアおよびアーカイブポリシーの設定は、インデックスのサイズまたはインデックス内のデータの過
期間で定義します。
Splunk は、インデックスデータをバケツと呼ばれるディレクトリに保管しています。バケツはリタイアするまで
に 4 種類の段階をます。インデックスデータが最終段階のフローズンになると、それがインデックスから削除さ
れます。フローズン状態のデータを削除する代わりに、アーカイブすることを設定できます。詳細は、「インデッ
クスデータのアーカイブ」を参照してください。
バケツの
ステージ
明
サーチ可？
ホット
新たにインデックスが作成されたデータを保管しています。書き込み可能。各イン
デックスにして 1 つまたは複数のホットバケツ。
はい
ウォーム
ホットから移行されたデータ。ウォームバケツは多数存在しています。
はい
38
コールド
ウォームから移行されたデータ。コールドバケツは多数存在しています。
はい
フローズ
ン
コールドから移行されたデータ。デフォルトでは、フローズンデータは削除されま
すが、アーカイブすることも可能です。アーカイブされたデータは、後ほど解凍す
ることができます。
いいえ
インデックスおよびバケツのサイズ、場所、および過時間は indexes.conf で設定、編集します。「インデックス
ストレージの設定」を参照してください。
警告：データのリタイアおよびアーカイブポリシーの設定を更した場合、Splunk は警告することなしに古いデー
タを削除できてしまいます。
コールドからフローズンへの移行動作の属性の設定
内の maxTotalDataSizeMB および frozenTimePeriodInSecs 属性は、バケツがコールドからフローズ
ンに移行する時期を決定します。これらの属性の詳細は、以降の明を参照してください。
indexes.conf
インデックスが大きくなりすぎた場合にデータをフローズンに移行： Set
maxTotalDataSizeMB
データをフローズンに移行してインデックスから削除する時期を、インデックスサイズで設定できます。インデッ
クスが指定サイズを超えた場合に、もっとも古いデータがフローズン状態に移行されます。
デフォルトのインデックス最大サイズは、500,000 MB です。最大サイズを更するには、indexes.conf 内の
maxTotalDataSizeMB 属性を編集します。たとえば、最大サイズとして 250,000 MB を指定します。
[main]
maxTotalDataSizeMB = 250000
重要：サイズはメガバイトで指定してください。
新しい設定を有効にするには、Splunk を再起動してください。処理象データの量によっては、Splunk が新しいポ
リシーに従ってインデックスのバケツの移行を開始するまでに少し時間がかかることがあります。その間、CPU
の使用率が高くなる可能性があります。
データが古くなった場合にフローズンに移行する： Set frozenTimePeriodInSecs
バケツのフローズンへの移行時期を、データの過時間で設定することができます。特定のバケツ内の最新のデー
タの過時間が設定された値に達すると、バケツ全体が移行されます。
データをフローズンに移行するまでの過時間を指定するには、indexes.conf 内の frozenTimePeriodInSecs 属性を
編集します。この属性は、データをフローズン状態に移行するまでの過秒数を指定します。デフォルトは
188697600 秒 (約 6 年) です。180 日 (15552000 秒) 以上過した古いイベントをインデックスから削除する設定例
を以下に示します。
[main]
frozenTimePeriodInSecs = 15552000
重要：時間は秒数で指定します。
新しい設定を有効にするには、Splunk を再起動してください。処理象データの量によっては、Splunk が新しいポ
リシーに従ってインデックスのバケツの移行を開始するまでに少し時間がかかることがあります。その間、CPU
の使用率が高くなる可能性があります。
データのアーカイブ
フローズンデータを削除する代わりにアーカイブする場合は、「インデックスデータのアーカイブ」の明に従っ
て Splunk にその旨を指示する必要があります。独自のアーカイブスクリプトを作成することも、Splunk にアーカ
イブ処理を行わせることも可能です。アーカイブしたデータは後ほど復元 (解凍) することができます。「アーカ
イブされたデータの復元」を参照してください。
その他のバケツ移行条件
あるステージから別のステージへのバケツの移行の契機となる条件は、他にもさまざま存在しています。一部の条
件は、データの削除やアーカイブにつながります。これらの条件はすべて設定可能です。「インデックスストレー
ジの設定」を参照してください。リタイアポリシーに影響するすべてのオプションを完全に理解するために、この
トピックおよび indexes.conf ファイルを参照してください。
39
たとえば、Splunk はバケツが最大サイズに達した場合にそのバケツを移行します。indexes.conf 内の
maxDataSize に小さな値を設定すると、バケツのサイズが小さくなるため、より頻繁に移行が行われるようになり
ます。ただし、少数の大きなバケツを使用する代わりに多数の小さなバケツを使用すると、サーチに時間がかかる
ことに注意してください。目的の結果を得るためには、色々と試して最適なバケツサイズを決定する必要がありま
す。
アーカイブポリシーのトラブルシューティング
ディスクスペースが足りなくなったからアーカイブポリシーを更したけれどもうまく
機能しない
ディスクスペースが足りなくなったため、より格なアーカイブポリシーに更した場合でも、新しいポリシーに
従ってイベントのアーカイブが開始されないことがあります。このような場合、処理を実行するための空きスペー
スが足りない可能性があります。まず最初に、処理を実行できるようにいくらかのスペースを確保してください。
Splunk を停止して、最高 5 GB ほどの空きディスクスペースを確保してから、もう一度 Splunk を起動してくださ
い。しばらくすると (実際にかかる時間は処理象データの量によって異なります)、バケツのアーカイブが開始さ
れたことを示す、splunkd.log 内の BucketMover に関する情報エントリが表示されるはずです。
インデックス作成されたデータのアーカイブ
時間の過に伴って (データがフローズン状態に移行する時点で)、データを自動的にアーカイブするように Splunk
を設定することができます。このためには、indexes.conf を設定します。
警告：デフォルトでは、フローズン状態に移行したデータはすべて削除されます。データは、フローズン状態に移
行した時点でインデックスから削除されます。データを保持しておきたい場合は、削除前にデータをアーカイブす
るように設定する必要があります。このためには、indexes.conf 内に coldToFrozenDir 属性を設定するか、また
は有効な coldToFrozenScript を指定します。
データストレージの詳細は、「Splunk によるインデックスの保管方法」を参照してください。indexes.conf の編
集方法については、「インデックスストレージの設定」を参照してください。
Splunk によるデータのアーカイブ方法
Splunk は、データリタイアポリシーに基づいて、インデックスから古いデータを取り除きます (「リタイアおよび
アーカイブポリシーの設定」を参照)。データは各種ステージを移動していきます。これらのステージは、ファイ
ルディレクトリの場所にしています。まずデータはホットデータベースに保管されます。このデータベース
は、$SPLUNK_HOME/var/lib/splunk/defaultdb/db/ 下のサブディレクトリ (バケツ) として存在しています。次
に、$SPLUNK_HOME/var/lib/splunk/defaultdb/db のサブディレクトリとして存在する、ウォームデータベースに
移行します。その後順次、データはコールドデータベース $SPLUNK_HOME/var/lib/splunk/defaultdb/colddb に移
行されます。
最後にデータは、フローズン状態になります。この処理はさまざまな条件にじて発生します (「リタイアおよび
アーカイブポリシーの設定」を参照)。この時点で、Splunk はデータをインデックスから消去します。フローズン
データをインデックスから消去する前にアーカイブする場合は、その旨を設定する必要があります。アーカイブ処
理には、2 種類の方法を選できます。
Splunk にアーカイブを自動実行させる。
実行するアーカイブスクリプトを指定する。
アーカイブ動作は、これらの indexes.conf 属性の設定内容によって異なります。
coldToFrozenDir：この属性は、Splunk
がフローズンデータを自動的にアーカイブする場所を示します。
coldToFrozenScript：この属性は、データをフローズンにする際に実行するユーザースクリプトを示しま
す。これは一般的に、フローズンデータをアーカイブするスクリプトになります。スクリプトは、他の目的
に利用することも可能です。Splunk には、サンプルのアーカイブスクリプトが 1 つ同梱されており
($SPLUNK_HOME/bin/coldToFrozenExample.py)、これを利用、編集することができます。また、その他任意の
スクリプトを指定することも可能です。
注意：これらの属性の中の 1 つのみを指定できます。両方の属性を設定した場合、coldToFrozenDir 属性の設定が
coldToFrozenScript の設定に優先されます。
どちらの属性も指定しない場合は、消去するバケツ名を単にログファイル
$SPLUNK_HOME/var/log/splunk/splunkd_stdout.log に書き込むデフォルトスクリプトが実行されます。その後バ
ケツが消去されます。
Splunk にデータをアーカイブさせる
40
に coldToFrozenDir 属性を設定した場合、Splunk はインデックスからデータを消去する前に、自動
的にフローズンバケツを指定場所にコピーします。
indexes.conf
$SPLUNK_HOME/etc/system/local/indexes.conf
に以下のスタンザを追加します。
[<index>]
coldToFrozenDir = "<path to frozen archive>"
以下の事項に注意してください。
<index>
は、アーカイブするデータが存在するインデックスを示します。
は、Splunk がアーカイブしたバケツを保管するディレクトリを示します。
<path to frozen archive>
注意：Splunk Web を使って新しいインデックスを作成する際に、そのインデックスのフローズンアーカイブのパ
スを指定することもできます。詳細は、「複数インデックスの設定」を参照してください。
Splunk によるフローズンデータのアーカイブ方法は、当初 4.2 より前の Splunk でデータのインデックスが作成さ
れたのかどうかによって異なります。
バージョン 4.2 以降で作成されたバケツの場合、raw データファイルを除くすべてのファイルが削除されま
す。
4.2 より前のバージョンで作成されたバケツの場合、単にバケツ内のすべての .tsidx および .data ファイル
が gzip されます。
この差異は、raw データの形式の更によるものです。4.2 以降では Splunk がインデックスバケツを再構築するた
めに必要なすべての情報が raw データファイルに含まれています。
バケツの解凍 (復元) 方法の詳細は、「アーカイブされたインデックスデータの復元」を参照してください。
アーカイブスクリプトの指定
に coldToFrozenScript 属性を設定した場合、インデックスからフローズンデータを消去する前に、
指定したスクリプトが実行されます。
indexes.conf
実際のスクリプトを指定する必要があります。一般的にはデータをアーカイブするスクリプトを指定しますが、任
意のアクションを実行するスクリプトを指定できます。
$SPLUNK_HOME/etc/system/local/indexes.conf
に以下のスタンザを追加します。
[<index>]
coldToFrozenScript = ["<path to program that runs script>"] "<path to script>"
以下の事項に注意してください。
は、アーカイブするデータが存在するインデックスを示します。
には、アーカイブスクリプトへのパスを指定します。スクリプトは、$SPLUNK_HOME/bin ま
たはそのサブディレクトリに保管する必要があります。
<path to program that runs script> の指定はオプションです。スクリプトの実行に Python などのプログ
ラムが必要な場合に、これを設定します。
スクリプトを $SPLUNK_HOME/bin に保管しており、名前が myColdToFrozen.py の場合は、以下のように属性を
設定します。
<index>
<path to script>
coldToFrozenScript = "$SPLUNK_HOME/bin/python" "$SPLUNK_HOME/bin/myColdToFrozen.py"
Splunk には、アーカイブスクリプトの例 $SPLUNK_HOME/bin/coldToFrozenExample.py が用意されています。これ
を編集することも可能です。
注意：サンプルスクリプトを使用する場合、ご自分の環境に合わせてアーカイブの場所を更してください。ま
た、Splunk のアップグレード時に更したファイルが上書きされないように、編集したスクリプトの名前を更する
か、または別の場所に移動してください。これはあくまでもサンプルのスクリプトなので、ご利用の環境に合わせ
て編集した後、正常に動作することを確認しない限り、実際の生産環境には適用しないでください。
このサンプルスクリプトは、当初のデータのインデックスが 4.2 より前のバージョンの Splunk で作成されたかど
うかによって、異なる動作を行います。
バージョン 4.2 以降で作成されたバケツの場合、raw データファイルを除くすべてのファイルが削除されま
す。
4.2 より前のバージョンで作成されたバケツの場合は、単にすべての .tsidx および .data ファイルが gzip さ
れます。
41
この差異は、raw データの形式の更によるものです。4.2 以降では Splunk がインデックスバケツを再構築するた
めに必要なすべての情報が raw データファイルに含まれています。
バケツの解凍 (復元) 方法の詳細は、「アーカイブされたインデックスデータの復元」を参照してください。
ベストプラクティスとして、Splunk が完了待ち状態で待機することがないように、スクリプトはできる限り早く
処理を完了するようにしてください。たとえば、低速なボリュームへアーカイブするような場合は、まずインデッ
クスと同じ (高速な) ボリューム内の一時ディレクトリにバケツをコピーするようにスクリプトを設定します。そ
の後 Splunk 外で別個のスクリプトを使って、そのバケツを一時ディレクトリから低速なボリューム上の目的の
ディレクトリに移動します。
アーカイブへの署名
Splunk では、アーカイブに署名することができます。この機能を利用することで、アーカイブの復元時に整合性
を証することができます。
注意：アーカイブの署名を使用する場合、独自のアーカイブスクリプトを指定する必要があります。Splunk に自
動的にアーカイブ処理を行わせる場合は、アーカイブの署名を実行することはできません。
クラスタ化データのアーカイブ
クラスタには、インデックスデータの冗長コピーが保管されています。前述の方法を使ってこのようなデータを
アーカイブする場合、複数のデータコピーをアーカイブすることになります。
たとえば、複製データ保持数が 3 のクラスタがある場合、そのクラスタは一連のピアノードのすべてのデータに
して、3 つのコピーを保持します。各ピアノードにしてフローズン移行時に自己のデータをアーカイブするように
設定した場合、3 つのアーカイブされたデータのコピーができてしまいます。1 台のノードのデータをアーカイブ
するだけではこの問題を解決することはできません。そのノードにクラスタ内のすべてのデータが保管されている
保証がないからです。
クラスタ上の各バケツのコピーを 1 つのみアーカイブして、残りを破棄すればこの問題は解決します。ただし、こ
のような作業は複でとても手間がかかります。クラスタ化データの単一コピーをアーカイブするためのガイダン
スが必要な場合は、Splunk プロフェッショナルサービスまでお問い合わせください。サービスチームは、お客の
環境のニーズに合わせたソリューションの設計をお手伝いいたします。
アーカイブ先の指定
クラスタ化データの複数コピーをアーカイブすることを選した場合は、名前の競合が発生しないように注意する
必要があります。すべてのピアノードからのデータを単一のアーカイブディレクトリに送ることはできません。ク
ラスタ内には同じ名前を持つバケツのコピーが複数存在しており、ディレクトリの内容には一意の名前を付ける必
要があります。代わりに、各ピアノードからのバケツを個別のアーカイブディレクトリに送る必要がありま
す。indexes.conf 内の coldToFrozenDir 属性を使って共有ストレージ内の宛先ディレクトリを指定した場合、こ
のような処理は困難です。「ピアインデックスの設定」で明しているように、indexes.conf ファイルはすべての
ピアノード上で同一でなければなりません。その代わりに、各ピアのアーカイブバケツを共有ストレージ上の個別
の場所に保管するスクリプトを作成し、coldToFrozenScript 属性を使ってそのスクリプトを指定することができ
ます。
アーカイブされたインデックスデータの復元
アーカイブされたデータを復元するには、アーカイブされているバケツを解凍用ディレクトリ
(例：$SPLUNK_HOME/var/lib/splunk/defaultdb/thaweddb) に移動して、次にこのトピックの後半で明する手順に
従って処理を行います。thaweddb 内のデータには、サーバーのインデックス過時間スキーマ (ホット > ウォーム>
コールド > フローズン) は適用されません。アーカイブデータは、解凍用ディレクトリに必要なだけ保管しておく
ことができます。データが不要になったら、それを削除するかまたは別のディレクトリに移動してください。
重要：アーカイブデータの復元は、そのインデックスが Splunk 4.2 以降で作成されたかどうかによって作業内容
が異なります。これは、4.2 まで raw データの形式が更されたためです。
データのアーカイブ方法については、「インデックスデータのアーカイブ」を参照してください。また、解凍した
データを再びアーカイブする場合についても、そのトピックを参照してください。
アーカイブを別の Splunk インスタンスに復元する場合の制限事項
たいていの場合、アーカイブは当初インデックスを作成した Splunk インスタンスだけではなく、任意の Splunk
インスタンスに復元することができます。ただし、これにはいくつかの要素が影響してきます。
42
Splunk バージョン：Splunk 4.2 以降で作成されたバケツを、4.2 より前の Splunk インスタンスに復元する
ことはできません。4.1 と 4.2 ではバケツのデータ形式が更されています。4.2 より前の Splunk インスタン
スは、新しい形式を理解することはできません。つまり、以下のようになります。
4.2 以降のバケツ：4.2 以降のバケツは、任意の 4.2 以降のインスタンスに復元できます。
4.2 より前のバケツ：4.2 より前のバケツは、任意の Splunk インスタンス (4.2 以前および 4.2 以降) に
復元できます。ただし、後述するように、いくつかの OS に関連する問題があります。
OS のバージョン：通常は、異なる OS 上で動作する Splunk インスタンスにバケツを復元することができま
す。概要を以下に示します。
4.2 以降のバケツ：4.2 以降のバケツは、任意の OS 上で動作する Splunk インスタンスに復元できま
す。
4.2 より前のバケツ：4.2 より前のバケツは、任意の OS 上で動作する Splunk インスタンスに復元でき
ますが、異なるエンディアンを持つシステムに 4.2 より前のデータを復元することはできません。たと
えば、64 ビットシステム上で生成されたデータは 32 ビットシステムでは正常に機能せず、PowerPC
または SPARC システムから x86 または x86-64 システム、またはその逆方向にデータを移動すること
はできません。
また、アーカイブされているバケツを復元する際には、インデックスと競合するバケツ ID を導入しないようにし
てください。この問題については後述します。
アーカイブバケツに 4.2 以降のデータが含まれているかどうかの判
断
アーカイブバケツを解凍する前に、アーカイブバケツが 4.2 より前かまたは 4.2 以降かを識別する必要がありま
す。ここでは、coldToFrozenDir または用意されているサンプルスクリプトを使ってアーカイブされたバケツを前
提に、これらの違いについて明していきます。
4.2 以降のバケツ：バケツディレクトリには、raw データディレクトリ journal.gz のみが含まれています。
4.2 より前のバケツ：バケツディレクトリには、.tsidx および .data ファイルの gzip、および <int>.gz と言
う名前の付けられたファイルを含む raw データディレクトリが含まれています。
重要：独自のスクリプトを使ってデータをアーカイブした場合、結果となるバケツには内容にじて任意のファイ
ルが含まれます。
または用意されているサンプルスクリプトを使ってバケツをアーカイブした場合は、以下の手順
に従ってそれを解凍することができます。
coldToFrozenDir
4.2 以降のアーカイブの解凍
*nix ユーザー
4.2 以降のアーカイブバケツを解凍用ディレクトリに復元する例を以下に示します。
1. アーカイブバケツを解凍用ディレクトリの一時ディレクトリにコピーします。
# cp -r db_1181756465_1162600547_0
$SPLUNK_HOME/var/lib/splunk/defaultdb/thaweddb/temp_db_1181756465_1162600547_0
2. 一時ディレクトリで rebuild コマンドを実行し、Splunk インデックスと関連ファイルを再構築します。
# splunk rebuild $SPLUNK_HOME/var/lib/splunk/defaultdb/thaweddb/temp_db_1181756465_1162600547_0
3. この一時バケツを Splunk が認識できる名前に更します。
# cd $SPLUNK_HOME/var/lib/splunk/defaultdb/thaweddb/
# mv temp_db_1181756465_1162600547_0 db_1181756465_1162600547_1001
注意：インデックス内の他のバケツと競合しないバケツ ID を指定する必要があります。この例では、インデック
ス内でバケツ ID 1001 が一意であることを前提にしています。そうでない場合は、他の競合していないバケツ ID
を選してください。
4. Splunk を再起動します。
# splunk restart
Windows ユーザー
43
4.2 以降のアーカイブバケツを解凍用ディレクトリに復元する例を以下に示します。
1. アーカイブバケツを復元用ディレクトリにコピーします。
> xcopy D:\MyArchive\db_1181756465_1162600547_0 %SPLUNK_HOME%\var\lib\splunk\defaultdb\thaweddb\temp_db_1181756465_1162600547
2. 一時ディレクトリで rebuild コマンドを実行し、Splunk インデックスと関連ファイルを再構築します。
> splunk rebuild %SPLUNK_HOME%\var\lib\splunk\defaultdb\thaweddb\temp_db_1181756465_1162600547_0
3. この一時バケツを Splunk が認識できる名前に更します。
> cd %SPLUNK_HOME%\var\lib\splunk\defaultdb\thaweddb
> move temp_db_1181756465_1162600547_0 db_1181756465_1162600547_1001
注意：インデックス内の他のバケツと競合しないバケツ ID を指定する必要があります。この例では、インデック
ス内でバケツ ID 1001 が一意であることを前提にしています。そうでない場合は、他の競合していないバケツ ID
を選してください。
4. Splunk を再起動します。%SPLUNK_HOME%\bin に移動して、以下のコマンドを実行します。
> splunk restart
4.2 より前のアーカイブの解凍
*nix ユーザー
4.2 より前のアーカイブバケツを復元用ディレクトリに復元する例を以下に示します。
1. アーカイブバケツを解凍用ディレクトリの一時ディレクトリにコピーします。
# cp -r db_1181756465_1162600547_0
$SPLUNK_HOME/var/lib/splunk/defaultdb/thaweddb/temp_db_1181756465_1162600547_0
2. バケツのアーカイブ時に縮されている場合は、それを解凍します。
3. この一時バケツを Splunk が認識できる名前に更します。
# cd $SPLUNK_HOME/var/lib/splunk/defaultdb/thaweddb/
# mv temp_db_1181756465_1162600547_0 db_1181756465_1162600547_1001
注意：インデックス内の他のバケツと競合しないバケツ ID を指定する必要があります。この例では、インデック
ス内でバケツ ID 1001 が一意であることを前提にしています。そうでない場合は、他の競合していないバケツ ID
を選してください。
4. マニフェストを更新します。
# cd $SPLUNK_HOME/bin
# ./splunk login
# ./splunk _internal call /data/indexes/main/rebuild-metadata-and-manifests
しばらくすると、復元したバケツが再びサーチ可になります。
Windows ユーザー
4.2 より前のアーカイブバケツを復元用ディレクトリに復元する例を以下に示します。
1. アーカイブバケツを復元用ディレクトリにコピーします。
> xcopy D:\MyArchive\db_1181756465_1162600547_0 %SPLUNK_HOME%\var\lib\splunk\defaultdb\thaweddb\temp_db_1181756465_1162600547
2. バケツのアーカイブ時に縮されている場合は、それを解凍します。
3. この一時バケツを Splunk が認識できる名前に更します。
> cd %SPLUNK_HOME%\var\lib\splunk\defaultdb\thaweddb
> move temp_db_1181756465_1162600547_0 db_1181756465_1162600547_1001
44
注意：インデックス内の他のバケツと競合しないバケツ ID を指定する必要があります。この例では、インデック
ス内でバケツ ID 1001 が一意であることを前提にしています。そうでない場合は、他の競合していないバケツ ID
を選してください。
4. マニフェストを更新します。
> cd %SPLUNK_HOME%\bin
> splunk login
> splunk _internal call /data/indexes/main/rebuild-metadata-and-manifests
しばらくすると、復元したバケツが再びサーチ可になります。
クラスタ化データの復元
アーカイブされたクラスタ化データの個別のピアノードへの復元は、個別のインデクサーへのデータの復元と同じ
方法で行えます。ただし、「インデックスデータのアーカイブ」で明しているように、クラスタ化データの単一
のコピーをアーカイブすることは困難です。代わりにクラスタ内のすべてのピアノードのデータをアーカイブした
場合は、後ほどそのデータを復元し、それを元のピアノードの復元用ディレクトリに保管することができます。ク
ラスタ上の復元したデータには、複製データ保持数のコピーが含まれます。
注意：復元用ディレクトリのデータは複製されません。何らかの方法でデータの単一のコピーをアーカイブして、
それを後ほど復元した場合、クラスタ内にはピアノードの復元用ディレクトリに保管した単一のデータコピーのみ
が存在することになります。
クラスタとインデックスレプリケーションの概要
クラスタとインデックスレプリケーションについ
て
クラスタは、相互のデータを複製するように設定された Splunk インデクサーのグループです。このプロセス
は、インデックスレプリケーションとして知られています。クラスタは Splunk データの複数の同一コピーを保持
することにより、データ消失を防止しながら、サーチ用データの可用性を向上します。
Splunk のクラスタ機能では、あるインデクサーから別のインデクサーに自動フェイルオーバーを行います。つま
り、1 つまたは複数のインデクサーに障害が発生した場合でも、引き続き到着データのインデックスが作成され、
サーチが可能になります。
インデックスレプリケーションの主な利点を以下に示します。
データ可用性：インデクサーは常に到着データを処理でき、インデックスが作成されたはサーチ可となりま
す。
データ忠実度：データが失われることはありません。Splunk に送信されたデータは、Splunk に保管された
データと完全に同一で、サーチに利用することができます。
データ復元：インデクサーがダウンしても、データが失われることなく、引き続きデータを利用できます。
改善されたサーチパフォーマンス：データを複数のインデクサーに配布することにより、サーチ時に複数の
インデクサーで並列的にバケツを読み取ることができ、各インデクサーの I/O 負荷を減らすことができま
す。
インデックスレプリケーションの主なトレードオフとしては、データ可用性/復元とストレージコスト (およびわず
かな処理負荷の加) の兼ね合いがげられます。クラスタのデータ復元可能性は、クラスタ内で保持するデータコ
ピー数に比例します。ただし、データコピーの保持数が多いと、ストレージ要件も高くなります。このトレードオ
フを管理して企業ニーズをたすために、クラスタに保持するデータコピー数を設定することができます。これ
は、「複製データ保持数」と呼ばれています。
また、インデックスレプリケーションが必要ではない状況でも、クラスタを使ってインデックス容量/能力を強す
ることができます。「クラスタを使ったインデックスの強」を参照してください。
クラスタの内容
クラスタは、連携して冗長インデックス作成およびサーチ機能を提供する、Splunk ノードのグループです。クラ
スタ内には 3 種類のノードが存在しています。
クラスタを管理する単一のマスターノード。
複数のデータコピーのインデックス作成と保持、およびデータのサーチを処理する複数のピアノード。
一連のピアノードにまたがってサーチを調整、管理する 1 つまたは複数のサーチヘッド。
45
マスターノードはクラスタを管理しています。ピアノードの複製アクティビティを調整し、サーチヘッドにデータ
の索場所を指示します。また、ピアノードの設定を管理し、またピアノード停止時の復旧処置を担当します。
ピアノードは、単独のインデクサーと同に、データを受け取って、インデックスを作成します。ただし、スタン
ドアロンのインデクサーとは異なり、ピアノードはクラスタ内の他のノードからのデータも複製します。ピアノー
ドは到着データのインデックスを作成しながら、同時に他のノードからの複製データを保管します。最低でも、複
製データ保持数と同じ数のピアノードが必要です。複製データ保持数が 3 の場合、最低 3 台のピアノードが必要
になります。
サーチヘッドは、一連のピアノードにまたがってサーチを行います。ピアノードにまたがるサーチを管理するため
に、サーチヘッドを使用する必要があります。サーチヘッドは、残りのクラスタ構成部と同時に有効にする必要が
あります。
一般的には、クラスタにデータを取り込むためにフォワーダーを使用することをお勧めします。
基本的なクラスタの概要を以下に示します。このクラスタには 3 台のピアノードが存在し、複製データ保持数は 3
となっています。
これは単純なデプロイ例で、小規模な非クラスタデプロイと似ています。一部のフォワードーがロードバランシン
グデータをインデクサー (ピアノード) グループに送信し、インデクサーがサーチヘッドにサーチ結果を送信しま
す。ただし、クラスタ環境は非クラスタデプロイ環境とは 2 つの点で異なっています。
インデクサーはデータのコピーを他のインデクサーに転送します。
マスターノードはデータ転送を行いませんが、サーチピアおよびサーチヘッドが関与しているさまざまなア
クティビティを管理、調整します。
クラスタの設定方法
クラスタの設定は簡単です。作業内容は、スタンドアロンのインデクサーグループを設定する場合と似ています。
基本的には、インデクサーをインストールして、いくつかの設定を行います。
主な違いとしては、クラスタノードを指定して、有効化する必要があることがげられます。1 つのインデクサーを
マスターノードとして、その他のインデクサーをピアノードとして指定します。ピアノード数は、最低でも複製
データ保持数と同じ台数が必要になります。水平スケーリングのためにインデックス能力を強する場合は、単に
ピアノードを追加していきます。
ピア間にまたがるサーチを管理して、それをまとめた結果をユーザーに返すために、サーチヘッドも設定する必要
があります。
ノードとサーチヘッドを有効にするには、Splunk 内で任意の設定を行う場合と同に、Splunk 管理、CLI、または
設定ファイルを編集することで行います。
46
詳細は、このマニュアルの「クラスタのデプロイ」を参照してください。
クラスタのサーチ方法
クラスタのサーチは、クラスタ化されていない一連のインデクサーグループをサーチするのと同じ方法で行いま
す。サーチはサーチヘッド由で実行します。
ただし、その裏側で行われる処理は少し異なっています。サーチを実行すると、サーチヘッドはマスターノードに
問い合わせて、処理象のデータを保有するピアノードを判断します。次に、サーチヘッドはサーチタスクをそれ
らのノードに配布します。各ノードは各自の担当タスクを処理して、結果をサーチヘッドに返します。サーチヘッ
ドは、結果を統合して Splunk 管理に返します。ユーザーの点からは、スタンドアロンのインデクサーまたはクラ
スタ化されていないインデクサーグループにしてサーチを実行する場合と、何らわりはありません。
先に進む前に
クラスタの設定と使用は簡単ですが、まず Splunk のインデックス作成とデプロイの基本を正しく理解しておく必
要があります。続行する前に、以下の事項を正しく理解するようにしてください。
インデクサーの設定方法：「Splunk によるインデックスの格納方法」およびこのマニュアルに記載されてい
るその他のインデックス管理に関するトピックを参照してください。
サーチヘッドの処理：分散サーチの詳細は、『Distributed Deployment manual』の「About distributed
search」を参照してください。
インデクサーにデータを取り込むためのフォワーダーの使用方法：『Getting Data In Manual』の「Use
forwarders」を参照してください。
非クラスタ Splunk デプロイ環境から移行しますか？
クラスタ構成のインデクサーは、クラスタ構成ではない Splunk インデクサーとは要件が異なっています。インデ
クサーを移行する前に、それらの事項を理解しておく必要があります。詳細は、「クラスタ構成と非クラスタ構成
の Splunk デプロイの主な相違点」を参照してください。それを参照した後は、「非クラスタインデクサーのクラ
スタ化環境への移行」に進んで実際の移行プロセスの詳細を確認してください。
基本的なクラスタのアーキテクチャ
ここでは、クラスタのアーキテクチャについて紹介していきます。クラスタの各コンポーネント、およびそれらが
連携する方法について明します。また、基本的な概念やクラスタにおけるインデックス作成/サーチの処理につい
ても明していきます。
クラスタのアーキテクチャの詳細については、「クラスタの仕組み」を参照してください。
クラスタのコンポーネント
クラスタには、3 種類の Splunk コンポーネントが含まれています。
クラスタを管理する単一のマスターノード。
データのインデックス作成、複製、およびサーチを実行する複数のピアノード。
すべてのピアノードにまたがってサーチを調整、管理する 1 つまたは複数のサーチヘッド。
また、一般的にクラスタデプロイ環境では、フォワーダーを使ってデータを取り込み、それをピアに転送します。
マスターノード、ピアノード、およびサーチヘッドはすべて、Splunk インデクサーの特殊なタイプです。
単純なクラスタの例を以下に示します。このクラスタには数台のピアと、それにデータを送信するフォワーダーが
存在しています。
47
この図で示されている処理のいくつかは、まだ明されていません。どうぞ読み進めてください。
マスターノード
マスターノードはクラスタを管理しています。ピアノードの複製アクティビティを調整し、サーチヘッドにデータ
の索場所を指示します。また、ピアノードの設定を管理し、またピアノードがオフライン時の復旧処置を担当し
ます。
ピアノードとは違い、マスターノードは外部データのインデックスを作成しません。クラスタには、マスターノー
ドが 1 つのみ存在しています。
重要：マスターノードは、ピアノードやサーチヘッドのように複数の作業を同時に兼務することはできません。ま
た、ピアノードやサーチヘッドと同じマシン上に存在することはできません。
ピアノード
ピアノードは、クラスタのインデックス作成機能を担当します。これらのノードはデータを受信し、インデックス
を作成します。また、クラスタ内の他のピアノードと複製データを相互に送受信します。ピアノードは、自己の
データのインデックスを作成しながら、同時に複製されたデータを送受信できます。すべてのインデクサーと同
に、ピアもサーチヘッドからのサーチ要求にして、各自のインデックスデータにするサーチを実行します。
デプロイするピアノード数は、クラスタの複製データ保持数とインデックス作成負荷の 2 つの要素によって決まり
ます。たとえば、複製データ保持数が 3 の場合 (データのコピーを 3 つ保持する)、最低 3 台のピアが必要です。3
台のインデクサーで処しきれないインデックス作成負荷がある場合は、処理能力を向上するためにピアを追加す
る必要があります。
サーチヘッド
サーチヘッドは、一連のピアノードにまたがってサーチを管理します。これは、サーチクエリーをピアに配布し、
また返された結果を統合します。すべてのサーチはサーチヘッドから行います。クラスタには最低 1 台のサーチ
ヘッドが必要です。
フォワーダー
フォワーダーは、どのような Splunk デプロイ環境でも同じように機能します。フォワーダーは外部ソースから
データを取り込んで、それをインデクサー (クラスタの場合はピアノード) に転送します。クラスタへのデータの
取り込みにフォワーダーを使用する必要はありませんが、たいていの場合は利用した方が便利です。インデクサー
答確認機能はフォワーダーでのみ有効にでき、これによって取り込んだデータのインデックスが確実かつ高信頼
に作成されます。また、ピアノード障害に処する点からも、ロードバランシングフォワーダーを使用することを
お勧めします。そうすることで、あるピアが停止しても、フォワーダーはロードバランシンググループ内の他のピ
48
アに転送先を切り替えることができます。クラスタ環境におけるフォワーダーの詳細は、このマニュアルの「フォ
ワーダーを使ったデータの取り込み」を参照してください。
重要な概念
クラスタの機能を理解するためには、いくつかの概念に慣れ親しんでおく必要があります。
複製データ保持数：クラスタが保持するデータコピー数で、クラスタの障害耐性のレベルを表しています。
サーチ可能データ保持数：クラスタが保持するデータのサーチ可コピー数で、クラスタであるノードが停止
した時にどれだけ素早くサーチ能力を回復できるかを表しています。
バケツ：バケツはインデックスストレージの基本単位です。クラスタは、複製データ保持数に相当する各バ
ケツのコピーを保持しています。
ここでは、これらの概念を簡単に紹介していきます。
複製データ保持数
マスター設定の一環として、クラスタに保持するデータのコピー数を指定します。このコピー数は、クラスタの複
製データ保持数と呼ばれています。複製データ保持数は、インデックスレプリケーションの主要概念です。この値
により、クラスタの障害耐性が決まります。クラスタは、「複製データ保持数 - 1」台のピアノード障害に処する
ことができます。たとえば、システムで 2 台までのピア障害発生に処できるようにするためには、複製データ保
持数に 3 を設定する必要があります。この場合、クラスタは 3 つの同一のデータコピーを、別個のノードに保管
します。この場合、2 台のピアが停止しても、3 台目のピアのデータを利用することができます。
3 台のピアで複製データ保持数が 3 のクラスタの例を以下に示します。
この図では、1 台のピアがフォワーダーからデータを受信、処理して、それを他の 2 台のピアに転送しています。
クラスタには、ピアのデータの完全なコピーが 3 つ存在しています。この図では、すべてのデータが単一のピアを
通じてシステムに到着するように、複製を大幅に簡素化して表しています。たいていの 3 台ピアのクラスタでは、
3 台のピアすべてがフォワーダーから外部データを受信し、また他のピアからの複製データも受信します。
複製データ保持数および値の調整に関係するトレードオフについては、「複製データ保持数」を参照してくださ
い。
サーチ可能データ保持数
マスターを設定する際には、サーチ可能データ保持数も指定します。サーチ可能データ保持数は、クラスタが保持
するデータのサーチ可コピー数を表しています。
データのサーチ可コピーは、サーチ不可コピーよりも大きなストレージスペースを必要とします。そのため、ニー
ズにじた適切なサーチ可能データ保持数を設定する必要があります。たいていの場合は、サーチ可能データ保持
数はデフォルト値の 2 のままで使用してください。この場合、クラスタ内で 1 台のピアノードが停止しても、わ
ずかな中断でサーチを続することができます。
サーチ可コピーとサーチ不可コピーには、一部のデータに違いがあります。サーチ可コピーには、データ自身と
Splunk がデータのサーチに使用するインデックスファイルが含まれています。サーチ不可コピーには、データの
みが含まれています。サーチ不可コピーに含まれているデータにも初期処理が行われており、必要にじてイン
デックスファイルを作成できる形式で保管されています。
サーチ可能データ保持数および値の調整に関係するトレードオフについては、「サーチ可能データ保持数」を参照
してください。
バケツ
Splunk はインデックスデータをバケツに保管します。バケツは、データファイルを保管するディレクトリです。
一般的にインデックスは多数のバケツから構成されています。
完全クラスタは、複製データ保持数の値だけ各バケツのコピーを保持しており、各コピーは別個のノードに保管さ
49
完全クラスタは、複製データ保持数の値だけ各バケツのコピーを保持しており、各コピーは別個のノードに保管さ
れています。バケツのコピーは、サーチ可またはサーチ不可になります。完全クラスタには、サーチ可能データ保
持数の値だけの各バケツのサーチ可コピーも存在しています。
バケツには 2 種類のファイルが保管されています。raw データファイルには、データといくつかのメタデータが含
まれています。バケツのサーチ可コピーの場合は、データのインデックスファイルが含まれています。
クラスタは、バケツ単位で複製されます。元のバケツと他のピアノード上のバケツのコピーには、同一の raw
データセットが含まれています。ただし、インデックスファイルはサーチ可バケツにのみ存在しています。
ピアは新しいバケツを作成すると、マスターと通信してそのバケツのデータを転送するピアのリストを取得しま
す。クラスタのピアノード数が複製データ保持数より大きい場合、ピアは新たなバケツの開始時に回異なるセッ
トのピアにデータを転送することがあります。複製データ保持数が 3 の場合でも、ピアのオリジナルバケツのコ
ピーは漸次その他のピアにがっていきます。
クラスタの構造を理解するためには、バケツを正しく理解する必要があります。バケツの概要については、
「Splunk によるインデックスの保管方法」を参照してください。次に、「バケツとクラスタ」を参照してくださ
い。ここには、クラスタデプロイ環境において重要なバケツの概念が、詳細に明されています。
インデックス作成の仕組み
クラスタのインデックス作成機能は、非クラスタのインデックス作成と似ていますが、クラスタが複数のデータコ
ピーを保管すると言う違いがあります。各ピアノードは、非クラスタインデクサーと同に、外部データを取り込
んで処理し、インデックスを作成します。主な違いとしては、ピアノードは処理したデータのコピーもクラスタ内
の他のピアに転送することがげられます。それらのコピーは、それら独自のバケツに格納されます。処理みデー
タを受信する一部のピアは、受信データにしてインデックスを作成する場合もあります。複製データ保持数は、
処理されたデータのコピーを受け取るピア数を決定します。サーチ可能データ保持数は、データのインデックスを
作成するピア数を決定します。
ピアノードは、外部データのインデックスを作成しながら、同時に他のピアから送信された複製データを保管し、
必要にじてインデックスを作成することができます。たとえば、複製データ保持数が 3 で、3 台のピアノードを
持つクラスタが存在している場合、各ピアは外部データを取り込み、インデックスを作成しながら、他のピアから
転送されたデータのコピーを保管することができます。クラスタのサーチ可能データ保持数が 2 の場合、転送され
たデータのコピーを受け取るもう一方のピアが、それのインデックスも作成します。(データを最初に取り込んだ
ピアは、常に自分が保持するデータのインデックスを作成します。)フォワーダーおよび他のピアからのデータの
移動を以下の図に示します。
注意：すべてのピアノードが外部データを取り込むようにクラスタを設定することができます。これがもっとも一
般的な設定です。これを行うには、単に各ピアノードの入力を設定します。ただし、ピアノードのサブセットのみ
がデータを取り込むようにクラスタを設定することもできます (現時点では、そうする理由はほとんどありません
が)。入力をどのようにクラスタにまたがって分散している場合でも、すべてのピアが複製データを保管できま
50
す。マスターは、複製データを受け取るピアノードを決定します。現在の所、これを設定することはできません。
ピアは外部データのインデックスを複製するだけでなく、各自の _audit や _internal などの内部インデックスも
複製します。
マスターは、ピア間のやり取りを管理します。特に、どのピアがそのデータを転送したかを各ピアに知らせます。
マスターがこれを知らせると、当該ピアノードが停止しない限り、ピアはマスターの関与なしに相互にデータを交
換します。マスターは、どのピアにサーチ可データが存在しているかも追跡しており、常にサーチ可能データ保持
数の値だけのサーチ可データのコピーが利用できることを保証しています。ピアが停止した場合は、マスターが復
旧作業を担当します。
詳細は、「クラスタ化されたインデックスの仕組み」を参照してください。
サーチの仕組み
クラスタ内で、サーチヘッドはすべてのサーチを担当します。このプロセスは、非クラスタ環境で、分散サーチが
機能する仕組みと似ています。主な違いは、サーチヘッドは、マスターを利用してサーチピアを示すことにありま
す。また、各バケツの 1 つのコピーにしてのみサーチが行われるようにするために、さまざまなプロセスが採用
されています。
各バケツのコピーを 1 つのみサーチに利用するために、クラスタ内の各バケツの 1 つのサーチ可コピーが「プラ
イマリ」として設定されます。サーチは、一連のプライマリコピーにしてのみ行われます。一連のプライマリコ
ピーは、時間の過とともに更される可能性があります (例：ピアノードのダウンに伴って)。停止したノード上の
一部のバケツのコピーがプライマリだった場合、それらのバケツの他のサーチ可コピーを代わりにプライマリにす
る必要があります。他のサーチ可コピーが存在しない場合 (クラスタのサーチ可能データ保持数が 1 のため) は、
まずサーチ不可コピーをサーチ可コピーに換しないと、プライマリコピーとして指定することはできません。
マスターはすべてのピアノード上のすべてのバケツのコピーを追跡しており、ピアノード自体も各自のバケツコ
ピーの状態を把握しています。このようにして、サーチリクエストにえて、ピアはどのバケツコピーをサーチす
れば良いのかを把握しています。
サーチヘッドは定期的にマスターから、アクティブなサーチピアのリストを取得します次にサーチヘッドはサーチ
を処理するために、分散サーチの場合と同じようにそれらのピアと直接通信し、サーチリクエストと複製バンドル
ピアに送信して、ピアから返されたサーチ結果をまとめます。
たとえば、3 つのピアが存在するクラスタで、サーチヘッドからの特定のサーチリクエストをたすために必要な
20 個のバケツを管理している場合を考えてみましょう。それら 20 個のバケツのプライマリコピーを、最初のピア
に 10 個、2 番目のピアに 6 個、3 番目のピアに 4 個配置することができます。各ピアがサーチリクエストを受け
取り、そのバケツのコピーがプライマリでサーチ処理を行うかどうかを判断します。
詳細は、「クラスタ化されたサーチの仕組み」を参照してください。
クラスタでのノード障害の取り扱い
ピアノードが停止した場合、マスターはそのピアのバケツを他のピア上に復元しようと試みます。たとえば、停止
したノードに 20 個のバケツコピーが保管されており、その中の 10 個がサーチ可の場合 (3 つのプライマリバケツ
のコピーを含む)、マスターはそれらの 20 個のバケツのコピーを他のノードに保管しようと試みます。また、10
個のサーチ可コピーを他のノード上の同じバケツのサーチ可コピーで置換します。
複製データ保持数に指定された値よりも残りノード数が少なくなった場合、クラスタは失われた 20 個のコピーを
置換できなくなります。サーチ可能データ保持数に指定された値よりも残りノード数が少なくなった場合、クラス
タは失われた 10 個のサーチ可コピーを置換できなくなります。
どのような場合でも、クラスタは失われたバケツのコピーにして、それらのバケツの他のピア上のコピーを「プ
ライマリ」として指定し、サーチヘッドが完全にアクセスできる状態を維持する必要があります。クラスタが完全
なプライマリコピーのセットを保持できなくなるのは、複製可能データ保持数以上のノードが停止した場合のみで
す。たとえば、5 台のピアノードを持つクラスタで複製データ保持数が 3 に設定されている場合、1 台または 2 台
のピアが停止しても完全なプライマリコピーセットを保持できますが、3 台目が停止するとその状態を維持できな
くなってしまいます。
前述のように、バケツのコピーをサーチ可に換するためには少し時間がかかります。サーチ可能データ保持数が 1
の場合、クラスタはサーチ可バケツセットを 1 つのみ保持します。一部のプライマリコピーを保持しているピアが
停止した場合は、まずいくつかのサーチ不可コピーをサーチ可コピーに換しないと、それらを失われたコピーの
代わりとなる (置き換わる) プライマリとして指定することはできません。この処理が行われている間は、クラス
タには不完全なプライマリバケツのセットが存在することになります。その間もサーチを続行することはできます
が、利用可能なサーチ可バケツにしてのみサーチが行われます。徐々にすべてのサーチ可コピーが置換され、そ
れらが「プライマリ」として指定されます。そうなると、完全なバケツセットにしてサーチを実行できるように
なります。
51
一方、サーチ可能データ保持数に 2 以上の値を設定すると、クラスタは即座に残りのノード上に存在するサーチ可
コピーを「プライマリ」として指定できます。停止したノードのサーチ可コピーの置換処理は行われますが、その
間もクラスタのすべてのデータにしてサーチを続できます。
詳細は、「ピアノード停止時の処理」を参照してください。
マスターノードが停止した場合、ある程度の期間は、ピアノードは引き続きインデックスを作成し、データを複製
することができます。また、サーチヘッドもデータ全体をサーチできます。ただし、徐々に問題が発生するように
なります (特に、いずれかのピアが停止した場合など)。マスターが存在しないと、ピア停止による問題から回復す
ることはできません。サーチヘッドは不完全なセットにしてサーチを行うことになります。一般的には、マス
ターが存在しない場合でもクラスタはできる限り最善の動作を行いますが、システムは不整合状態となり、結果を
保証できなくなってしまいます。
詳細は、「マスターノード停止時の処理」を参照してください。
クラスタのデプロイ
デプロイの概要
ここでは、クラスタをデプロイするための主なステップについて明していきます。以降のトピックでは、これら
のステップの詳細を見ていきます。
クラスタのデプロイを開始する前に、Splunk 管理に関するさまざまな知識を理解しておく必要があります。
インデクサーの設定方法：「Splunk によるインデックスの格納方法」およびこのマニュアルに記載されてい
るその他のインデックス管理に関するトピックを参照してください。
サーチヘッドの処理：分散サーチの詳細は、『Distributed Deployment manual』の「About distributed
search」を参照してください。ただし、クラスタのサーチヘッドは、このトピックの明とは、少し異なる設
定が行われています。これらの違いについては、このマニュアルの後半にある「サーチヘッドの設定」で明
しています。
インデクサーにデータを取り込むためのフォワーダーの使用方法：『Getting Data In Manual』の「Use
forwarders」を参照してください。
非クラスタ Splunk デプロイ環境から移行しますか？
クラスタ構成のインデクサーは、クラスタ構成ではない Splunk インデクサーとは要件が異なっています。インデ
クサーを移行する前に、それらの事項を理解しておく必要があります。詳細は、「クラスタ構成と非クラスタ構成
の Splunk デプロイの主な相違点」を参照してください。それを参照した後は、「非クラスタインデクサーのクラ
スタ化環境への移行」に進んで実際の移行プロセスの詳細を確認してください。
クラスタのデプロイ
クラスタをデプロイする場合、インデックスの作成を実行するクラスタのマスターとピアノードを有効にして、設
定します。また、クラスタ内のデータをサーチするサーチヘッドも有効にします。さらに、一般的にはクラスタ内
のノードにデータを送信するように、フォワーダーを設定します。デプロイする各種コンポーネントを含んだ小さ
なクラスタの例を以下の図に示します。
52
クラスタデプロイの主要ステップを以下に示します。
1. 要件を判断します。
a. データ可用性およびフェイルオーバーのニーズを把握します。「クラスタについて」を参照してください。
b.複製データ保持数を決定します。複製データ保持数は、クラスタが保持する raw データのコピー数です。最適な
複製データ保持数は、ご利用の環境のさまざまな要因によって異なりますが、基本的には障害耐性とストレージ容
量のトレードオフとなります。複製データ保持数に高い値を設定すると、多数のピアノード上により多くのデータ
コピーが保管されることになり、データの可用性を失わずにノードの障害耐性を強化できます。ただし、追加デー
タを取り扱うためにより多くのノードとストレージが必要になります。詳細は、「複製データ保持数」を参照して
ください。
警告：最初から、ニーズに合わせた適切な複製データ保持数を設定するようにしてください。クラスタが大量の
データを保有するようになってから、複製データ保持数の値をやすことはお勧めできません。この場合、値がや
された複製データ保持数にじてクラスタは大量のバケツをコピーしなければなりません。コピー中は、クラスタ
の総合的なパフォーマンスも大幅に低下してしまいます。
c.サーチ可能データ保持数を決定します。サーチ可能データ保持数は、クラスタにインデックスデータのサーチ可
コピー保持数を指示します。この値は、クラスタがノード停止から回復するまでの速度に影響します。サーチ可能
データ保持数の値を大きくすると、クラスタがより迅速に回復できます。ただし、より多くのストレージスペース
および処理能力を消費します。たいていの環境では、デフォルトのサーチ可能データ保持数 2 が適性で、ノードの
停止時にもわずかな中断でサーチを続行することができます。詳細は、「サーチ可能データ保持数」を参照してく
ださい。
警告：最初から、ニーズに合わせた適切なサーチ可能データ保持数を設定するようにしてください。クラスタが大
量のデータを保有するようになってから、サーチ可能データ保持数の値をやすことはお勧めできません。この場
合、やされたサーチ可能データ保持数にじてクラスタは大量のデータ処理 (サーチ不可バケツのコピーのサーチ可
コピーへの換) を行わなければならず、処理中はクラスタの総合的なパフォーマンスに極端な影響を与えてしまい
ます。
d.クラスタの規模を決定するその他の養親を判別します。たとえば、インデックスを作成するデータの量などを判
別します。一般的に、単一のクラスタにすべてのインデクサーを配置し、さらに水平方向のスケーリングを確保し
たい場合は、複製データ保持数よりも多くのピアノードを追加する必要があります。同に、予想されるサーチ負
荷にじて、複数のサーチヘッドを設定しなければならないこともあります。
e.その他の問題については、「システム要件およびその他のデプロイに関する討事項」を参照してください。
2. ネットワークに Splunk クラスタインスタンスをインストールします。最低でも、「複製データ保持数 + 2」個
の Splunk インスタンスが必要になります。
最低でも「複製データ保持数」台のピアノードが必要ですが、ステップ 1d で明したように、インデックス
作成能力を強化するために他のピアを追加することも可能です。
53
また、マスターノード用とサーチヘッド用に、その他 2 つの Splunk インスタンスも必要になります。
Splunk のインストール方法については、『Installation Manual』を参照してください。
3. Splunk インスタンスのクラスタリングを有効にします。
a. マスターノードを有効にします。「マスターノードを有効にする」を参照してください。
重要：マスターを初めて起動した場合、複製データ保持数と同じ数のピアを有効にして再起動するまでは、ピアに
おけるインデックス作成がマスターによりブロックされます。
b. ピアノードを有効にします。「ピアノードを有効にする」を参照してください。
c. クラスタのサーチヘッドを有効にします。クラスタのサーチヘッドの設定は、非クラスタグループのインデク
サー設定よりも簡単です。「サーチヘッドを有効にする」を参照してください。
4. ピアノード設定を完了します。
a. ピアのインデックス設定を行います。このステップは、デフォルトのインデックスや App のセットをやす必要
がある場合にのみ実施する必要があります。一般的には、すべてのピアが同じインデックスセットを使用する必要
があります。あるピアにインデックス (またはインデックスを定義する App) を追加した場合は、特別なクラスタ
固有の配布方法を使ってすべてのピアにそれを追加してください。一連のピアに適用する必要がある、その他の設
定が存在している場合もあります。方法の詳細は、「ピアのインデックスレプリケーションの準備」を参照してく
ださい。
b. ピアのデータ入力を設定します。たいていの場合は、フォワーダーを使ってピアにデータを送信するのが最適
です。詳細は、「フォワーダーを使ったデータの取り込み」を参照してください。このトピックに記述されている
ように、通常はインデクサー答確認を有効にした、ロードバランシングフォワーダーを使用します。
ノードを有効にしてピアノデータ入力を設定すると、クラスタはインデックスの作成とデータの複製を自動的に開
始します。
その他のデプロイシナリオ
この章は、その他のクラスタ展開シナリオに関するガイドラインも明しています。
既存のデータを保有するインデクサーをクラスタに追加する。「非クラスタインデクサーのクラスタ化環境
への移行」を参照してください。
インデックスレプリケーションが要件ではなく、単にインデックスのスケーラビリティの点からクラスタを
導入する。「クラスタを使ったインデックスの強」を参照してください。
最初にお読みください：クラスタ構成と非クラス
タ構成の Splunk デプロイの主な相違点
ここでは、クラスタ構成のインデクサーと非クラスタ構成のインデクサーの主な違いについて明していきます。
特に、システム要件とデプロイの点からの問題を取り上げています。
現在のインデクサーセットをクラスタに移行することを計画している場合は、このトピックを注意深くお読みくだ
さい。
クラスタピアでデプロイサーバーやサードパーティ製のデプロイ
ツールを使用しないでください
クラスタピアに設定や App を配布するための手段としてサポートされている、デプロイサーバーやサードパー
ティ製のデプロイツール (Puppet や CFEngine など) はありません。一連のクラスタピアに設定を配布するには、
「共通のピア設定の更新」で明されている設定バンドルを使用してください。
デプロイサーバーから設定バンドルを使った App 配布への移行方法の詳細は、「クラスタへの App の移行」を参
照してください。
システム要件の相違
ピアノードのシステム要件は、非クラスタインデクサーとは一部違いがあります。インデクサーを移行する前に、
「システム要件とその他のデプロイに関する討事項」を参照してください。特に、以下の相違点に注意してくだ
さい。
54
インデクサーをクラスタピアに換する際には、ディスク使用量が大幅に加します。日常的なインデックス作
成量、サーチ可能データ保持数、および複製データ保持数にできる十分なディスクスペース量があることを
確認してください。ピアのディスク使用量の詳細は、「ストレージの討事項」を参照してください。
colddb ストレージにして、別のハードウェアを使用しなければならないこともあります。ハードウェアのス
トレージニーズの詳細は、「ストレージハードウェア」を参照してください。
ピアノードは他のクラスタコンポーネントとともに、高速ネットワーク上に配置する必要があります。
「ネットワーク要件」を参照してください。
クラスタコンポーネントは、Splunk インスタンスを共有できません。マスターノード、ピアノード、および
サーチヘッドは、それぞれ独自のインスタンス上で動作する必要があります。
その他の討事項と非クラスタデプロイとの相違点
また、以下の事項に注意してください。
大半のクラスタデプロイ環境では、データをピアに送信するフォワーダー上でインデクサー答確認を有効に
する必要があります。これは、インデックスのパフォーマンスにある程度影響します。「インデクサー答確
認の仕組み」を参照してください。
インデクサー答確認、インデックスや他のピアノードから送られてくる複製データの保管の必要性など、い
くつかの要因により、総合的なパフォーマンスが低下します。
クラスタピアを再起動する場合は、Splunk 管理を使用するか、または splunk offline や splunk rollingrestart などのクラスタ CLI コマンドを使用する必要があります。splunk restart は使用しないでくださ
い。詳細は、「クラスタ全体または 1 台のクラスタノードの再起動」を参照してください。
非クラスタ構成インデクサーの移行
既存の Splunk インデクサーのクラスタへの移行およびその結果や影響については、「非クラスタインデクサーの
クラスタ化環境への移行」を参照してください。
システム要件とその他のデプロイに関する討事項
クラスタは Splunk インデクサーのグループなので、その大部分は Splunk インデクサーのシステム要件に準して
います。Splunk インデクサーの詳細なソフトウェア/ハードウェア要件については、『Installation Manual』の
「System requirements」を参照してください。このトピックには、クラスタに関する他の要件を記載していま
す。
ハードウェア要件
クラスタの各コンポーネント (マスターノード、ピアノード、およびサーチヘッド) は、別個のマシンまたは VM
上で動作する必要があります。それ以外は、『Installation Manual』の「Reference hardware」に記載されている
ように、ハードウェア要件はどの Splunk インスタンスでも基本的には同じです。
注意：マスターノードのハードウェアストレージに関するニーズは、「Reference hardware」に記載されている要
件よりも低くなっています (マスターは外部データのインデックスを作成しないため)。
Splunk バージョンの互換性
バージョン 5.0 以上の Splunk インデクサーグループにクラスタリングを導入することができます。サーチヘッド
を含めすべてのクラスタコンポーネントで、同じバージョンの Splunk が動作していなければなりません。
必要な Splunk インスタンス
各クラスタノードは、独自の Splunk インスタンス上に常駐する必要があります。そのため、クラスタには最低で
も「複製データ保持数 + 2」個の Splunk インスタンスが必要です。内訳は、「複製データ保持数」台のピアノー
ド、および 1 台のマスターノード、および 1 台または複数台のサーチヘッドになります。たとえば、複製データ
保持数が 3 のクラスタをデプロイする場合は、最低でも 5 つの Splunk インスタンスが必要になります。3 つはピ
ア用に、1 つはマスター用に、1 つはサーチヘッド用になります。複製データ保持数の詳細は、「複製データ保持
数」を参照してください。
クラスタのサイズは、複製データ保持数だけでなく、インデックスを作成するデータ量などの他の要因によっても
異なります。詳細は、このマニュアルの「デプロイの概要」を参照してください。
ネットワーク要件
クラスタ内のすべてのノードを、各ノードが他のノードにアクセスできる高速ネットワーク上に配置する必要があ
55
ります。これには、マスターノード、ピアノード、およびサーチヘッドが含まれます。
ノードは同じサブネット上または同じデータセンター内に存在していなくても構いません (データセンター間の接
続が非常に高速な場合)。server.conf でクラスタの各種タイムアウト設定を調節することができます。タイムアウ
トの設定について支援が必要な場合は、Splunk プロフェッショナルサービスまでお問い合わせください。
注意：十分な高品質の接続がある場合は、複数のデータセンターにまたがってクラスタをデプロイすることができ
ます。ただし、現在のバージョンの Splunk では、クラスタはサイトを認識していません。たとえば、2 つのデー
タセンターにまたがってピアノードが存在している場合に、あるデータセンターのノード上にクラスタデータの 1
つの複製コピーを、別のデータセンターのノード上に別のコピーを配置するように指定することはできません。ク
ラスタ内で一連のデータセットの複製方法をマスターが決定する際に、ピアの場所は考慮されません。
ストレージの討事項
クラスタ化インデックスのストレージ要件を考慮する場合、非クラスタインデックスと比べて 2 つの点で異なって
います。
一連のピアノードで、複数のデータコピーを取り扱うために容量がえる。
使用するストレージハードウェアの種類。
クラスタは、「インデックスストレージの設定」に記載されているように、インデックスストレージを管理するた
めに通常の設定を使用します。
ストレージ要件の決定
ピアノードが処理するデータの量を保管するために、十分な量のディスクスペースを確保することが重要になりま
す。Splunk のデータ量およびストレージニーズの概算方法に関する一般情報ついては、『Installation Manual』の
「Estimating your storage requirements」を参照してください。そこには、非クラスタ構成のインデクサーにスト
レージの見積もり方法が記載されています。そのガイドラインを参考に、クラスタに必要となる余分なデータコ
ピーの量を概算してください。
クラスタを利用する場合は、転送されてくるデータ量を討するだけではなく、複製データ保持数とサーチ可能
データ保持数も考慮して、一連のピアノードの合計ストレージ要件を判断する必要があります。複製データ保持数
が 3 の場合、データのコピーを 3 つ保管することになります。これらのコピーを保管するために余分なストレー
ジスペースが必要になりますが、3 倍のストレージが必要になる訳ではありません。データのサーチ不可コピーは
サーチ可コピーよりもサイズが小さくなります (データのみでするインデックスファイルは含まれていないた
め)。そのため、たとえば複製データ保持数が 3 でサーチ可能データ保持数が 2 の場合、非クラスタ構成のインデ
クサーに同じデータを保管する場合と比べて、2 倍以上 3 倍未のストレージスペースが必要となります。
サーチ不可コピーにより減らせるストレージ量を知るには、他にもいくつかの事項を調査する必要があります。
サーチ不可コピーで不要になるインデックスファイルのサイズは、「Estimating your storage requirements」に記
述されている要因によって大幅に動します。
重要：マスターは個別のピアノードのストレージ量を把握していません。そのため、特定の複製データセットを受
け取るピアノードの決定時には、ノードのストレージ量は考慮されません。また、どのピアが複製データをサーチ
可にするかも任意に決定されます (サーチ可能データ保持数が 2 以上の場合)。そのため、各ピアノードには、その
ピアが保有するデータだけではなく、他のピアから転送されてくる可能性がある複製コピー用のストレージも十分
に確保する必要があります。(「インデックスボリュームを使ったストレージ管理の簡素化」で明しているよう
に、インデックスボリュームを使ってストレージを管理することをお勧めします。)クラスタにおけるストレージ
の使用量は、そのライフサイクルを通して常時監視しておく必要があります。
ストレージ要件の例
概算で、受信した syslog データが Splunk で縮、インデックス作成されると、元のサイズの約 50% になります。
raw データに 15%。
関連するインデックスファイルに 35%。
実際には、この概算値は『Installation Manual』の「Estimating your storage requirements」に記述されている各種
要因によって大幅に動します。
Splunk に取り込まれる syslog データが 100GB であると仮定します。非クラスタ構成のインデクサーの場合、そ
のデータは Splunk のストレージのうち 50GB (100GB の 50%) を占有します。ただし、クラスタの場合、スト
レージの計算には複製データ保持数とサーチ可能データ保持数を考慮して、すべてのクラスタピアの合計ストレー
ジ要件を判断する必要があります。(前述のように、特定のピアで必要になるストレージ量を正確に予測すること
は困難です。)
ここでは、クラスタのストレージ要件を見積もる 2 つの例を取り上げていきます。どちらの例でも、受信する
syslog データは 100GB で、その結果 15GB の raw データと 35GB のインデックスが作成されることを前提にして
56
います。
3 台のピアノード、複製データ保持数 = 3、サーチ可能データ保持数 = 2 の場合：すべてのピアノードにまた
がって、合計 115GB のストレージが必要になります (平均 38GB/ピア)。計算式は以下のようになります。
合計 raw データ = (15GB * 3) = 45GB。
合計インデックスファイル = (35GB * 2) = 70 GB。
5 台のピアノード、複製データ保持数 = 5、サーチ可能データ保持数 = 3 の場合：すべてのピアノードにまた
がって、合計 180GB のストレージが必要になります (平均 36GB/ピア)。計算式は以下のようになります。
合計 raw データ = (15GB * 5) = 75GB。
合計インデックスファイル = (35GB * 3) = 105 GB。
ストレージハードウェア
ホット/ウォームおよびコールドバケツの場所は、それぞれ indexes.conf 内の homePath および coldPath で指定し
ます。詳細は、「インデックスストレージの設定」を参照してください。非クラスタ構成のインデクサーと比べ
て、クラスタではこれらの保管場所に使用するストレージタイプに関する要件がとても異なっています。
非クラスタ構成のインデクサーでは、ホット/ウォームバケツとコールドバケツにして個別のパーティションを指
定することにより、それぞれにして異なる種類のストレージを指定することができます。一般的にコールドバケ
ツはホット/ウォームバケツと比べてアクセス頻度が比較的少ないため、この方法を利用してコールドバケツを低
速なディスクアレイに保管することができます。また、通常はコールドバケツにしてインデックス作成処理を実
施する必要はありません。詳細は、「インデックスデータ用の複数のパーティションの使用」を参照してくださ
い。
ただしクラスタの場合、この方法はお勧めできません。coldPath の保管場所に使用するストレージに
は、homePath に使用するストレージと同じパフォーマンス特性が必要です。これは、バケツの複製されたコピー
がすべて、ピアの coldPath ディレクトリに保管されるためです。ホット、ウォーム、またはコールドかどうかは
関係ありません。coldPath にしていストレージを使用した場合、クラスタの総合的なパフォーマンスが低下して
しまいます。
クラスタ運用のニーズにするためにも、coldPath には高性能のストレージが必要です。たとえば、coldPath に存
在するバケツが、引き続き書き込まれているホットバケツである場合があります。他のバケツはウォームコピーに
複製され、サーチヘッドはそれらに頻繁にアクセスします。また、クラスタの設定および今後何が行われるか (ピ
アがオフラインになるなど) にじて、ピアのバケツコピーをサーチ不可からサーチ可に換しなければなら
ず、coldPath データの処理にかなりの時間がかかることもあります。
また、通常コールドバケツのストレージニーズに加えて、ホット/ウォームバケツのすべての複製コピーを取り扱
うために、各ピアには十分な容量の coldPath ストレージを確保しておく必要があります。
注意：coldPath に保管されるのは、複製されたホット/ウォームバケツのみです。ホット/ウォームバケツの元のコ
ピーは、通常とわらずにピアの homePath に保管されます。また、すべてのコールドバケツのコピーは coldPath
に保管されます。
ライセンス情報
他の Splunk デプロイ環境と同に、ライセンス要件はインデクサーが処理するデータ量により決まります。追加量
のライセンスを購入するには、Splunk 営業担当にお問い合わせください。Splunk ライセンスの詳細は、『管理マ
ニュアル』の「ライセンスの仕組み」を参照してください。
インデックス複製におけるライセンス上の問題はさほど多くはありません。
マスター、ピア、サーチヘッドを含めクラスタメンバーはすべて、Enterprise ライセンスプールに割り当て
る必要があります (インデックス作成処理を行わない場合でも)。
クラスタメンバーは、同じライセンス設定を共有する必要があります。
ライセンスにしては受信データのみがカウントされます。複製されたデータは象外です。
無料版ライセンスでは、インデックス複製は利用できません。
サーバーとクラスタのデプロイ
クラスタピアにはデプロイサーバーを使用しないでください。
クラスタピアへの設定や App の配布手段として、デプロイサーバーはサポートされていません。一連のクラスタ
ピアに設定を配布するには、「共通のピア設定の更新」で明されている設定バンドルを使用してください。
デプロイサーバーから設定バンドルを使った App 配布への移行方法の詳細は、「クラスタへの App の移行」を参
照してください。
57
マスターノードを有効にする
このトピックを読む前に、「デプロイの概要」をご覧ください。
クラスタには、マスターノードが 1 台のみ存在しています。マスターノードは、ピアノードのアクティビティを調
整します。それ自体がデータを保管または複製することはありません (自己の内部データを除く)。
重要：マスターノードはピアノードのように、2 つの作業を兼務することはできません。マスターノードとして有
効にした Splunk インスタンスは、1 つの役割のみを担当する必要があります。また、マスターノードはピアとマ
シンを共有することはできません。
クラスタのデプロイ時には、ピアノードを設定する前に、最初のステップでマスターノードを有効にする必要があ
ります。
注意：このトピックに記載されている手順は、Splunk 管理を使ってマスターノードを有効にする方法について明
しています。その他にも、2 種類の方法でマスターノードを有効にすることができます。
マスターの server.conf ファイルを直接編集する。詳細は、「server.conf によるクラスタの設定」を参照し
てください。一部の高度な設定は、このファイルを編集することによってのみ設定できます。
CLI の edit cluster-config コマンドを使用する。詳細は、「CLI によるクラスタの設定」を参照してくだ
さい。
マスターを有効にする
インデクサーをマスターノードとして有効にするには：
1. Splunk Web で [管理] をクリックします。
2. [分散環境] セクションで、[クラスタリング] をクリックします。
3. [クラスタリングを有効にする] を選します。
4. [このインスタンスをクラスタマスターにします。] を選します。
5. 他にもいくつかのフィールドを記入する必要があります。
作成する各バケツのコピー数は？これは、クラスタの複製データ保持数です。デフォルトは 3 です。複製
データ保持数の詳細は、「複製データ保持数」を参照してください。適切な複製データ保持数を今すぐ選し
てください。後ほどクラスタが大量のデータを保有するようになってから、複製データ保持数の値をやすこ
とはお勧めできません。
インデクサーのハートビートタイムアウトは？デフォルト値は 60 秒です。Splunk サポートに確認せずに、
この値を更しないでください。ハートビートタイムアウト期間内にマスターがピアからの答を受信しない場
合、ピアが停止したものと判断し、復旧措置を開始します。通常ピアは、マスターに秒ごとにハートビート
を送信します。
作成する各バケツのサーチ可コピー数は？これは、クラスタのサーチ可能データ保持数です。デフォルトは
2 です。複製データ保持数の詳細は、「複製データ保持数」を参照してください。適切なサーチ可能データ
保持数を今すぐ選してください。後ほどクラスタが大量のデータを保有するようになってから、サーチ可能
データ保持数の値をやすことはまったくお勧めできません。
秘密鍵：マスター、ピア、サーチヘッド間の通信を認証するための鍵です。鍵は、すべてのクラスタインス
タンス間で同じでなければなりません。ここでフィールドを空にする場合は、他のピアやサーチヘッドにし
ても同じように空にしてください。
6. [保存] をクリックします。
7. ページの上部にある情報バーから、「更内容を有効にするには、Splunk を再起動する必要があります。ここを
クリックして Splunk 管理から再起動してください。」と言うメッセージを探してください。リンクをクリックす
ると [管理] ページに移動します。そこから再起動を行えます。
重要：マスターを初めて起動した場合、すべてのピア (複製データ保持数と同じ数のピア) を有効にして再起動す
るまでは、ピアにおけるインデックス作成がマスターによりブロックされます。
マスターノードの詳細設定については、「マスターの設定」を参照してください。
マスターダッシュボードの表示
再起動後、マスターノードに再度ログインして、[管理] の [クラスタリング] ページにります。今回は、マスターク
ラスタリングダッシュボードが表示されます。ダッシュボードの詳細は、「マスターダッシュボードの表示」を参
照してください。
58
追加設定
デプロイ後のマスターノードの設定については、このマニュアルの「マスターの設定」を参照してください。
ピアノードを有効にする
このトピックを読む前に、「デプロイの概要」をご覧ください。
通常は、クラスタをデプロイするために複数のピアノードを有効にする必要があります。最低でも、複製データ保
持数と等しい数のピアを有効にする必要があります。水平スケーリングにするために、より多くのピアが必要な
場合もあります。
一連のピアを有効にする前に、「マスターノードを有効にする」の明に従ってマスターノードを有効にして再起
動する必要があります。マスターを初めて起動した場合、複製データ保持数と同じ数のピアを有効にして再起動す
るまでは、ピアにおけるインデックス作成がマスターによりブロックされます。
注意：このトピックに記載されている手順は、Splunk 管理を使ってピアノードを有効にする方法について明して
います。その他にも、2 種類の方法でビアノードを有効にすることができます。
ピアの server.conf ファイルを直接編集する。詳細は、「server.conf によるクラスタの設定」を参照してく
ださい。
CLI の edit cluster-config コマンドを使用する。詳細は、「CLI によるクラスタの設定」を参照してくだ
さい。
ピアを有効にする
インデクサーをピアノードとして有効にするには：
1. Splunk Web で [管理] をクリックします。
2. [分散環境] セクションで、[クラスタリング] をクリックします。
3. [クラスタリングを有効にする] を選します。
4. [このインスタンスをクラスタピアにします。] を選します。
5. 他にもいくつかのフィールドを記入する必要があります。
クラスタマスターの場所は？マスターの IP アドレスまたはドメイン名、およびその管理ポートを入力しま
す。この情報は、マスターのクラスタリングダッシュボードに表示されます。例：
https://10.152.31.202:8089
秘密鍵：マスター、ピア、サーチヘッド間の通信を認証するための鍵です。鍵は、すべてのクラスタインス
タンス間で同じでなければなりません。マスターに秘密鍵がある場合は、ここに入力する必要があります。
複製ポート：これは、ピアが他のピアから転送された複製データを受信するポートです。この目的で、利用
可能な任意のポートを指定することができます。
6. [保存] をクリックします。
7. ページの上部にある情報バーから、「更内容を有効にするには、Splunk を再起動する必要があります。ここを
クリックして Splunk 管理から再起動してください。」と言うメッセージを探してください。リンクをクリックす
ると [管理] ページに移動します。そこから再起動を行えます。
8. クラスタのすべてのピアノードにして、この作業を繰り返します。
複製データ保持数と同じ数のピアを有効にしたら、クラスタでインデックスの作成とデータの複製を開始できます
(「マスターノードを有効にする」を参照)。
ピアダッシュボードの表示
再起動後、ピアノードに再度ログインして、[管理] の [クラスタリング] ページにります。今回は、ピアのクラスタ
リングダッシュボードが表示されます。ダッシュボードの詳細は、「ピアダッシュボードの表示」を参照してくだ
さい。
ピアの設定
ピアを有効にした後は、データのインデックス作成を開始する前に、各種設定を行う必要があります。詳細は、以
59
下のトピックを参照してください。
ピアインデックスの設定
フォワーダーを使ったデータの取り込み
また、いくつかの詳細オプションを設定することもできます。「ピアノードの設定」を参照してください。
サーチヘッドを有効にする
このトピックを読む前に、「デプロイの概要」をご覧ください。
クラスタをサーチするには、最低 1 台のクラスタサーチヘッドを有効にする必要があります。
一連のピアを有効にする前に、「マスターノードを有効にする」の明に従ってマスターノードを有効にして再起
動する必要があります。
注意：このトピックに記載されている手順は、Splunk 管理を使ってサーチヘッドを有効にする方法について明し
ています。その他にも、2 種類の方法でサーチヘッドを有効にすることができます。
サーチヘッドの server.conf ファイルを直接編集する。詳細は、「server.conf によるクラスタの設定」を参
照してください。複数クラスタサーチなど一部の高度な設定は、このファイルを編集することによってのみ
設定できます。
CLI の edit cluster-config コマンドを使用する。詳細は、「CLI によるクラスタの設定」を参照してくだ
さい。
サーチヘッドを有効にする
Splunk インスタンスをクラスタのサーチヘッドとして有効にするには：
1. Splunk Web で [管理] をクリックします。
2. [分散環境] セクションで、[クラスタリング] をクリックします。
3. [クラスタリングを有効にする] を選します。
4. [このインスタンスをサーチヘッドにします。] を選します。
5. 他にも 2 つのフィールドを記入する必要があります。
クラスタマスターの場所は？マスターの IP アドレスまたはドメイン名、およびその管理ポートを入力しま
す。この情報は、マスターのクラスタリングダッシュボードに表示されます。例：
https://10.152.31.202:8089
秘密鍵：マスター、ピア、サーチヘッド間の通信を認証するための鍵です。鍵は、すべてのクラスタインス
タンス間で同じでなければなりません。マスターに秘密鍵がある場合は、ここに入力する必要があります。
6. [保存] をクリックします。
7. ページの上部にある情報バーから、「更内容を有効にするには、Splunk を再起動する必要があります。ここを
クリックして Splunk 管理から再起動してください。」と言うメッセージを探してください。リンクをクリックす
ると [管理] ページに移動します。そこから再起動を行えます。
サーチヘッドダッシュボードの表示
再起動後、サーチヘッドに再度ログインして、[管理] の [クラスタリング] ページにります。今回は、サーチヘッド
のクラスタリングダッシュボードが表示されます。詳細は、「サーチヘッドダッシュボードの表示」を参照してく
ださい。
複数クラスタサーチを有効にする
サーチヘッドは、複数のクラスタにまたがったサーチを実行することができます。この機能を有効にするには、
「複数クラスタサーチの設定」の明に従って server.conf を直接編集する必要があります。
複数のサーチヘッドの設定
多数の同時サーチを可能にするために、複数のサーチヘッドを設定することができます。サーチヘッドのニーズの
決定方法については、『Distributed Deployment Manual』の「Hardware capacity planning for a distributed Splunk
deployment」を参照してください。
60
複数のサーチヘッドを設定する場合は、単に追加のインスタンスにして有効化のための手順を繰り返します。複
数のサーチヘッドで設定とユーザーデータを共有するためにプールを使用する場合については、『Distributed
Deployment Manual』の「Configure search head pooling」を参照してください。
追加設定
クラスタ化したサーチヘッドの設定については、このマニュアルの「サーチヘッドの設定」を参照してください。
ピアのインデックスレプリケーションの準備
ピアを有効にしたら、インデックスレプリケーションの準備のために、さらなる設定作業を行わなければならない
こともあります。特に、ピアがインデックスの共通セットを使用していることを確認する必要があります。また、
その他の設定や App をすべてのピアに配布しなければならないこともあります。
デフォルトのインデックスセットのみを使用する場合は、即座にレプリケーションを開始することができます。た
だし、データを他のインデックス (App が定義するインデックスも含む) にも送信する必要がある場合は、まず追
加の設定作業を実施する必要があります。
クラスタピアにまたがったインデックスの設定方法については、「ピアインデックスの設定」を参照してくださ
い。
ピアにまたがった App の設定方法および他のピア設定上の問題については、「ピアの設定」を参照してくださ
い。
フォワーダーを使ったデータの取り込み
クラスタピアノードは、非クラスタ構成のインデックスと同に任意のソースから、データを直接取り込むことが
できます。ただし、データの忠実度が重要な場合は、ノードに直接データを取り込む代わりに、まずロードバラン
シングフォワーダーを使ってデータを取り込んでから、それをピアノードに転送します。フォワーダーからデータ
を受け取るノードは、レシーバーまたは受信ノードと呼ばれています。
フォワーダー、特にロードバランシングフォワーダーを使用してクラスタにデータを転送する理由としては、主に
以下の 2 点がげられます。
すべての受信データのインデックスを確実に作成する。フォワーダーのインデクサー答確認機能を有効にす
れば、すべての受信データのインデックスが作成され、クラスタに保管されたことを確認できます。この仕
組みは次のようになります。ピアがフォワーダーからデータブロックを受信すると、そのデータのインデッ
クスを作成後、フォワーダーに答確認を送信します。フォワーダーがピアから答確認を受信しない場合は、
データを再送信します。フォワーダーは答確認を受信するまで、データの再送を繰り返します。インデク
サー答確認は、終端間データの忠実度を確保するための唯一の手段です。このトピック後半の「インデク
サー答確認の仕組み」を参照してください。
潜在的なノード障害に処する：フォワーダーのロードバランシングにより、ロードバランシングが行われて
いるグループ内のある受信ノードが停止した場合、フォワーダーはそのグループ内の残りのピアに引き続き
データを送信します。ロードバランシングがない場合、受信ノードが停止すると、フォワーダーはデータの
送信を続行する手段がありません。このトピック後半の「ロードバランシングの仕組み」を参照してくださ
い。
重要：続行する前に、フォワーダーの詳細およびそれを使った Splunk へのデータの取り込み方法を理解しておく
必要があります。フォワーダーの基本については、『Distributed Deployment Manual』の「About forwarding and
receiving」を参照してください。そのマニュアルのそれ以降のトピックには、フォワーダーのデプロイおよび設定
方法が詳細に記述されています。
フォワーダーを使ってクラスタにデータを取り込むには、2 種類の設定作業を行う必要があります。
1. フォワーダーからピアノードへの接続を設定します。
2. フォワーダーのデータの取り込み方法を設定します。
注意：このトピックは、ユニバーサルフォワーダーを使用していることを前提にしています。ただし、基本的な手
順はライトフォワーダーでもヘビーフォワーダーでも同じです。
フォワーダーからピアノードへの接続の設定
フォワーダーとピアノード間の接続を設定するために、3 つのステップで作業を行います。
1. フォワーダーからデータを受信するようにピアノードを設定します。
61
2. ピアノードにデータを送信するようにフォワーダーを設定します。
3. 各フォワーダー上でインデクサー答確認を有効にします。このステップは、終端間データの忠実度を確保する
ために必要です。デプロイの要件で忠実度が不要な場合は、このステップをスキップしても構いません。ただし、
インデクサー答確認を使用していないことを警告するメッセージが表示されます。
接続の設定が完了したら、フォワーダーへのデータストリーム (これがクラスタに転送される) を制御するデータ
入力を設定します。この方法については、「フォワーダーのデータ取り込みの設定」を参照してください。
1. フォワーダーからデータを受信するようにピアノードを設定する
ピアがフォワーダーからデータを受信するためには、ピアの受信ポートを設定する必要があります。受信ポートの
設定方法については、『Distributed Deployment Manual』の「Enable a receiver」を参照してください。
重要：ピアの $SPLUNK_HOME/etc/system/local/ にある inputs.conf ファイルを編集して受信ポートを指定すること
ができます。多くのクラスタでは、同一の inputs.conf ファイルをすべてのピアに配布することにより、ピア入力
設定の手間を減らすことができます。この場合、各ピア個別に指定した受信ポートよりも、共通版の inputs.conf
に指定されている受信ポートが優先されます。すべてのピアにまたがった共通の inputs.conf の作成およびデプロ
イの詳細については、「共通のピア設定の更新」を参照してください。
2. ピアノードにデータを送信するようにフォワーダーを設定する
フォワーダーを設定する場合、受信ピアの IP アドレスと受信ポート番号を指定します。例：10.10.10.1:9997この
作業は、フォワーダーの outputs.conf ファイルで行います。詳細は、『Distributed Deployment Manual』の
「Configure forwarders with outputs.conf」を参照してください。受信ピアを指定するには、以下のように server
属性を設定します。
server=10.10.10.1:9997
ここに指定する受信ポートは、ステップ 1 で明したポートです。
フォワーダーで、データを複数のピアノードに順番に提供するように、ロードバランシングを設定する場合、各
ロードバランシンググループ内の受信ピアを指定します。たとえば、outputs.conf 内の以下の属性/値のペアは、3
つのピアのロードバランシンググループを示します。
server=10.10.10.1:9997,10.10.10.2:9997,10.10.10.3:9997
ロードバランシングの詳細については、『Distributed Deployment Manual』の「Set up load balancing」を参照し
てください。
注意：フォワーダーの受信ピアを指定するには、他にもさまざまな方法が存在しています。例：
フォワーダーのデプロイ時に、受信ピアを指定することができます (Windows フォワーダーのみ)。
『Deployment Manual』の「Deploy a Windows forwarder manually」を参照してください。
『Distributed Deployment Manual』の「Deploy a *nix forwarder manually」の明に従って、CLI コマンド add
forward-server を持つレシーバーを指定することができます。
これらの手法はどちらも、outputs.conf ファイルを更することにより可能です。どの方法で受信ピアを指定した
場合でも、outputs.conf ファイルを直接編集して、次の手順で明しているようにインデクサー答確認をオンにす
る必要があります。
3. 各フォワーダー上でインデクサー答確認を有効にする
クラスタがすべての到着データを受信してインデックス作成するために、各フォワーダー上でインデクサー答確
認をオンにする必要があります。このためには、outputs.conf の useACK 属性に true を設定します。
useACK=true
また、ピアノードからの答を待機中にフォワーダーがブロックされないように、フォワーダーの maxQueueSize に
7MB を設定する必要があります。
[tcpout]
maxQueueSize = 7MB
インデクサー答確認の設定方法および maxQueueSize 設定の詳細は、『Distributed Deployment Manual』の
「Protect against loss of in-flight data」を参照してください。
注意：このステップは、終端間データの忠実度を確保するために必要です。デプロイの要件で忠実度が不要な場合
62
は、このステップをスキップしても構いません。ただし、インデクサー答確認を使用していないことを警告する
メッセージが表示されます。
例：インデクサー答確認を使用するロードバランシングフォワーダー
ロードバランシングを使ってクラスタ内の 3 つのピアに順番にデータを送信するフォワーダー用の outputs.conf
設定例を以下に示します。この例では、各ピアが受信ポートとして 9997 を使用すると仮定しています。
[tcpout]
defaultGroup=my_LB_peers
maxQueueSize = 7MB
[tcpout:my_LB_peers]
autoLBFrequency=40
server=10.10.10.1:9997,10.10.10.2:9997,10.10.10.3:9997
useACK=true
フォワーダーは、まず server 属性に記載されているピアの中の 1 つにデータを送信することから開始します。40
秒後、別のピアに切り替えて、その後も同に作業を行います。任意の時点でその時の受信ノードから答確認がな
い場合、次に利用可能なノードにデータを再送信します。
フォワーダーのデータ入力の設定
フォワーダーと受信ピア間の接続を指定したら、クラスタにデータを送信するための、フォワーダーへのデータ入
力を指定する必要があります。一般的には、フォワーダーの inputs.conf ファイルを編集します。データ入力の設
定の詳細は、『Getting Data In Manual』の「What Splunk can index」を参照してください。また、そのマニュア
ルの「Use forwarders」には、フォワーダーのデータ入力の指定方法の概要が記載されています。
インデクサー答確認の仕組み
簡単に言えば、インデクサー答確認は次のように動作します。フォワーダーは受信ピアに続的にデータを送信し
ます (約 64 KB のブロックで)。フォワーダーは、ピアから答確認を受信するまでの間、各ブロックのコピーを保
持します。待機中でも、その他のブロックは引き続き送信されます。
すべてが順調な場合、受信ピアは：
1. データブロックを受信し、それを解析してインデックスを作成し、データ (raw データとインデックスデータ) を
ファイルシステムに書き込みます。
2. raw データのコピーをターゲットピアに複製します。
3. フォワーダーに答確認を送信します。
答確認により、データが正常にクラスタに書き込まれたことを確認できます。答確認を受信すると、フォワー
ダーは当該ブロックをメモリーから解放します。
注意：受信ピアは、データのターゲットピアへの複製を試みた後に、答確認をフォワーダーに送信します。デー
タの複製が正常に行われたかどうかに関係なく、答確認は送信されます。受信ピアがデータの複製を試みたかど
うかで判断されます。複製を試みた後は、受信ピアまたはターゲットピアのいずれかにノード障害が発生しても、
クラスタはデータを回復することができます。
この一連の処理中に何らかの障害が発生した場合、フォワーダーは答確認を受信しません。この場合、自動的に
データブロックが再送信されます。フォワーダーにロードバランシングが設定されている場合は、そのロードバラ
ンシンググループ内の他の受信ノードにブロックが送信されます。フォワーダーにロードバランシングが設定され
ていない場合は、前述のように同じノードにデータが再送信されます。
重要：終端間のデータの忠実度を保証するためには、クラスタにデータを送信する各フォワーダーにして明示的
にインデクサー答確認を有効にする必要があります。このためには、フォワーダーの outputs.conf ファイルで
useACK 属性に true を設定します。デプロイの要件で終端間データの忠実度が不要な場合は、このステップをス
キップしても構いません。ただし、インデクサー答確認を使用していないことを警告するメッセージが表示され
ます。
インデクサー答確認の仕組みについては、『Distributed Deployment Manual』の「Protect against loss of in-flight
data」を参照してください。
ロードバランシングの仕組み
ロードバランシングでは、フォワーダーは到着データを複数の受信ピアノードに分散します。各ノードはデータ全
体の一部を受け取り、各受信ノードのデータをまとめたものが全データになります。
63
Splunk フォワーダーは自動ロードバランシングを実行します。フォワーダーは、指定された時間間隔に基づいて
異なるノードにデータをルーティングします。たとえば、3 台のピアノードから成り立っているロードバランシン
ググループを考えてみましょう。それぞれのノードを A、B、および C とします。フォワーダーは指定された 30
秒などの一定の間隔で、データストリームを、グループ内の他のノードに切り替えます。ノードは無作為に選さ
れます。たとえばフォワーダーは、ノード B からノード A に切り替え、次にノード C に切り替えます。あるノー
ドが停止すると、即座に別のノードに切り替えられます。
注意：フォワーダーがモニターするように設定されている、各入力にするデータストリームがあります。フォ
ワーダーはデータストリームを他のノードに切り替えても安全かどうかを判断します。次に、指定されている間隔
で、新たに選したノードにデータストリームを切り替えます。新しいノードにデータストリームを安全に切り替
えることができなかった場合は、安全に送信できるようになるまでの間、前のノードとの接続を維持してデータス
トリームの送信を続します。
ロードバランシングは、クラスタ展開において重要な役割を果たします。ノード障害時にも、データが失われるこ
とはありません。フォワーダーがデータを送信したノードからインデクサー答確認を受信しない場合、そのデー
タはロードバランシング内の次に利用できるノードに送信されます。
フォワーダーのロードバランシングの詳細については、『Distributed Deployment Manual』の「Set up load
balancing」を参照してください。インデクサー答確認とロードバランシングの仕組みについては、『Distributed
Deployment Manual』の「Protect against loss of in-flight data」を参照してください。
ピア上で直接入力を設定する
データ入力にフォワーダーを使用しない場合、通常のように各ピア上で入力を設定することができます。たとえ
ば、inputs.conf を編集します。入力の設定方法の詳細は、『Getting Data In Manual』の「Configure your
inputs」を参照してください。
クラスタを使ったインデックスの強
クラスタの主な目的は、インデックスレプリケーションを有効にすることにあります。また、クラスタはデプロイ
トポロジを張する場合にも役立ちます。インデックスレプリケーションが不要な場合でも、複数のインデクサー
を管理するための手段として利用できます。
たとえば、単一のインデクサーでは処しきれないほど大量のデータのインデックスを作成、保管するために、3 台
のインデクサーと 1 台のサーチヘッドのデプロイ環境を作成する場合を考えてみましょう。Splunk 5.0 より前でこ
のような環境を実現する唯一の方法は、各インデクサーを個別に設定し、サーチヘッドに追加した後、デプロイ
サーバーのようなツールを使ってインデクサー設定を調整することでした。
クラスタリングを利用すれば、デプロイ用にクラスタを設定して 3 台のインデクサーの代わりに 3 台のピアノー
ドを指定できます。インデックスレプリケーションおよびその他の主な利点であるデータ可用性や耐障害性が不要
な場合でも、クラスタを使って複数のインデクサーインスタンスを調整することにはさまざまな利点があります。
管理とインデクサー設定の調整が簡単 (デプロイサーバーを使ったり手動で更新するのではない)。詳細は、
「共通のピア設定の更新」を参照してください。
分散サーチの設定と制御が簡単。「サーチヘッドを有効にする」を参照してください。
クラスタリングダッシュボードを使ってインデクサーの状態を把握。「マスターダッシュボードを有効にす
る」を参照してください。
開発された新たなクラスタ管理機能を活用できる。
インデックス作成能力を強するためにクラスタを採用することの主な欠点を以下に示します。
クラスタのマスターノードとして機能する Splunk インスタンスを追加でインストールする必要がある。
すべてのクラスタコンポーネントが同じ高速ネットワーク上になければなりません。
クラスタは異種インデクサーをサポートしていない。クラスタ内のすべてのピアノードが同じ indexes.conf
設定を使用する必要があります。詳細は、次のセクションの「クラスタピア管理とデプロイサーバーの比
較」を参照してください。
デプロイサーバーを使って、クラスタピアに設定や App を配布することはできません。詳細は、次のセク
ションの「クラスタピア管理とデプロイサーバーの比較」を参照してください。
クラスタピア管理とデプロイサーバーの比較
クラスタの役に立つ機能の 1 つとして、マスターノードからすべてのインデクサー (ピアノード) の設定を管理、
更新できることがげられます。その点では、デプロイサーバーと機能が似ています。ただし、デプロイサーバー
とは異なり、ピア管理にはサーバークラスの概念がありません。このこと、およびクラスタのアクティビティの調
整方法により、異なるグループのインデクサーに、異なる App または indexes.conf を指定することはできませ
ん。(「ピアノードの設定」で明しているように、クラスタ内のすべてのピアノードが、同じ indexes.conf 設定お
よび他の設定を使用する必要があります。)異種セットのインデクサーが必要な場合は、機能強のためにクラスタ
64
を使用することはできません。
また、複数のピアノードにまたがって設定や App を配布する手段として、デプロイサーバーやサードパーティ製
の分散設定管理ソフトウェア (例：Puppet や Chef など) はサポートされていません。
一方、ピアノードへのアップデートのダウンロードに用いられる設定バンドルには、デプロイサーバーと比べて利
点があります。アップデートを配布するだけでなく、ピア上でそれを証してから、ピアを順番に再起動していき
ます。詳細は、「共通のピア設定の更新」を参照してください。
処理能力強デプロイのためのクラスタの設定
処理能力を強するためのデプロイでクラスタを設定するには (インデックスレプリケーションなし)、複製データ
保持数とサーチ可能データ保持数に単に 1 を設定します。こうすることにより、クラスタはデータ複製を行わず、
単純に一連の Splunk インスタンスの調整を行います。データの複製コピーは保持されないため、必要なストレー
ジサイズを減らすことができ、処理上のオーバーヘッドも最低限に抑えられます。
非クラスタインデクサーのクラスタ化環境への移
行
現在のインデクサーセットをクラスタに移行することを計画している場合は、「クラスタ構成と非クラスタ構成の
Splunk デプロイの主な相違点」を注意深くお読みください。このトピックには、移行作業を開始する前に理解し
ておく必要がある問題点が記述されています。
任意の時点で、非クラスタインデクサーをクラスタに (ピアノードとして) 追加することができます。そのために
は、「ピアノードを有効にする」で明しているように、インデクサーをピアとして有効にします。
インデクサーをピアにすると、それは他のピアと同にクラスタに参加します。ピアに到着する新規データは、ク
ラスタの複製データ保持数にじて複製されます。また、ピアは他のピアからの複製データを受信する候補でもあ
ります。インデクサー上にすでに存在しているデータが自動的に複製されることはありませんが、後述するように
サーチには関与しています。
従来のデータの管理
「従来のデータ」とは、クラスタピアへの換前にインデクサー上に保管されていたデータを表しています。
クラスタによる従来のインデックスデータの処理
クラスタに既存のインデクサーを追加した場合、すでにインデクサー上に存在しているバケツは複製されません。
クラスタに追加する前からインデクサー上に存在していたバケツは、「スタンドアロン」のバケツと呼ばれていま
す。そのようなバケツにしてもサーチは行われ、クラスタ内の他の複製されたバケツからのサーチ結果と統合さ
れます。
従来のデータを移行する方法はありませんか？
スタンドアロンのバケツを複製象バケツに換するコストが高いため (クラスタの複製データ保持数とサーチ可能
データ保持数をたすために、複数のサーチ可およびサーチ不可コピーを作成する必要があるため)、一般的には換
することはお勧めできません (特に大量のスタンドアロンバケツを持つインデクサーの場合)。この換について
は、保証している換手順はありません。どうしても換する必要があるような場合は、Splunk プロフェッショナル
サービスにそのような作業のトレードオフや要件をお問い合わせください。
クラスタへの App の移行
現在の非クラスタ環境で、一連のインデクサーへの App の配布に、デプロイサーバーを使用している方もいるで
しょう。インデクサーをクラスタのピアノードに換したら、この方法は利用できなくなります。詳細は、「クラ
スタ構成と非クラスタ構成の Splunk デプロイの主な相違点」を参照してください。
ピアノードに App を配布するには、「共通のピア設定と App の更新」の明に従って設定バンドルを使用する必要
があります。App をマスターノード上の特別な場所に保管すると、最初にインデクサーをピアとして有効にした場
合に、マスターから各インデクサーにその App が配布されます。後ほど App を追加、更する必要がある場合は、
マスター上で適切な追加、更作業を行った後、マスターに更新された設定バンドルをピアセット全体に配布する
ように指示します。
設定バンドルを使う方法とデプロイサーバーを使う方法の比較については、「クラスタピア管理とデプロイサー
バーの比較」を参照してください。
65
重要：ピアノードに App を配布する場合は、設定バンドルを使用する必要があります。このような目的にデプロ
イサーバーを使用することはできません。
クラスタ App の制限事項
設定バンドルの一部として App をピアに配布する場合、非クラスタ App と比べて一定の制限事項があります。特
に、このようなクラスタ App は、サーチ時設定や Splunk Web コンポーネントをサポートしていません。詳細
は、「クラスタ App の制限事項」を参照してください。
App の移行方法
App はクラスタを有効にする際に移行することをお勧めします。そのための手順については、後述の明を参照し
てください。
重要：この手順を実施する前に、この章の前半に記載されている各トピックの内容を正しく理解しておく必要があ
ります。「デプロイの概要」からこのトピックまでの明を、あらかじめお読みになってください。
この手順は、デプロイサーバーのデプロイクライアントとして設定された一連のインデクサーセットが存在する、
分散サーチ環境を前提にしています。デプロイサーバーは、App とインデックス-時間設定をインデクサーにプッ
シュするために用いられています。これらのインデクサーを、クラスタのピアノードに換します。ピアノードに
換したら、それ以降デプロイサーバーを使ってそれらのピアに App をプッシュすることはできません。代わりに
設定バンドルを使用する必要があります。
クラスタを有効にする際に App を移行するには、以下の手順に従ってください。
1. 「マスターノードを有効にする」の明に従って、マスターを有効にします。
2. デプロイサーバー上で、マスターが移行予定のインデクサーに配布する一連の App を探します。これらの App
は、デプロイサーバーの $SPLUNK_HOME/etc/deployment-apps ディレクトリにあります。これらの App には、移行
する必要があるインデックス時設定が含まれていることを確認してください。無関係な設定からは、インデックス
時設定を削除することをお勧めします (一般的にはサーチ時設定)。
3. デプロイサーバーからこれらの App をクラスタマスターの $SPLUNK_HOME/etc/master-apps ディレクトリにコ
ピーします。master-apps ディレクトリの詳細は、「設定パンドルの構造」を参照してください。
4. 任意の indexes.conf にして、master-apps 内の各 App を調査します。これらのファイル内で、新たなインデッ
クスを定義しているスタンザを探してください。それらのスタンザにして、以下の属性/値のペアを追加します。
repFactor=auto
これにより、インデックスのレプリケーションが有効になります。詳細は、「indexes.conf の repFactor 属性」を
参照してください。
注意： App の作成者/保守管理者である場合は、この更を $SPLUNK_HOME/etc/masterapps/<appname>/default/indexes.conf 内で行うこともできます。
5. 各インデクサーをクラスタピアに、一度に 1 つずつ換していきます。
a.インデクサーがデプロイクライアントではなくなるように再設定します。
b.インデクサーの $SPLUNK_HOME/etc/apps ディレクトリにある App を削除します。
c.「ピアノードを有効にする」の明に従って、インデクサーをクラスタピアとして有効にします。
d.ピアを再起動して、有効化プロセスを完了します。
e. マスターが予定の App セットをピアの $SPLUNK_HOME/etc/slave-apps ディレクトリに配布したことを確認
します。
6. すべてのピアを有効にしたら、マスターダッシュボードに移動して、目的のインデックスセットが複製されてい
ることを確認します。このダッシュボードは、「マスターダッシュボードの表示」で明されています。
クラスタピアの設定の詳細は、以下のトピックを参照してください。
ピアインデックスの設定
ピアノードの設定
共通のピア設定と App の更新
クラスタのアップグレード
66
重要：すべてのクラスタコンポーネント (マスター、ピア、およびサーチヘッド) で、同じバージョンの Splunk が
動作していなければなりません。あるノードをアップグレードする場合は、残りもすべてアップグレードしてくだ
さい。
クラスタコンポーネントをアップグレードするには、標準の Splunk アップグレード手順に従ってください。ただ
し、以下で明するようにいくつかの例外があります。Splunk のアップグレードに関する一般的な情報について
は、「Splunk のアップグレード方法」を参照してください。
アップグレード順序
アップグレードは、以下の順序で順番に行ってください。
1. マスターノード。
2. すべてのピアノード。
3. サーチヘッド。
警告：すべてのクラスタコンポーネントのアップグレード準備が完了するまでは、アップグレード作業を開始しな
いでください。マスターをアップグレードしたけれどもピアをアップグレードしないと、クラスタにさまざまなエ
ラーや警告が発生します。
マスターノードのアップグレード
5.0.2 マスターのアップグレードの最後に、マスターはピアに新しいバージョンの設定バンドルを配布して、ピア
を再起動します。ピアが再起動されたら、即座にピアを 5.0.2 にアップグレードする必要があります。アップグ
レードするまでの間、ピアにはさまざまな警告やバンドル証エラーが発生する可能性があります。
マスターのアップグレード時には、以下のような要件を知らせるメッセージが表示されます。
CLUSTER MASTER UPGRADE DETECTED!
This instance is a cluster master. You must upgrade its set of cluster peers
(indexers) to match the new version immediately following the master upgrade.
IMPORTANT: Continuing with this migration causes the master to immediately
restart its set of peers to apply a new configuration bundle.
Would you like to continue? (y/n)
続行しない妥当な理由がない限りは、表示されるメッセージにして「y」を入力してください。「n」を入力する
と、マスターはアップグレードの最後に停止して、ピアの再起動は行いません。ピアのアップグレード準備が完了
するまでマスターの再起動を停止することはできますが、その場合クラスタはマスターなしで動作します。短期間
ならそのような状況も可能ですが、時間が過するにつれてエラーが発生する可能性が高くなっていきます。
どのような場合でも、ピアのアップグレードをらせることはお勧めできません。マスターのアップグレードを
ロールバックする手段はありません。そのため、ピアをアップグレードしない限り、ピアとマスターは同期されま
せん。それまでの間は、さまざまなエラーや警告が表示される可能性があります。
Windows ユーザーの場合：Windows でのマスターアップグレード時には、プロンプトは表示されません。アップ
グレードを開始すると、作業が完了するまで処理が行われ、最後にピアノードが再起動されます。
マスター停止時および再起動後の処理については、「マスターノード停止時の処理」を参照してください。
ピアノードのアップグレード
ピアノードのアップグレード時には、以下の事項に注意してください。
ピアのアップグレードにより、実行中のサーチが中断される可能性があります。
ダウンタイムやインデックス作成/サーチの中断をを最小限に抑えるために、ピアノードは一度に 1 つずつ
アップグレードしてください。
アップグレード前にピアを停止するには、offline コマンドを使用します。「ピアをオフラインにする」を
参照してください。十分なアップグレード期間を確保するために、restart_timeout 属性を編集して、再起
動時間を長くしなければならないこともあります。詳細は、適切なトピックを参照してください。
マスターのアップグレード時から、ピアのアップグレードの完了時までの間、クラスタにはさまざまな警告
やエラーが発生する可能性があります。　67
サーチヘッドのアップグレード
サーチヘッドアップグレード時のクラスタへの影響は、その作業中にサーチ中断の可能性があることのみです。
5.0.1 以前からのアップグレード
5.0.2 のアップグレード時に、$SPLUNK_HOME/etc/master-apps (マスター上) および $SPLUNK_HOME/etc/slave-apps
(ピア上) にある /cluster ディレクトリは、名前が /_cluster に更されます。この処理は自動的に行われます。こ
のディレクトリの詳細は、「共通のピア設定の更新」を参照してください。
5.0.2 へのアップグレード後にマスターを再起動すると、一連のピアノードの順次再起動が実施されます。これに
より、最新バージョンの設定バンドルがピアに配布されます (名前が更された /_cluster ディレクトリ)。
クラスタの設定
マスターの設定
マスターを有効にした時点でマスターの設定を行うことができます。「マスターノードを有効にする」を参照して
ください。一般的に、マスターで必要な設定はこれだけです。
デプロイ後の設定の実施
さらに詳細な設定を行う場合は、以下の方法を利用できます。
Splunk 管理の [クラスタリングを有効にする] ページで更を行う。マスターノードダッシュボードからのこ
のページの表示方法については、「マスターノードダッシュボードの表示」を参照してください。
マスターの server.conf ファイルで、[clustering] スタンザを直接編集する。詳細は、「server.conf による
クラスタコンポーネントの設定」を参照してください。一部の高度な設定は、このファイルを編集すること
によってのみ設定できます。
CLI の edit cluster-config コマンドを使用することができます。詳細は、「CLI によるクラスタの設定」
を参照してください。
警告：複製データ保持数とサーチ可能データ保持数を更することは可能ですが、クラスタに大量のデータが保管
された後に、これらの設定をやすことはお勧めできません。そうすると、数多くのバケツアクティビティが開始
され、バケツのコピー作成中/サーチ可コピーに換中の間、クラスタのパフォーマンスに影響を与えてしまいま
す。
Splunk サポートからの指示がない限り、heartbeat_timeout はデフォルト値の 60 (秒) から更しないでください。
特に、この値を減らしてはいけません。ピアが過負荷状態になる危険性があります。
マスター設定の更後は、更内容を反映するためにマスターを再起動する必要があります。
重要：マスターには、他のクラスタコンポーネントを管理する機能のみがあります。これを外部データのインデッ
クス作成やクラスタのサーチに利用することはできません。
スタンバイマスターの設定
現在マスターのフェイルオーバー機能はありませんが、プライマリマスターが何らかの理由で停止した場合に即座
に立ち上げることができる、スタンバイマスターを設定してマスター障害に備えることができます。
スタンバイマスターを準備する際には、マスターの静的状態しかバックアップする必要はありません。すべてのク
ラスタコピーの状態などのクラスタに関する動的情報は、すべてクラスタピアのグループが保持します。ピアはこ
の情報を必要にじてマスターノードとやり取りします (例：マスターがクラスタに復した場合、または停止したマ
スターをスタンバイマスターが引きいだ場合)。マスターはその情報を使って、クラスタの状態マップを再構築し
ます。
2 種類の個別の静的設定をバックアップする必要があります。
マスタークラスタの設定が保管されている、マスターの server.conf ファイル。マスターのクラスタ設定を
更した時は常にこのファイルをスタンバイマスターにコピーする必要があります。
「共通のピア設定の更新」で明しているように、共通のピア設定が保管されている、マスターの
$SPLUNK_HOME/etc/master-apps ディレクトリ。ピアノードに配布するコンテンツを更新した時には常に、こ
のディレクトリをスタンバイマスターにコピーする必要があります。
68
ピアノードとサーチヘッドがスタンバイインスタンスを探してそれをマスターとして認識するために、スタンバイ
マスターはプライマリマスターと同じ IP アドレスと管理ポートを使用する必要があります。管理ポートはインス
トール時に設定されますが、後ほど web.conf を編集して更することができます。スタンバイマスターが同じ IP
アドレスを使用するように、DNS ベースのフェイルオーバー、ロードバランサー、またはその他のテクニックを
採用する必要があります。
2 種類の静的設定をバックアップし、IP アドレスと管理ポートを正しく設定しておけば、停止したプライマリマス
ターからスタンバイマスターへの置換作業は簡単です。CLI の splunk start コマンドを使ってスタンバイマス
ターを起動するだけです。
ピアノードの設定
重要：このトピックをご覧になる前に、Splunk で設定ファイルがどのように機能するのかを理解しておく必要が
あります。『管理マニュアル』の「設定ファイルについて」およびそれに続くトピックを参照してください。
ピア設定作業の大半は、クラスタの初期デプロイ時に行われます。
1. ピアを有効にする際に、マスターおよび複製されたデータを受信するポートを指定します。「ピアノードを有効
にする」を参照してください。
2. 一連のピアセットを有効にしたら、必要にじてインデックスを設定します。「ピアインデックスの設定」を参
照してください。
3. 最後に、入力を設定します。通常は、フォワーダーを使用します。「フォワーダーを使ったデータの取り込み」
を参照してください。
これがピア設定の主要ステップです。ただし、後ほどピアの初期設定を更しなければならないこともあります。
たとえば、イベント処理を設定するために、props.conf および transforms.conf を編集する必要があります。App
をピアに配布しなければならないこともあります。ここでは、展開後のピア設定の更新方法について明していき
ます。
ベストプラクティスとして、ピアは交換可能なものとして取り扱う必要があります。そのためには、大部分の設定
ファイルを同じバージョンで、すべてのピアにして適用する必要があります。クラスタが正常にデータを複製し
て、ノードのフェイルオーバーを実施できるように、ピアは同じインデックス機能を共有する必要があります。ピ
ア間で一部の主要ファイルが異なっている場合、正常に処理を行うことができません。特に、一部の極めて限定さ
れた例外を除いて、indexes.conf 内の一連のインデックス関連スタンザは、すべてのピア間で同一でなければな
りません。また、インデックス-時間処理もすべてのピア間で同一でなければなりません。
ここでは、一連のピアでの同一の設定の維持管理方法について明していきます。また、必要にじて行うピア単位
の設定方法についても明しています。
すべてのピアの共通設定の管理
できる限り、クラスタ内のすべてのピアで共通の設定ファイルセットを使用するようにしてください。特に
indexes.conf はすべてのピアノードで同じでなければなりません。ピアは、同じクラスタ化インデックスセット
を共有する必要があります。すべてのピアにまたがって、同じ props.conf および transforms.conf ファイルを使
用することもお勧めします。これらの 3 つの主要ファイルだけでなく、その他の設定ファイルも同じバージョンを
すべてのピアで使用することにより、クラスタの管理を大幅に簡素化することができます。
App には同じバージョンの設定ファイルが含まれていることが多いため、たいていの場合は単一のピアに別個に
App をインストールするのではなく、クラスタ内のすべてのピアに App も配布する必要があります。詳細は、こ
のトピックの後半にある「すべてのピアへの App の配布方法」を参照してください。
重要：スタンドアロンのインデクサーの設定管理と比べて、共通のピア設定ファイルを管理する際にはいくつかの
重要な違いがあることを理解しておく必要があります。
クラスタ単位で管理する必要がある設定の更を、個別のピアで行わないでください。たとえば、Splunk 管
理や CLI を使ってインデックス設定を行わないでください。
ピア上で、indexes.conf などのクラスタ全体の設定ファイルを直接編集しないでください。代わりにマス
ター上のファイルを編集し、それをこのトピックの後半に記載している設定バンドルを使用して配布してく
ださい。詳細は、「共通のピア設定の更新」を参照してください。こうすることによってのみ、すべてのピ
アが同じバージョンのファイルを使用することが保証されます。
すべてのピアノードに共通の設定ファイルを管理する際に、デプロイサーバーは使用しないでください。代
わりに、設定バンドルを使用します。
すべてのピアにする indexes.conf の設定
69
データを複製するには、indexes.conf ファイルに定義されている一連のクラスタ化インデックスの設定を、クラ
スタ内のすべてのピアで同一にする必要があります。このファイルの設定方法については、「ピアインデックスの
設定」を参照してください。
注意：はは限定された環境下 (たとえば、ローカルテストまたは監視を実行) では、インデックスを 1 台のピアに
のみ追加し、他のピアには追加したくないような場合があります。インデックスの設定を注意深く行い、その結果
や影響について十分に理解している場合にのみ、ピア固有の indexes.conf を作成し、それを適用するようにして
ください。そのようなインデックス内のデータは複製されません。ピア固有の indexes.conf が補足的に使用され
ますが、すべてのピアが使用する共通バージョンの設定に代わることはありません。必要にじて同の方法で、ピ
ア固有の App を管理することができます。詳細は、後述の「単一ピアへのインデックスの追加」を参照してくだ
さい。
更新した設定のすべてのピアへの配布方法
新しいまたは編集した設定ファイルをすべてのピアに配布するには、まずマスター上の特別な場所にファイルを保
管します。次に、マスターにその場所にあるファイルをピアノードに配布するように指示します。すべてのピアに
共通の一連の設定ファイルセットは、設定バンドルと呼ばれています。設定バンドルはマスター上で管理され、単
一の操作でピアに配布できます。
この配布方法は、indexes.conf、props.conf、および transforms.conf に限定されるものではありません。同じ方
法を利用して、任意の同一の設定ファイルをすべてのピアに配布することができます。たとえば、すべてのピアが
単一のデータ入力セットを共有できる場合、この方法を使って共通の inputs.conf ファイルをすべてのピアに配布
することができます。
すべてのピアに設定を配布する方法の詳細は、「共通のピア設定の更新」を参照してください。
注意：別の配布方法を使って更新を配布することも可能ですが、お勧めすることはできません。設定バンドルを利
用して更新を配布する場合、マスターが配布を担当して、すべてのピアが同じクラスタ化インデックスセットも含
む一連の設定を使用するように設定します。他の配布方法を使用する場合は、新しいインデックスにデータの送信
を開始する前に、新たにクラスタ化されたインデックスの設定がすべてのピアに正常に配布されたこと、およびす
べてのピアが再起動されたことを確認する必要があります。
すべてのピアへの App の配布方法
すべてのピアに App を配布するには、各設定ファイルを配布する場合と同じように、まずマスター上の特別な場
所に App を保管します。App は設定バンドルの一部となります。準備が完了したら、設定バンドル全体をピア
ノードに配布するように、マスターノードに指示します。
重要：App を配布する前に、その indexes.conf ファイルを調査してください。App 固有の indexes.conf ファイ
ルに定義されている各インデックスにして、インデックスが各クラスタピアに複製されるよう
に、repFactor=auto を明示的に設定する必要があります。詳細は、「indexes.conf の repFactor 属性」を参照して
ください。
App の準備とすべてのピアへの配布方法については、「共通のピア設定の更新」を参照してください。
重要：クラスタ App は、非クラスタ App と比べて一定の制限事項があります。詳細は、「クラスタ App の制限事
項」を参照してください。
ピア単位での設定の管理
一部の設定をピア単位で管理しなければならないこともあります。それでも、たいていの場合は、ピアを相互交換
できるようにすべてのピアで同じ設定を使用することをお勧めします。
データの取り込み (データ入力 ) の設定
ピアにデータを取り込むには、フォワーダーを使用することをお勧めします。詳細は、「フォワーダーを使った
データの取り込み」を参照してください。
フォワーダーを利用せずにデータをピアに直接取り込みたい場合は、インデクサーにして設定する場合と同じ方
法でピアにデータの取り込み方法を設定します。詳細は、『Getting Data In Manual』の「Configure your inputs」
を参照してください。
重要：データ取り込みの設定はピア単位に行えますが、すべてのピアで同じデータ取り込み設定を使用できるかど
うかを討するようにしてください。すべてのデータがフォワーダーにより中されており、すべてのピアの受信
ポートが同じ場合は、そうすることが可能になります。そのような場合は、マスターノードで共通の inputs.conf
ファイルを管理できます。「共通のピア設定の更新」を参照してください。
単一ピアへのインデックスの追加
70
インデックスを単一のピアに追加する必要がある場合は、ピア上に個別の indexes.conf ファイルを作成します。
ただし、その新たなインデックスのデータはそのピアにのみ保管され、他のピアに複製されることはありません。
この方法は主にローカルでのテストやモニター目的で使用されます (当該ピアにのみダウンロードした特定の App
を利用したテストなど)。ピア固有の indexes.conf が補足的に使用されますが、すべてのピアが使用する共通バー
ジョンの設定に代わることはありません。
1 台のピアにして indexes.conf のバージョンを作成する場合、それをインデクサー内で許可されている任意の場
所に配置できます。『管理マニュアル』の「設定ファイルについて」を参照してください。このファイルを保管し
てはいけない場所の 1 つとして、$SPLUNK_HOME/etc/slave-apps がげられます。ここには、ピアの設定バンドルが
保管されています。ここにファイルを保管した場合、次回の設定バンドルのダウンロード時にそのファイルが上書
きされてしまいます。
重要：ローカルインデックスを追加した場合、その repFactor 属性はデフォルト値の 0 のまま使用してくださ
い。auto を設定しないでください。auto を設定すると、ピアはクラスタ内の他のピアへのインデックスデータの
複製を試みます。他のピアには新たなインデックスに関する設定が行われていないため、それらのピア上に複製
データの保管場所は存在せず、さまざまな問題、時には深刻な問題が発生してしまいます。また、次にマスターが
ピアへの設定バンドルの配布を試みる際に、不適切な設定のインデックスを持つピアがマスターにバンドル証エ
ラーを返し、ピアに正しくバンドルを適用できなくなってしまいます。
その他の設定の更
個別のピアで他の設定をピア固有の値に更する必要がある場合、クラスタ構成かどうかにかかわらず、他の
Splunk インスタンスと同じ方法でピアを設定することができます。Splunk 管理や CLI を使ったり、直接設定ファ
イルを編集したりすることができます。
ピアの再起動
他のインデクサーと同に、通常は設定を更したらピアを再起動する必要があります。ただし、非クラスタ構成の
インデクサーとは異なり、ピアの再起動に CLI の splunk restart コマンドを使用することはできません。代わり
に Splunk 管理の再起動機能を使用してください。クラスタピアの再起動方法の詳細は、「クラスタピアの再起
動」を参照してください。
ピアインデックスの設定
インデックスの設定は、indexes.conf ファイルを編集することで行います。このファイルは、インデクサーの一連
のインデックス、およびバケツのサイズと属性を決定します。クラスタ内のすべてのピアが同じインデックスセッ
トを使用する必要があるため (後述する特定の目的がある場合を除く)、通常すべてのピアで indexes.conf ファイ
ルを同じにする必要があります。
注意：たいていの Splunk 設定ファイルのように、indexes.conf ファイルの複数のバージョンを用意して、それぞ
れのファイルを Splunk インスタンスの個別のディレクトリに配置することができます。設定ファイルおよび複数
バージョンの処理方法の詳細は、「設定ファイルについて」を参照してください。
クラスタピアは、基本的なクラスタのニーズを取り扱うデフォルトの indexes.conf ファイルでデプロイされま
す。インデックスを追加、またはバケツの動作を更する場合は、マスター上の特別な場所に存在している
indexes.conf ファイルを編集して、そのファイルをすべてのピアに同時に配布します。
重要：Splunk 管理または CLI を使ってピアノードのインデックス設定を更することはできません。indexes.conf
を直接更する必要があります。
すべてのピアが同じ indexes.conf ファイルセットを使用する必要が
あります
通常 indexes.conf ファイルセットは、クラスタ内のすべてのピアで同一でなければなりません。特に、すべての
ピアが同じクラスタ化されたインデックスセットを使用する必要があります。これは、インデックスレプリケー
ションが正常に機能するための必須事項です。(一方、マスターノードは自己の内部データのみのインデックスを
作成するため、独自の indexes.conf ファイルを使用します。)この制限事項には、後述するように限定的な例外事
項があります。
クラスタを最初に作成する場合、マスターは各ピアにデフォルトの indexes.conf ファイルを配布します。この
バージョンの indexes.conf は、クラスタのピア向けに特別に設計されています。デフォルトの indexes.conf
は、main (デフォルト) インデックス、および_audit や _internal などの内部インデックスのレプリケーションを
オンにします。
システムによっては、追加のインデックスやバケツ属性の更を適用するために、更された indexes.conf のイン
デックス/バケツ属性をさらに編集して、ピアに配布しなければならないこともあります。すべてのピアが同じ
indexes.conf を使用するように、マスターノードを使ってすべてのピアに一度にファイルを配布する必要があり
71
ます。この設定バンドルを使用する方法については、「共通のピア設定の更新」を参照してください。
他の配布方法を使ってすべてのピアに indexes.conf ファイルを配布することも可能ですが、推できるのは設定バ
ンドルを利用する方法のみで、またこの方法しかサポートされていません。この方法を利用する場合、すべてのピ
アがおなじクラスタ化インデックスセットを持つように、マスターが配布を担当します。他の配布方法を使用する
場合、新しいインデックスにデータの送信を開始する前に、新たにクラスタ化されたインデックスの設定がすべて
のピアに正常に配布されたこと、およびすべてのピアが再起動されたことを確認する必要があります。
設定バンドルを使って、すべてのピアに App を配布することもできます。これらの App には独自の indexes.conf
ファイルが含まれている場合もあります。このファイルは、App 外の他のバージョンのファイルと共存して処理が
行われていることもあり、そのような場合は他のピアにも配布する必要があります。App 配布の詳細は、「すべて
のピアへの App の配布方法」を参照してください。
注意：限定された環境下では (たとえば、ローカルテストや監視を行うために)、ピアに固有のインデックスを設定
する、ピア固有の indexes.conf を作成することもできます。ただし、そのようなインデックスは複製されませ
ん。ピア固有の indexes.conf が補足的に使用されますが、すべてのピアが使用する共通バージョンの設定に代わ
ることはありません。詳細は、「単一ピアへのインデックスの追加」を参照してください。
ピアのインデックスセットの設定
一連のピアにまたがるインデックスを設定する作業は、2 つのステップから成り立っています。
1. マスターノードの indexes.conf を編集します。「indexes.conf の編集」を参照してください。
2. マスターを使って、一連のピアにファイルを配布します。「新しい indexes.conf ファイルのピアへの配布」を
参照してください。
これらの 2 つのステップの詳細を以下に示します。
indexes.conf の編集
の設定方法の詳細は、このマニュアルの「インデックスの管理」および「インデックスストレージ
の管理」を参照してください。indexes.conf の属性の一覧については、『管理マニュアル』の indexes.conf に関
する明を参照してください。
indexes.conf
大部分は、他の Splunk インデクサーと同に、クラスタピアの indexes.conf を編集します。ただし、いくつかの
違いに注意する必要があります。
indexes.conf の repFactor 属性
新しいインデックススタンザを追加する場合、repFactor に auto を設定する必要があります。これにより、イン
デックスのデータがクラスタ内の他のノードに複製されます。例：
[newindex]
repFactor=auto
homePath=<path for hot and warm buckets>
coldPath=<path for cold buckets>
thawedPath=<path for thawed buckets>
...
スラッシュディレクトリ区切り文字による homePath と coldPath の指定
異種混在環境では、マスターノードの OS でディレクトリパスの指定に、ピアノードの OS とは異なる表記規則を
使用している場合があります。indexes.conf ファイルはマスターノード上で編集し、次にそれをピアに配布する
ため、このことが問題になる可能性があります。
たとえば、マスターノードで Windows、ピアで Linux を使用している場合に、通常 Windows マスターで
homePath を指定する際には、ディレクトリ区切り文字として円記号を使用します。しかし、Linux ピアに配布する
ファイルには、ディレクトリ区切り文字としてスラッシュを使用する必要があります。
この問題に処するために、マスターやピアが使用しているオペレーティングシステムの種類に関係な
く、homePath および coldPath でディレクトリパスを指定する時には、常にスラッシュを使用することをお勧めし
ます。例：
homePath = $SPLUNK_HOME/var/lib/splunk/defaultdb/db/
Splunk は常に、スラッシュをディレクトリ区切り文字として認識します。
インデックスボリュームを使ったストレージ管理の簡素化
72
重要：このサブトピックを理解するためには、「ストレージの討事項」に記述されている、クラスタストレージ
要件の詳細を学んでおく必要があります。
インデックスボリュームは、複数のインデックスにまたがってストレージサイズを指定するための手な手段を提
供しています。ボリュームは他のインデックス設定と同に、indexes.conf に指定します。インデックスボリュー
ムの詳細と指定方法については、「ボリュームによるインデックスサイズの設定」を参照してください。
このセクションに記載されている使用事例の他に、ボリュームを使ってインデックスセット全体のホット/ウォー
ムおよびコールドデータの合計サイズを指定することもできます。この方法は特にクラスタで役立ちます。クラス
タでは複製されたデータがコールドデータベースに保管され、あるピアノードに存在する元のデータと複製データ
の合計を予測することが困難です。ホット/ウォームおよびコールドデータベース全体にして単一のボリュームを
指定することにより、インデックスが各ピア上で占有する総合的なストレージ量を制御することができます。ただ
し、特定の種類のバケツの使用量は制御できません。
2 つのインデックスにして、すべてのバケツ (オリジナルと複製) の合計ストレージサイズの指定にボリュームを
使用した例を以下に示します。
[volume:cluster1]
path = /mnt/big_disk
maxVolumeDataSizeMB = 300000
[idx1]
repFactor=auto
homePath = volume:cluster1/idx1/db
coldPath = volume:cluster1/idx1/colddb
thawedPath=<path for thawed buckets>
[idx2]
repFactor=auto
homePath = volume:cluster1/idx2/db
coldPath = volume:cluster1/idx2/colddb
thawedPath=<path for thawed buckets>
この設定は indexes.conf の一部で、クラスタ内のすべてのピアで同一でなければならないため、ボリュームの
path はすべてのピアで正常に機能する手段で指定する必要があります。(すべてのピアが同じ物理ストレージを使
用する必要があるのではなく、指定するパス参照が各ピア上で適切に解釈される必要があります。)また、ボ
リュームを使って解凍パスを指定することはできません。
注意：クラスタ内のホット/ウォーム/コールドデータベースは同じパフォーマンス特性を持つ必要があるため、ク
ラスタ化ストレージでこのアプローチは適切に機能しますが、非クラスタ構成インデクサーの場合、コールドデー
タベースには低速なストレージが使われる可能性があるため、この方法の使用はお勧めできません。詳細は、「ボ
リュームによるインデックスサイズの設定」を参照してください。
新しい indexes.conf ファイルのピアへの配布
を編集したら、それをクラスタの一連のピアノードに配布する必要があります。indexes.conf を含
めた設定ファイルのすべてのピアへの配布方法については、「共通のピア設定の更新」を参照してください。
indexes.conf
App の配布も含めたその他の種類のピア設定については、「ピアノードの設定」を参照してください。
サーチヘッドの設定
他のクラスタコンポーネントを有効にするのと同時に、サーチヘッドも設定して、有効にする必要があります。
「サーチヘッドを有効にする」を参照してください。クラスタの一連のピアノードは、自動的にサーチヘッド
のサーチピアとして指定されます。
基本的には、有効化プロセスでデフォルトの設定を使用することができます。ただし、サーチヘッドに複数のクラ
スタにまたがったサーチを実行させたい場合は、後述するように直接 server.conf を編集する必要があります。
また、サーチヘッドプーリングやマウントされたバンドルなどの、分散サーチの高度な機能を使用したい場合は、
サーチヘッド上で distsearch.conf を編集する必要があります。詳細設定も含めたサーチヘッドの詳細は、
『Distributed Deployment Manual』の「Search across multiple indexers」を参照してください。その章は、主に
非クラスタ環境について明していますが、クラスタ環境におけるサーチヘッドの高度な機能の設定に関する情報
も記載されています。
複数クラスタサーチの設定
複数のクラスタが存在する場合、すべてのクラスタにまたがってサーチを実行するようにサーチヘッドを設定する
ことができます。この設定を行うには、サーチヘッドの server.conf ファイルを編集して、master_uri 属性にマ
73
スターノード参照のカンマ区切りリストを指定し、その後に各マスターのスタンザを個別に指定します。例：
[clustering]
mode = searchhead
master_uri = clustermaster:east, clustermaster:west
[clustermaster:east]
master_uri=https://SplunkMaster01.example.com:8089
pass4SymmKey=someSecret
[clustermaster:west]
master_uri=https://SplunkMaster02.example.com:8089
この例でサーチヘッドは、SplunkMaster01 との通信時に pass4SymmKey 「someSecret」を使用しますが、
SplunkMaster02 との通信時には pass4SymmKey を使用しません。
server.conf
を編集したら、更内容を反映するためにサーチヘッドを再起動する必要があります。
複数クラスタサーチの設定方法の詳細は、server.conf ファイルの仕を参照してください。server.conf を使った
クラスタの設定方法の詳細は、「server.conf によるクラスタの設定」を参照してください。
注意：この設定は、直接 server.conf に行う必要があります。Splunk 管理や CLI を使って複数クラスタサーチを
設定することはできません。
クラスタ化サーチヘッドと非クラスタ化サーチヘッドの違い
クラスタ化サーチヘッドと非クラスタ化サーチヘッドでは、大部分の設定や機能は同じです。高度な機能を利用す
るために詳細設定を行うには、distsearch.conf を編集します。
主な違いは、クラスタの場合、クラスタ有効化プロセスの一環として、サーチヘッドとサーチピアが自動的に相互
接続されることです。自動出を有効にするために、distsearch.conf の設定を行う必要はありません。
クラスタ構成のサーチヘッドでは、他にもいくつかの属性が無効になります。特に、クラスタ構成のサーチヘッド
は、distsearch.conf 内の以下の属性を無視します。
servers
disabled_servers
heartbeatMcastAddr
heartbeatPort
heartbeatFrequency
ttl
checkTimedOutServersFrequency
removedTimedOutServers
autoAddServers
注意：非クラスタ環境のように、サーチピアへのサーチヘッドのアクセスは、公開鍵認証により管理されます。た
だし、鍵を手動で配布する必要はありません。サーチヘッドは自動的に公開鍵をサーチピアにプッシュします。
分散サーチの [管理 ] ページ
Splunk 管理の分散サーチページを使ってクラスタ構成のサーチヘッドを設定することはできません。ただし、
サーチヘッド上で当該ページに移動して、すべてのサーチピアのリストを表示することができます。
マウントされたバンドルおよびサーチピアの設定
設定の大半は、サーチヘッドでのみ有効になります。ただし、マウントされたバンドルを導入す
るには、サーチピアにも distsearch.conf ファイルを配布する必要があります。クラスタの場合、マスターノード
を使ってピアにこのファイルを配布する必要があります。マスターノードを使ったピア設定の管理方法について
は、このマニュアルの「ピアノードの設定」を参照してください。マウントされたバンドルの設定方法について
は、『Distributed Deployment Manual』の「Mount the knowledge bundle」を参照してください。
distsearch.conf
詳細設定
server.conf によるクラスタの設定
たいていの場合は、「クラスタのデプロイ」で明しているように、Splunk 管理からクラスタノードを有効にする
のが一番手な方法です。Splunk 管理でノードを有効にする場合、設定はノードの
$SPLUNK_HOME/etc/system/local/ にある server.conf ファイルに保存されます。また、server.conf ファイルを直
74
接編集して、ノードを有効にしたり、クラスタ設定を更することも可能です。
クラスタを制御する server.conf のメインスタンザは、[clustering] です。有効化を制御する基本属性や Splunk
管理で利用できる設定の他に、server.conf を利用してさまざまな高度なクラスタ設定を行うことができます。こ
れらの属性を更するには、server.conf を直接編集する必要があります。
スタンザの他にも、クラスタは [replication_port] スタンザを使用して、ピアが複製データを待機
するポートを指定します。
[clustering]
このトピックでは、基本的なクラスタノード有効化に関する属性と、Splunk 管理における設定について取り上げ
ていきます。詳細設定も含めたすべてのクラスタ属性の詳細は、server.conf の仕を参照してください。
クラスタノードを有効にする
各ノードタイプの単純なクラスタ有効化を行う、クラスタリングスタンザのサンプルを以下に示します。これらの
例に記載されている設定属性は、Splunk 管理の [クラスタリングを有効にする] ページのフィールドにしていま
す。
注意：Splunk 管理でクラスタノードを設定する場合、結果となる server.conf スタンザには非デフォルト値の属
性のみが含まれます。たとえば、Splunk 管理でマスターノードを有効にする場合、複製データ保持数のデフォル
ト値 3 を使用して、新しい値を指定しない場合、スタンザに replication_factor 属性は含まれません。
マスターノード
マスターノードの基本設定例を以下に示します。
[clustering]
mode = master
replication_factor = 4
search_factor = 3
pass4SymmKey = whatever
この例では、以下の事項を指定しています。
Splunk インスタンスはクラスタマスターノード。
クラスタの複製データ保持数は 4。
クラスタのサーチ可能データ保持数は 3。
秘密鍵は「whatever」。
ピアノード
ピアノードの設定例を以下に示します。
[replication_port://9887]
[clustering]
master_uri = https://10.152.31.202:8089
mode = slave
pass4SymmKey = whatever
この例では、以下の事項を指定しています。
ピアはポート 9887 で他のピアから転送される複製データを待機。
ピアのクラスタマスターの場所は 10.152.31.202:8089。
Splunk インスタンスはクラスタピアノード。
秘密鍵は「whatever」。
サーチヘッド
サーチヘッドの設定例を以下に示します。
[clustering]
master_uri = https://10.152.31.202:8089
mode = searchhead
pass4SymmKey = whatever
この例では、以下の事項を指定しています。
ピアのサーチヘッドの場所は 10.152.31.202:8089。
Splunk インスタンスはクラスタサーチヘッド。
75
秘密鍵は「whatever」。
注意：複数クラスタサーチは、server.conf を編集して有効にすることもできます。詳細は、「複数クラスタサー
チの設定」を参照してください。
秘密鍵の設定
必要にじて pass4SymmKey を指定して、マスター、ピア、およびサーチヘッド間の認証を行うための秘密鍵を設定
することができます。あるクラスタノードにこれを設定した場合は、他のすべてのクラスタノードにも同じ値を指
定する必要があります。
鍵の使用をクラスタ機能のみに限定する場合は、[clustering] スタンザ内に鍵を指定します。[general] スタンザ
内に pass4SymmKey を指定した場合、優先設定として [clustering] にも鍵を指定しない限り、この鍵はクラスタ機
能とライセンス機能の両方で有効になります。設定スタンザ内で属性を複数回指定した場合、より固有な設定が全
般的な設定に優先されます。そこで、[general] スタンザと [clustering] スタンザに鍵を指定した場合、クラス
タ機能は [clustering] の設定を使用して、ライセンス機能は [general] の設定を使用します。
クラスタノードの再起動
Splunk インスタンスをクラスタノードとして設定したら、更内容を有効にするためにそれらすべて (マスター、
ピア、およびサーチヘッド) を再起動する必要があります。このためには、各ノードで CLI の restart コマンドを
実行します。
$SPLUNK_HOME/bin/splunk restart
マスターを初めて起動した場合、複製データ保持数と同じ数のピアを有効にして再起動するまでは、ピアにおける
インデックス作成がマスターによりブロックされます。
'重要：最初に Splunk インスタンスをクラスタピアノードとして有効にするためには、CLI の restart コマンドを
使用することができますが、それ以降の再起動には、このコマンドを使用しないでください。いったんインデック
スレプリケーションが開始されると、restart コマンドはレプリケーションとの互換性がありません。安全な再起
動方法など、その他の情報については、「クラスタピアの再起動」を参照してください。
警告：マスター上で複製データ保持数またはサーチ可能データ保持
数をやさないでください
で複製データ保持数とサーチ可能データ保持数を更することは可能ですが、クラスタに大量のデータ
が保管された後に、これらの設定をやすことはお勧めできません。そうすると、数多くのバケツアクティビティ
が開始され、バケツのコピー作成中/サーチ可コピーに換中の間、クラスタのパフォーマンスに影響を与えてしま
います。
server.conf
CLI を使ったクラスタの設定
Splunk CLI を使って、さまざまなクラスタアクティビティを実施することができます。以下に例を示します。
クラスタノードを有効にする
クラスタ設定の編集
クラスタ情報の表示
クラスタの管理
一部のクラスタリングコマンドは、マスターノードでのみ利用できます。それ以外のコマンドは、ピアノードでの
み利用できます。
CLI コマンドのヘルプ
CLI には、クラスタリングコマンド用にオンラインヘルプが用意されています。クラスタリングコマンドの全般的
なヘルプについては、$SPLUNKHOME/bin で以下のコマンドを入力してください。
splunk help cluster
特定のコマンドのヘルプについては、コマンド名を指定します。例：
76
splunk list cluster-config
CLI の全般情報については、『管理マニュアル』の「Splunk のコマンドラインインターフェイス (CLI)」を参照す
るか、または以下のコマンドを入力します。
splunk help
クラスタノードを有効にする
Splunk インスタンスをクラスタノードとして有効にするには、edit cluster-config コマンドを使用します。イ
ンスタンスを有効にしたら、それを再起動する必要があります。
マスターノードを有効にする
Splunk インスタンスをマスターノードとして有効にするには、mode に「master」を設定して、必要にじて他のク
ラスタオプションも指定します。
splunk edit cluster-config -mode master -replication_factor 4 -search_factor 3
splunk restart
重要：マスターを初めて起動した場合、すべてのピア (複製データ保持数と同じ数のピア) を有効にして再起動す
るまでは、ピアにおけるインデックス作成がマスターによりブロックされます。
ピアノードを有効にする
Splunk インスタンスをピアノードとして有効にするには、mode に「slave」を設定します。また、master_uri お
よび replication_port も指定する必要があります。
splunk edit cluster-config -mode slave -master_uri https://10.160.31.200:8089 -replication_port 9887
splunk restart
サーチヘッドを有効にする
Splunk インスタンスをサーチヘッドとして有効にするには、mode に「searchhead」を設定します。ま
た、master_uri も指定する必要があります。
splunk edit cluster-config -mode searchhead -master_uri https://10.160.31.200:8089
splunk restart
クラスタ設定の編集
ノードを有効にした後は、edit cluster-config コマンドを使って、クラスタノードの設定を更することができま
す。設定可能な項目については、CLI のヘルプおよび server.conf 仕ファイルを参照してください。
クラスタ情報の表示
各種クラスタ情報を返すさまざまな list コマンドが用意されています。たとえば、クラスタ内の各ピアの詳細情
報を取得するには、マスター上で以下のコマンドを実行します。
splunk list cluster-peers
クラスタ設定に関する情報を取得するには、任意のノードから以下のコマンドを実行します。
splunk list cluster-config
list
コマンドの全一覧については、CLI のクラスタリングに関するヘルプを参照してください。
クラスタの管理
CLI を使って、クラスタ上でさまざまなアクションを実行することができます。これらのアクションについては、
それぞれのトピックで明されています。
77
ピアをオフラインにするには、offline コマンドを使用します。
共通のピア設定を更新するには、apply cluster-bundle コマンドを使用します。
すべてのクラスタピアを再起動するには、rolling-restart コマンドを使用します。
クラスタの管理
マスターダッシュボードの表示
このダッシュボードには、クラスタ全体のステータスに関する詳細情報が表示されます。ここから、マスターの各
ピアノードの情報を参照することもできます。
他のクラスタリングダッシュボードの詳細は、以下の項目を参照してください。
ピアダッシュボードの表示
サーチヘッドダッシュボードの表示
ダッシュボードへのアクセス
マスターノードのダッシュボードを表示するには：
1. マスターノード上で、Splunk Web の [管理] をクリックします。
2. [分散環境] セクションで、[クラスタリング] をクリックします。
このダッシュボードは、すでにマスターとして有効にされた Splunk インスタンス上でのみ表示できます。
ダッシュボードの表示
マスターダッシュボードには、以下のセクションが存在しています。
マスターノード詳細
クラスタの概要
ピア詳細
インデックス詳細
また、ダッシュボードの上部には [設定] ボタンがあります。このボタンをクリックして、マスターの設定を更す
ることができます。ただし、以下の警告に注意してください。
警告：複製データ保持数とサーチ可能データ保持数を更することは可能ですが、クラスタに大量のデータが保管
された後に、これらの設定をやすことはお勧めできません。そうすると、数多くのバケツアクティビティが開始
され、バケツのコピー作成中/サーチ可コピーに換中の間、クラスタのパフォーマンスに影響を与えてしまいま
す。
78
マスターノード詳細
このダッシュボードは以下の情報を提供しています。
マスター名：ピアの $SPLUNK_HOME/etc/system/local/server.conf ファイルに指定されている、マスターの
serverName。
複製データ保持数：クラスタの複製データ保持数。
サーチ可能データ保持数：クラスタのサーチ可能データ保持数。
クラスタの概要
[クラスタの概要] には、クラスタのヘルス情報が簡単にまとめられています。以下のような情報が表示されます。
クラスタがサーチ可かどうか。
サーチ可ピア数。
サーチ可インデックス数。
クラスタのヘルス状態にじて、以下のような警告メッセージが表示されることもあります。
ピアが設定されていません。
ピアが停止しています。
複製データ保持数をたしていません。
サーチ可能データ保持数をたしていません。
[クラスタの概要] に表示されている情報の詳細については、ダッシュボードの [ピア詳細] および [インデックス詳
細] セクションを参照してください。
ピア詳細
マスターダッシュボードには、各ピアにする以下の情報が表示されます。
ピア名：ピアの $SPLUNK_HOME/etc/system/local/server.conf ファイルに指定されている、ピアの
serverName。
サーチ可：ピアが現在サーチ可かどうかを表しています。
79
ステータス：ピアのステータス。ここで明しているプロセスの詳細は、「ピアをオフラインにする」を参照
してください。可能な値：
Up
3 回のハートビートを受信しなかった場合に発生します。こ
れは一時的な状態で、ピアが長時間この状態になることはほとんどありません。
Detention：ピアのリソースに制約がある場合 (例：ディスクスペースを使い切った)、制限状態に移行
します。この状態の間、ピアは入力を受け付けません。ただし、サーチには参加します。
Restarting：enforce-counts フラグを指定せずに offline コマンドを実行すると、ピアは
ReassigningPrimaries 状態から一時的にこの状態に移行します。restart_timeout に指定されている
期間、この状態が持続します (デフォルトは 10 分)。この時間内にピアを再起動しない場合、ピアは
Down 状態に移行します。ローリング再起動中または Splunk 管理から再起動した場合にも、ピアはこの
状態に移行します。
ShuttingDown：マスターが、ピアがシャットダウン中であることを出しました。
ReassigningPrimaries：enforce-counts フラグを指定せずに offline コマンドを実行した場合、ピア
は一時的にこの状態に移行します。
Decommissioning：offline コマンドに enforce-counts フラグを指定して実行すると、ピアはこの状態
に移行します。この状態は、すべてのバケツ修復が完了し、ピアがシャットダウンできるようになる
までの間維持されます。
GracefulShutdown：offline コマンドに enforce-counts フラグを指定して実行した場合、正常に離脱
が完了してシャットダウンした場合にこの状態に移行します。オフラインになっている間はこの状態
が続します。
Down：ピアは離脱以外の理由でオフラインになった場合、この状態に移行します。enforce-counts フ
ラグを指定せずに offline コマンドを実行し、ピアのシャットダウンが restart_timeout に指定され
た期間 (デフォルトは 10 分) 内に行われなかった場合、またはピアがその他の理由 (例：ピアがクラッ
シュした) でオフラインになった場合にそうなります。
バケツ：ピアがコピーを保有しているバケツ数です。
Pending：マスターがピアから、連続して
任意のピアに関する詳細情報を取得するには、ピア名をクリックします。この操作により、以下に明するピアの
ダッシュボードのマスター版が表示されます。
インデックス詳細
このセクションには、クラスタのインデックスが表示されます。各インデックスにして、以下のフィールドが表
示されます。
索引：インデックス名。内部インデックス名の先頭には、アンダースコア (_) が付けられています。
サーチ可：インデックスがサーチ可かどうか。つまり、各バケツの最低 1 つのサーチ可コピーを保有してい
るかどうかを表しています。インデックス内のバケツのサーチ可コピーが 1 つもない場合は、インデックス
はサーチ不可であると報告されます。
複製コピー数：クラスタが保有するインデックスのコピー数。各コピーは完全で、失われているバケツがな
い状態でなければなりません。クラスタの複製データ保持数よりもコピー数が少ない場合は、警告のアイコ
ンが表示されます。
サーチ可コピー数：クラスタが保有するインデックスの完全なサーチ可コピー数。クラスタのサーチ可能
データ保持数よりもコピー数が少ない場合は、警告のアイコンが表示されます。たとえば、サーチ可能デー
タ保持数が 2 の時に、2つあるはずのサーチ可コピーの 1 つが失われている場合、警告アイコンが表示され
ます。
バケツ：インデックス内のバケツ数。
サイズ：ホットバケツを除くインデックスサイズ。
インデックスのリストには、内部インデックスの _audit と _internal が含まれます。これらの内部インデックスに
は、クラスタ内のすべてのピアが生成したデータがまとめられています。ある 1 台のピアが生成したデータをサー
チする必要がある場合、ピアのホスト名でサーチすることができます。
ピアノードダッシュボードのマスタービューへのアクセス
このダッシュボードには、ピアノードのステータスに関する詳細情報が表示されます。このバージョンのダッシュ
ボードには 2 ヶ所からアクセスできます。
マスターノード上：前のセクションで明したように、マスターダッシュボードでピア名をクリックします。
当該ピアノード上：「ピアダッシュボードの表示」を参照してください。
マスターバージョンのピアダッシュボードの例を以下に示します。
80
ダッシュボードには、ピアのステータスに関する情報が表示されます。
場所：ピアの IP アドレスとポート番号。
前回ハートビート：マスターが前回にピアからハートビートを受信した時刻。
複製ポート：ピアが他のピアから複製されたデータを受信するポートです。
ステータス：ピアのステータス。ここで明しているプロセスの詳細は、「ピアをオフラインにする」を参照
してください。可能な値：
Up
3 回のハートビートを受信しなかった場合に発生します。こ
れは一時的な状態で、ピアが長時間この状態になることはほとんどありません。
Detention：ピアのリソースに制約がある場合 (例：ディスクスペースを使い切った)、制限状態に移行
します。この状態の間、ピアは入力を受け付けません。ただし、サーチには参加します。
Restarting：enforce-counts フラグを指定せずに offline コマンドを実行すると、ピアは
ReassigningPrimaries 状態から一時的にこの状態に移行します。restart_timeout に指定されている
期間、この状態が持続します (デフォルトは 10 分)。この時間内にピアを再起動しない場合、ピアは
Down 状態に移行します。ローリング再起動中または Splunk 管理から再起動した場合にも、ピアはこの
状態に移行します。
ShuttingDown：マスターが、ピアがシャットダウン中であることを出しました。
ReassigningPrimaries：enforce-counts フラグを指定せずに offline コマンドを実行した場合、ピア
は一時的にこの状態に移行します。
Decommissioning：offline コマンドに enforce-counts フラグを指定して実行すると、ピアはこの状態
に移行します。この状態は、すべてのバケツ修復が完了し、ピアがシャットダウンできるようになる
までの間維持されます。
GracefulShutdown：offline コマンドに enforce-counts フラグを指定して実行した場合、正常に離脱
が完了してシャットダウンした場合にこの状態に移行します。オフラインになっている間はこの状態
が続します。
Down：ピアは離脱以外の理由でオフラインになった場合、この状態に移行します。enforce-counts フ
ラグを指定せずに offline コマンドを実行し、ピアのシャットダウンが restart_timeout に指定され
た期間 (デフォルトは 10 分) 内に行われなかった場合、またはピアがその他の理由 (例：ピアがクラッ
シュした) でオフラインになった場合にそうなります。
Pending：マスターがピアから、連続して
ピアダッシュボードの表示
このダッシュボードには、ピアノードのステータスに関する詳細情報が表示されます。このバージョンのダッシュ
ボードには 2 ヶ所からアクセスできます。
マスターノード上：詳細は、「ピアノードダッシュボードのマスタービューへのアクセス」を参照してくだ
さい。
ピアノード自体 (このトピックで明されています)。
ピアダッシュボードへのアクセス
ピアノードのダッシュボードを表示するには：
1. ピアノード上で、Splunk Web の [管理] をクリックします。
2. [分散環境] セクションで、[クラスタリング] をクリックします。
このダッシュボードは、すでにピアとして有効にされた Splunk インスタンス上でのみ表示できます。
ダッシュボードの表示
81
ピアバージョンのダッシュボードの例を以下に示します。
ダッシュボードには、ピアのステータスに関する情報が表示されます。
マスターの場所：マスターノードの IP アドレスとポート番号。
登み：ピアがマスターに登されているかどうか。
複製ポート：ピアが他のピアから複製されたデータを受信するポートです。
また、ダッシュボードの上部には [設定] ボタンがあります。このボタンをクリックして、ピアの設定を更するこ
とができます。
サーチヘッドダッシュボードの表示
このダッシュボードには、サーチヘッドのステータスに関する詳細情報が表示されます。
ダッシュボードへのアクセス
ダッシュボードにアクセスするには：
1. サーチヘッド上で、Splunk Web の [管理] をクリックします。
2. [分散環境] セクションで、[クラスタリング] をクリックします。
このダッシュボードは、クラスタのサーチヘッドとして有効にされた Splunk インスタンス上でのみ表示できま
す。
ダッシュボードの表示
サーチヘッドダッシュボードの例を以下に示します。
ダッシュボードには、サーチヘッドのステータスに関する情報が表示されます。
マスターの場所：マスターノードの IP アドレスとポート番号。
世代 ID：現在の世代 ID。サーチヘッドおよびピアノードはこの情報を使って、サーチするバケツのコピーを
判断します。世代の詳細は、「世代」を参照してください。
世代ピア：現在の世代のサーチピアセットです。ここでピアは、GUID で識別されます。GUID は各ピアの
$SPLUNK_HOME/etc/instance.cfg ファイルに指定されています。
サーチヘッドを再設定するには、ダッシュボードの上部にある [設定] ボタンをクリックします。
サーチピア上の情報の表示
サーチヘッドの Splunk 管理の [分散サーチ] ページから、サーチピア (クラスタリングでは、一連のピアノードと
82
同じ) の情報を表示することもできます。
1. サーチヘッド上で、Splunk Web の [管理] をクリックします。
2. [デプロイ] セクションで、[分散サーチ] をクリックします。
3. [サーチピア] をクリックすると、一連のサーチピアが表示されます。
警告：サーチヘッド設定の更やピアの追加に、Splunk 管理の [分散サーチ] ページを使用しないでください。ク
ラスタ化されたサーチヘッドを正しく設定する方法については、「サーチヘッドの設定」を参照してください。
ピアをオフラインにする
ピアをオフラインにするには、offline コマンドを使用します。
ニーズにじてピアを永久にオフラインにすることも、一時的にオフラインにすることも可能です。どちらの場合
でも、クラスタは有効または完了状態に復するためのアクションを行います。
有効なクラスタは、そのバケツのすべてのサーチ可コピーを保有しており、データセット全体にしてサーチ
リクエストを処理できます。
完全クラスタには、そのすべてのバケツのコピーが複製データ保持数の値だけ存在しており、またサーチ可
能データ保持数の値だけのサーチ可コピーを保有しています。そのため、障害策の点で指定された要件をた
しています。
一時的にピアをオフラインにする場合
ピアを一時的にオフラインにする場合、一般的にはアップグレードやその他のメンテナンス作業のために短時間だ
けオフラインにします。データの処理とサーチの実行を中断することなくなく処理したいですが、ピアが短時間だ
けオフラインになる場合は、クラスタが複製データ保持数とサーチ可能データ保持数をたさない状態となっても
我慢することができます。
ピアが一時的にオフラインになると、マスターはそれを有効な状態にすためのプロセスを開始しますが、ピアが
オンラインになるとクラスタはその完全な状態に復するため、完全な状態への復元は試みられません。
永久的にピアをオフラインにする場合
ピアを永久にオフラインにする場合、それで中断することなくクラスタが引き続きデータを処理してサーチを実行
するようにしたいと思うでしょう。また、ピアのオフラインにより失われるバケツのコピーを、他のピアに引き
がせたいと考えることもあります。たとえば、オフラインにするピアが 10 個のバケツのコピーを保持している場
合 (3 つのサーチ可および 7 つのサーチ不可)、クラスタは複製データ保持数とサーチ可能データ保持数をたすため
に、それらのコピーをクラスタ内の他のピア上に再作成する必要があります。
ピアを永久にオフラインにする場合、マスターはクラスタを有効で完全な状態にすために、さまざまなバケツ修
復プロセスを開始します。
offline コマンド
CLI の offline コマンドは、一時および永久の両方の種類のピアシャットダウンにしています。これは処理中の
サーチを完了しながら、素早く有効な状態にせるように、ピアを段階的に停止していきます。このようにして、
既存のサーチや今後のサーチが中断されることを防止します。offline コマンドは、クラスタを完全な状態にすた
めのバケツ修復作業も開始します。コマンドの実行方法にじて、プロセスは即座に開始されるか、またはピアが
オンラインに復した場合にバケツの修復が不要になるように、一定期間の過後に開始されます。
重要： offline コマンドが意図通りに動作するためには、サーチ可能データ保持数は最低 2 以上でなければなりま
せん。理由を以下に示します。サーチ可能データ保持数が 2 の場合、常にデータのサーチ可コピーの予備が存在し
ています。サーチ可データを持つピアがオフラインになった場合、そのデータの予備のコピーに即座に切り替えら
れて新たなサーチが行われます。これにより、クラスタ上でサーチが不可能な時間を最小限に抑えられます。一
方、サーチ可能データ保持数が 1 の場合、サーチ可コピーが利用できなくなると、まずサーチ不可コピーをサーチ
可にしないと、完全なデータセットにしてサーチを行うことはできません。「ピア離脱時のクラスタ復旧時間の
見積もり」で明しているように、この処理には時間がかかってしまいます。
offline
コマンドには 2 種類のバージョンがあります。
splunk offline：高速版の offline
コマンドで、ピアを一時的にオフラインにする目的で使用されます。ピ
アはサーチ実行中の場合でも、最大で 5 10 分後に停止します。このバージョンのコマンドを利用すれば、バ
ケツ修復活動を開始せずに手にピアを停止させられます。また、ピアを素早く永久的に停止させて、停止後
にバケツ修復活動を行う場合にも、このバージョンのコマンドを使用します。
83
splunk offline --enforce-counts：enforce-counts
バージョンのコマンドで、クラスタが完全状態にった
後にのみピアを永久的にオフラインにする場合に使用します。enforce-counts フラグを使用すると、すべて
のサーチおよび修復アクティビティが完了するまでの間、ピアはシャットダウンされません。
重要：ピアを停止する場合、stop コマンドではなく offline コマンドを使用します。offline コマンドは、サーチ
の中断を最小限に抑えるような方法でピアを停止します。
ピアの一時停止：高速な offline コマンド
高速版の offline コマンドの構文を以下に示します。
splunk offline
このコマンドは直接ピア上から実行します。
このコマンドを実行すると、クラスタを有効な状態にすために必要な処理をマスターが手配した後にピアが
シャットダウンされます。最大で 5 10 分ほどかかります。シャットダウンされるまでの間、ピアは続中のサーチ
を処理します。
ピアのシャットダウン後、ピアのメンテナンス作業を行ってピアをオンラインにすまでに 10 分間 (デフォルト) の
余裕があります。この時間内にピアがクラスタに復しなかった場合、マスターはクラスタを完全状態にすための
バケツ修復作業を開始します。もっと多くの時間が必要な場合は、restart_timeout 属性を編集して、マスターが
ピアを待機する時間を延長することができます。「再起動時間の延長」を参照してください。
ピアのオフライン時に行われるプロセスの詳細は、「ピアノード停止時の処理」を参照してください。
再起動期間の延長
ピア上のメンテナンス作業を行う必要があるけれども、マスターの restart_timeout に設定されている期間 (デ
フォルトは 600 秒 (10 分)) では足りないような場合、この設定値を更することができます。マスター上で以下の
CLI コマンドを実行してください。
splunk edit cluster-config -restart_timeout <seconds>
たとえば、以下のコマンドはタイムアウト期間を 900 秒 (15 分) に設定します。
splunk edit cluster-config -restart_timeout 900
このコマンドはその場で実行できます。実行後にマスターを再起動する必要はありません。
また、マスター上の server.conf でこの値を更することもできます。
ピアの永久停止： enforce-counts を指定した offline コマンド
enforce-counts 版の offline コマンドの構文を以下に示します。
splunk offline --enforce-counts
このコマンドは直接ピア上から実行します。
このバージョンのコマンドは、離脱プロセスを開始します。このプロセス中、マスターはさまざまな復旧処理を指
示します。これらの処理が完了し、クラスタが完全状態にるまでの間、ピアはシャットダウンされません。当該
ピアが大量のバケツコピーを保有している場合、この処理にはかなりの時間がかかることがあります。
完全状態に復するまでにかかる時間は、ピアが保持するデータの量と種類によって異なります。詳細は、「ピア
離脱時のクラスタ復旧時間の見積もり」を参照してください。
注意：クラスタが完全状態に復できない場合、ピアはシャットダウンされません。一般的には、クラスタ内のピ
アの台数が、複製データ保持数を下回った場合にそのような状況が発生します。たとえば、クラスタの複製データ
保持数が 3 で、ピアノードが 3 台の場合、いずれかのノードをオフラインにしようとすると、クラスタが完全状
態に復することはできません。このような状況下でピアをオフラインにする必要がある場合は、高速版の offline
コマンドを使用してください。
離脱処理中、ピアは続中のサーチを引き続き処理します。
後ほどピアを再起動すると、それがクラスタに追加されます。
ピアの離脱時に行われるプロセスの詳細は、「ピアノード停止時の処理」を参照してください。
84
ピア離脱時のクラスタ復旧時間の見積もり
ピアの離脱時、マスターは残りのピアにして、バケツを修復してクラスタを完全状態にすための作業を指示しま
す。たとえば、離脱ピアが 10 個のバケツのコピーを保管しており、その中の 5 つがサーチ可だった場合、マス
ターはピアに以下の作業を指示します。
これらの 10 個のバケツを他のピアにコピーし、クラスタ内でバケツのコピー数が完全に維持されるように
します (複製データ保持数と一致)。
5 つのサーチ不可バケツのコピーをサーチ可にして、サーチ可バケツのコピー数が完全に維持されるように
します (サーチ可能データ保持数と一致)。
このアクティビティが完了するまでには、ある程度の時間がかかります。どのくらいの時間がかかるかは、以下の
ようなさまざまな要素によって異なります。
CPU、ストレージタイプ、接続タイプなどのシステム要因。
サーチ可バケツの作成作業を割り当てられたピアが現在実行している、その他のインデックス作成作業量。
離脱ピアが保持していたバケツのサイズと数。
離脱ピアに保管されていた、サーチ可コピー上のインデックスファイルサイズ。(これらのインデックスファ
イルは、セグメント化の量などの要因によって、raw データと比べてサイズが大幅に異なります。)
これらのさまざまな要因が影響しますが、処理にかかる概算時間を見積もることは可能です。Splunk が基準とし
ているハードウェアを使用していることを前提に、2 つの主要処理にかかる概算時間の算出方法について明してい
きます。
10 GB のサーチ不可バケツコピーを LAN 由で他のピアにに転送するには、およそ 5 10 分ほどかかります。
10 GB のバケツをサーチ不可からサーチ可に換するには、作成されるインデックスファイルのサイズによっ
て、30分数時間ほどかかります。
共通のピア設定と App の更新
このトピックに記述されているピア更新プロセスにより、すべてのピアノードが共通の主要設定ファイルを共有す
ることが保証されます。ピアノードに App も含めた共通のファイルを配布、更新するには、この方法を使用する
必要があります。
注意：ピアノード設定の問題については、「ピアノードの設定」を参照してください。このトピックには、すべて
のピアで同一でなければならないファイルの詳細が記載されています。大部分の状況下で同一でなければならない
主要設定ファイルには、indexes.conf、props.conf、および transforms.conf があります。ご利用のシステムの
ニーズによっては、他の設定ファイルも同じでなければならない場合もあります。通常 App にはそのような主要
ファイルの別バージョンが含まれているため、一般的にはすべてのピアにして共通の App セットを維持管理する
必要があります。
新しいまたは編集した設定ファイルや App をすべてのピアに配布するには、まずマスター上の特別な場所にファ
イルを保管します。次に、マスターにその場所にあるファイルをピアに配布するように指示します。すべてのピア
に共通の一連の設定ファイル/App は、設定バンドルと呼ばれています。設定バンドルはマスター上で管理され、
単一の操作でピアに配布できます。
設定バンドルの構造
新しいまたは更した設定バンドルファイルは、マスターノード上の特別な場所に保管します。次に、設定バンド
ルを各ピアノードの特定の橋予に配布するように、マスターに指示を行います。
マスター上
マスター上で、設定バンドルは $SPLUNK_HOME/etc/master-apps ディレクトリに存在しています。このディレクト
リ下の一連のファイルが設定バンドルを構成しています。これらは常にグループとしてすべてのピアに配布されま
す。ディレクトリの構造を以下に示します。
$SPLUNK_HOME/etc/master-apps
/_cluster
/default
/local
/<app-name>
/<app-name>
...
以下の事項に注意してください。
/_cluster
ディレクトリは特別なディレクトリで、すべてのピアに配布する必要がある設定ファイル用の
85
ディレクトリです。
サブディレクトリには、indexes.conf のデフォルトバージョンが保管されていま
す。このディレクトリには何もファイルを追加しないでください。また、このディレクトリ内のファ
イルは編集しないでください。
/_cluster/local サブディレクトリには、ピアに配布する新しいまたは編集した設定ファイルを配置で
きます。
注意：Splunk バージョン 5.0/5.0.1 では、/_cluster ディレクトリの名前が /cluster (アンダースコア
なし) になっていました。バージョン 5.0/5.0.1 のマスターノードを 5.0.2 以降にアップグレードする
と、/cluster ディレクトリの名前は自動的に /_cluster に更されます。アップグレードの完了後にマ
スターを再起動すると、マスターノードはピアノードの順次再起動を実行し、名前が更された
/_cluster ディレクトリで、新しいバンドルを各ピアに配布します。すべてのピアノード (5.0/5.0.1 ピ
アも含む) の slave-apps ディレクトリに、名前の更されたディレクトリが保管されます。
/<app-name> サブディレクトリはオプションです。このディレクトリは、任意の App をピアノードに配布す
る手段を提供しています。必要にじて作成、指定してください。たとえば、ピアノードに「appBestEver」
を配布するには、その App のコピーを独自のサブディレクトリ $SPLUNK_HOME/etc/masterapps/appBestEver に保管します。
master-apps ディレクトリ下のサブディレクトリの内容のみが配布されます。master-apps ディレクトリ直下
にある単独のファイルは配布されません。たとえば、単独のファイル /master-apps/file1 が配布されること
はありません。そのため、単独の任意の設定ファイルは /_cluster/local サブディレクトリに保管するよう
にしてください。
/_cluster/default
最新の設定バンドルをピアに配布する場合は、マスターにその旨を明示的に指示します。また、ピアがマスターに
登されると (たとえば、初期スタートアップ時に)、マスターはそのピアに最新の設定バンドルを配布します。
重要：マスターがピアにバンドルを配布する場合、バンドル全体が配布されるため、以前にピアに配布された設定
バンドルの内容はすべて上書きされます。
注意：場所 master-apps は、ピアノードに配布するファイル専用です。マスターが自己の設定用にそのディレクト
リ内のファイルを使用することはありません。
ピア上
ピア上で、設定バンドルは $SPLUNK_HOME/etc/slave-apps 下に保管されます。このディレクトリは、ピアを有効に
した後、マスターから最新版のバンドルを取得した時に作成されます。最上位レベルのディレクトリ名が異なるこ
とを除き、設定バンドルの構造と内容はマスターと同じになります。
$SPLUNK_HOME/etc/slave-apps
/_cluster
/default
/local
/<app-name>
/<app-name>
...
重要：ダウンロードされたファイルはここにそのまま残してください。また、絶に編集しないでください。後ほ
ど設定ファイルや App の更新バージョンを再配布した場合、それは $SPLUNK_HOME/etc/slave-apps 内の古いバー
ジョンに上書きされます。これは、クラスタ内のすべてのピアが当該ディレクトリ中の同じファイルを使用する必
要があるためです。
同じ理由から、ファイルやサブディレクトリを直接 $SPLUNK_HOME/etc/slave-apps に追加しないようにしてくださ
い。マスターが設定バンドルを再配布すると、ディレクトリは上書きされてしまいます。
Splunk が設定ファイルを評価する際に、$SPLUNK_HOME/etc/slave-apps/[_cluster|<app-name>]/local サブディ
レクトリ内のファイルが最優先されます。設定ファイルの優先順位の詳細は、『管理マニュアル』の「設定ファイ
ルの優先順位」を参照してください。
クラスタ App の制限事項
設定バンドルの一部としてピアに配布する App には、/etc/apps ディレクトリに配布する App と比べて一定の制
限事項があります。
クラスタ App は、データパイプラインの以下のフェーズの設定をサポートしています。
データ入力
パーシング
インデックス作成
クラスタ App は、以下の設定とコンポーネントをサポートしていません。
サーチフェーズの設定
86
Splunk Web コンポーネント (たとえば、Splunk Web 由でこれらの App にアクセスできません)
注意：マスターは、サーチ設定や Splunk Web コンポーネントを含む、app ディレクトリ内のすべてのコンテンツ
を配布します。ピアノードは、これらの設定とコンポーネントに単にアクセスできないだけです。
データパイプラインの各フェーズおよび各フェーズに関連する設定ファイルと属性の詳細は、「設定パラメータと
データパイプライン」を参照してください。
設定バンドルの配布
新たなまたは更した設定ファイルと App をすべてのピアに配布するには、以下の手順に従ってください。
1. ファイルや App を用意して、それらをテストします。
2. マスターノードの設定バンドルに、ファイルと App を移動します。
3. マスターに、設定バンドルをピアに適用するように指示します。
マスターノードはバンドル全体をピアに配布します。このとき、ピアの現在のバンドルの内容が上書きされます。
1. 設定バンドルのファイルと App の準備
ピアに配布するファイルに、必要な更を行います。一連のピアに配布する前にスタンドアロンの Splunk インスタ
ンス上でファイルのテストを行って、正しく機能することを確認することをお勧めします。ピアノードのダウンタ
イムを最低限に抑えるために、次のステップに進む前に必要なすべてのファイルが正常に機能することを確認して
ください。
ファイルの正しい設定方法については、「ピアノードの設定」および「ピアインデックスの設定」を参照してくだ
さい。
重要：設定バンドルのサブディレクトリに新しいインデックスを定義する indexes.conf ファイルが存在する場
合、各インデックスの repFactor 属性に auto を明示的に設定する必要があります。この作業は、app サブディレ
クトリに存在する indexes.conf ファイル、および _cluster サブディレクトリ内のすべの indexes.conf ファイル
にして必要です。詳細は、「indexes.conf の repFactor 属性」を参照してください。
2. マスターノードへのファイルの移動
ファイルと App の配布準備が完了したら、それらをマスター上の $SPLUNK_HOME/etc/master-apps/ にコピーしま
す。
App はこのディレクトリに直接保管します。例：$SPLUNK_HOME/etc/master-apps/<app-name>。
スタンドアロンのファイルは $SPLUNK_HOME/etc/master-apps/_cluster/local に保管します。
3. バンドルのピアへの適用
ピアに設定バンドルを適用するには、マスター上で以下の CLI コマンドを実行します。
splunk apply cluster-bundle
以下の警告メッセージが表示されます。
Warning: This command will automatically restart all peers. Do you wish to continue? [y/n]:
続行するには、y を入力します。コマンドに --answer-yes フラグを指定して、このメッセージの表示を省略する
ことができます。
splunk apply cluster-bundle --answer-yes
コマンドを使用すると、マスターが新しい設定バンドルをピアに配布します。ピアはバン
ドルを個別に証します。「バンドルの証」とは、ピアがバンドル内のすべての indexes.conf ファイルの設定を
証することです。すべてのピアが正常にバンドルの証を完了したら、マスターはバンドルを反映するために、ピ
アノードの順次再起動 (ローリング再起動) を指示します。
apply cluster-bundle
一般的にこのダウンロードと証プロセスは、数秒ほどで完了します。バンドルの証に失敗したピアがある場合、
そのピアはマスターにメッセージを送信します。マスターの Splunk 管理の [クラスタリング] ページにはエラーが
表示されます。すべてのピアのバンドルの証が正常に完了しない限り、次のフェーズであるピアの再起動は行わ
れません。
証が完了したら、マスターはすべてのピアの順次再起動を開始します。マスターは、一度に約 10 % のピアノード
87
に再起動メッセージを発行します (クラスタ内に 10 台未のピアが存在している場合は、一度に 1 台のピア)。これ
らのピアが再起動され、マスターとの通信が回復すると、別の 10 % のピアに再起動メッセージが発行されます。
このような処理が、すべてのピアが再起動されるまで繰り返されます。この方法により、ロードバランシングフォ
ワーダーが送信するデータを受信するピアが常に存在することになります。
ピアが再起動されると、新しい設定バンドルが使用されます。このバンドルは、ローカルの
$SPLUNK_HOME/etc/slave-apps に保管されています。
重要：ファイルは $SPLUNK_HOME/etc/slave-apps から移動しないでください。
バンドル更新プロセスのステータスの表示
クラスタバンドル更新の進捗状況を表示するには、マスターから以下のコマンドを実行します。
splunk show cluster-bundle-status
このコマンドは、バンドルの証が正常に完了したか、または失敗したかを表示します。また、各ピアの再起動ス
テータスも表示します。
ピア起動時のバンドルの配布
最初に Splunk インスタンスをピアノードとして設定した後は、ピアをクラスタに参加させるために手動で再起動
する必要があります。「ピアノードを有効にする」を参照してください。再起動時にピアはマスターと接続し、現
在の設定バンドルをダウンロードして、ローカルでバンドルを証した後、もう一度再起動を行います。バンドル
の証が正常に完了した場合にのみ、ピアはクラスタに参加します。このプロセスは、オフラインのピアがオンラ
インになった場合にも行われます。
証が失敗した場合は、エラーを修正した後に、マスターから splunk apply cluster-bundle を実行する必要があ
ります。
クラスタ全体または 1 台のクラスタノードの再起
動
通常は、クラスタ全体を再起動する必要はありません。マスターの設定を更した場合は、単にマスターを再起動
します。「マスターの設定」を参照してください。一連の共通ピア設定を更新した場合は、一連のピアを再起動し
ます。「共通のピア設定の更新」を参照してください。
クラスタ全体の再起動
何らかの理由で、マスターとピアノードの両方を再起動しなければならない場合は、以下の手順に従ってくださ
い。
1. 通常の Splunk インスタンスの再起動と同に、マスターノードを再起動します。たとえば、マスター上で以下の
CLI コマンドを実行します。
splunk restart
2. マスターの再起動が完了したら、すべてのピアがマスターに再登するまで待機します。マスターダッシュボー
ドには、すべてのピアとインデックスがサーチ可であることを知らせるメッセージが表示されます。「マスター
ダッシュボードを有効にする」を参照してください。
3. ピアをグループとして再起動します。マスター上で以下の CLI コマンドを実行してください。
splunk rolling-restart cluster-peers
サーチヘッドを再起動する必要がある場合は、残りのクラスタが動作している限り、任意の時点で再起動すること
ができます。
単一ピアの再起動
単一のピアでのみ設定ファイルを更した場合など、1 台のピアのみを再起動しなければならないこともあります。
重要：ピアの再起動に CLI の splunk restart コマンドは使用しないでください。restart コマンドを使用する
と、マスターはそのピアが再起動中であることを認識できません。代わりに、ピアのハートビート送信を待つデ
88
フォルトの 60 秒過後に、マスターは通常のピア停止時と同じように復旧作業を開始してしまいます (バケツコ
ピーの他のピアへの追加など)。(マスターの実際の待機時間は、マスターの heartbeat_timeout 属性の設定により
異なります。専門家からの指示がない限り、デフォルト値の 60 秒を更することはお勧めできません。)
単一ピアを安全に再起動するために、2 種類の方法が用意されています。
Splunk 管理を使用する ([管理] > [サーバーコントロール])。
CLI コマンド splunk offline に splunk start を指定する。
Splunk 管理または offline/start コマンドを使ってピアを再起動する場合、マスターはピアが永久に停止したと
判断する前に 10 分間 (デフォルト) 待機します。これはピアがオンラインに復するために十分な時間で、クラスタ
による不要な復旧処理の実行を防止することができます。この 10 分間の待機は、Splunk 管理からまたは
offline/start コマンドを使ってピアを再起動した場合にのみ行われます。
注意：マスターが実際に待機する時間は、server.conf 内の restart_timeout 属性の値によって決まります。この
属性のデフォルト値は 600 秒 (10 分) です。マスターにより長い時間待機させたい場合は、「再起動期間の延長」
の明に従って restart_timeout の値を更してください。
offline/start
を使った再起動には、Splunk 管理を使った再起動と比べて、処理中のサーチが完了するまで待って
からピアを停止すると言う利点があります。また、これは 2 段階に分けて行われる処理のため、何らかのメンテナ
ンス作業を行う目的でピアを短時間停止させたいような場合にも利用できます。この方法の短所は、Splunk 管理
がピア上の任意のバケツのコピーから優先度を他のピアのサーチ可コピーに割り当て直してしまうことです。これ
により、サーチ負荷が不均等になり、ピアが大量のプライマリバケツコピーを保持していると問題が発生する可能
性があります。
offline
コマンドの詳細は、「ピアをオフラインにする」を参照してください。
クラスタの仕組み
高度なユーザー向けの基本概念
クラスタの機能を理解するためには、いくつかの概念に慣れ親しんでおく必要があります。
複製データ保持数：クラスタが保持するデータのコピー数を示します。これはクラスタの回復力 (複数の
ノード障害に処できる能力) を示しています。
サーチ可能データ保持数：クラスタが保持するサーチ可のデータコピー数を示します。クラスタのノード停
止からの復旧速度に影響します。
バケツ：インデックス用の基本ストレージコンテナです。インデクサーのデータベース内のサブディレクト
リにしています。
クラスタの状態：これらの状態は、クラスタの健全性 (ヘルス) に関する情報を表しています。
これらの概念の概要は、クラスタのアーキテクチャを紹介している「基本的なクラスタアーキテクチャ」を参照し
てください。今ご覧の章にある各トピックに、詳細が記載されています。
複製データ保持数
クラスタ設定の一環として、クラスタに保持するデータのコピー数を指定します。データはバケツに分割されてお
り、クラスタは各バケツの複数のコピーを管理しています。バケツの各コピーは、個別のピアノードに保管されま
す。データ/バケツのコピー数は、クラスタの複製データ保持数と呼ばれています。
クラスタは、「複製データ保持数 - 1」台のピアノード障害に処することができます。たとえば、システムで 2 台
のピアの障害発生に処できるようにするためには、複製データ保持数に 3 を設定する必要があります。この場
合、クラスタは 3 つの同一の各バケツのコピーを、別個のノードに保管します。複製データ保持数に 3 を設定し
た場合、クラスタの障害発生ピアノード数が 2 台までならば、すべてのデータを引き続き利用することができま
す。2 台のノードが停止しても、引き続き残りのピアにある 1 つの完全なデータコピーを利用できます。
複製データ保持数をやすことで、より多くの台数のピアノード障害に処することができます。複製データ保持数
が 2 の場合、1 台のノード障害にする耐性しかありません。3 の場合は、2 台のピアノードの同時障害に処できま
す (以降同 )。
このトレードオフは、値をやすとそれだけ多くのデータコピーを保管、処理しなければならないことです。複製
活動自体はさほど処理能力を消費しませんが、複製データ保持数が加するに連れて、より多くのインデクサーを
稼働させる必要があり、またインデックスデータにするストレージもより多く確保する必要があります。一方、
データ複製自体にはさほど処理能力を必要としないため、クラスタ内に複数のインデクサーを配置する利点を活用
して、より多くのデータを取り込んでインデックスを作成することができます。クラスタ内の各インデクサーは、
オリジナルデータを持つインデクサー (ソースピア) および複製ターゲット (ターゲットピア) の両方として機能で
89
きます。これは、到着したデータのインデックスを作成でき、またクラスタ内の他のインデクサーからのデータコ
ピーを保管することも可能です。
以下の図では、1 台のピアがフォワーダーからデータを受信して処理し、それを他の 2 台のピアに転送していま
す。クラスタには、そのピアのデータの 3 つの完全なコピーが、各ピアに 1 つずつ保管されます。
注意：この図では、すべてのデータが単一のピアを通じてシステムに取り込まれるように、ピア複製を大幅に簡素
化して表しています。実際には複性がすいくつかの問題が存在しています。
大部分のクラスタでは、各ピアノードがソースピアとターゲットピアの両方として動作し、どちらもフォ
ワーダーから外部データを、そして他のピアから複製されたデータを受信しています。
水平方向のスケーリングを確保するために、複製データ保持数が 3 のクラスタを 4 台以上のピアで構成する
ことができます。各ソースピアは任意の時点でそのデータのコピーを 2 台のターゲットピアに転送します
が、新しいホットバケツの開始時には回、そのターゲットピアが化する可能性があります。
この章の後半のトピックでは、クラスタによるデータの処理方法が詳細に明されています。
サーチ可能データ保持数
マスターノードを設定する際には、サーチ可能データ保持数を指定します。サーチ可能データ保持数は、クラスタ
が保持するデータのサーチ可コピー数を表しています。サーチ可能データ保持数のデフォルト値は 2 で、この場合
クラスタはすべてのデータのサーチ可コピーを 2 つ保持します。サーチ可能データ保持数は、複製データ保持数以
下でなければなりません。
サーチ可コピーとサーチ不可コピーでは、データに違いがあります。サーチ可コピーには、データ自身と Splunk
がデータのサーチに使用する広大なインデックスファイルが含まれています。サーチ不可コピーには、データのみ
が含まれています。サーチ不可コピーに含まれているデータにも初期処理が行われており、必要にじてインデッ
クスファイルを再作成できる形式で保管されています。Splunk インデックスを構成するファイルの詳細は、
「データファイル」を参照してください。
サーチ可能データ保持数が 2 以上の場合、あるピアノードが停止してもわずかな中断でサーチを続することがで
きます。たとえば、複製データ保持数に 3 を、サーチ可能データ保持数に 2 を設定した場合を考えてみましょ
う。クラスタはバケツのコピー 3 つをクラスタ内の個別のピアに保管し、各バケツのコピーの中の 2 つはサーチ
可になります。サーチに関与しているバケツのコピーを持つピアが停止した場合、他のピアのバケツのサーチ可コ
ピーが即座にサーチに参加します。
一方、クラスタのサーチ可能データ保持数が 1 の場合にピアが停止すると、すべてのクラスタデータを象にサー
チを再開できるまでに大幅に時間がかかってしまいます。バケツのサーチ不可コピーをサーチ可にすることはでき
ますが、raw データからインデックスファイルを作成しなければならないため、この換処理には時間がかかりま
す。停止したピアに大量のサーチ可データが保管されていた場合、処理時間が大幅に長くなることがあります。
サーチ不可コピーをサーチ可に換するためにかかる時間の見積もりについては、ここを参照してください。
クラスタでサーチ可コピー数を制限する理由は、サーチ可データはサーチ不可データよりも大量のストレージを消
費するためです。そのため、ピアノード障害発生時にもすべてのデータに素早くアクセスできることとストレージ
要件の加がトレードオフとなります。サーチ可およびサーチ不可データの相ストレージサイズの見積もりについ
ては、「ストレージの討事項」を参照してください。
バケツとクラスタ
Splunk はインデックスデータをバケツに保管します。バケツは、データ自身およびデータのインデックスファイ
ルを保管するディレクトリです。一般的にインデックスは多数のバケツから成り立っており、データの過時間別
に編成されています。
クラスタは、バケツ単位で複製されます。元のバケツと他のピアノード上の複製されたコピーには、同一のデータ
セットが含まれています。ただし、インデックスファイルはサーチ可バケツにのみ存在しています。
90
クラスタ内で、単一のソースピアからのバケツのコピーを複数のターゲットピアに分散させることができます。た
とえば、5 台のピアが存在するクラスタの複製データ保持数が 3 の場合 (水平方向スケーリングの一般的なシナリ
オ)、クラスタは各バケツセットの複製コピーを 3 つ保持します (ソースピア上の元のコピーと 2 台のターゲットピ
ア上の複製されたコピー)。ソースピアが新しいホットバケツを開始すると、マスターはそのピアにして、データ
の複製先となる新しい一連のターゲットピアを指示します。つまり、元のコピーはソースピア上に保管され、それ
らのバケツの複製されたコピーはその他のピア上に無作為に分散保管されます。現在の所、この動作を設定するこ
とはできません。同じピア上に同じバケツのコピーが 2 つ保管されることはありません。
今明したシナリオを以下の図に示します。5 台のピア、複製データ保持数 3、および 7 つのオリジナルのバケツが
存在し、そのコピーはすべてのピアにまたがって展開されています。簡略化するために、この図ではある 1 台のピ
アからのデータバケツのみを表示しています。実際の環境では、すべてではないですが、その他のピアもデータの
送信元となり、それをクラスタ内の他のピアに複製します。
この図で、1A がソースバケツになります。1B は 1C そのバケツのコピーです。この図では、同じ方法で
2A/B/C、3A/B/C、などのように表記しています。
クラスタの構造を理解するためには、バケツを正しく理解する必要があります。このセクションの残りの部分で
は、クラスタのデプロイにとって重要なバケツの概念について取り上げていきます。バケツの概要については、
「Splunk によるインデックス保管方法」を参照してください。
データファイル
バケツ内には 2 種類のファイルが存在しています。
処理された縮形式の外部データ (raw データ)
raw データを指すインデックス (インデックスファイル)
raw データは実際には「未加工の」データではありません。このデータは、イベントとして処理された外部データ
から成り立っています。処理されたデータは縮された raw データジャーナルファイルに保管されます。raw デー
タファイルはジャーナルファイルとして、イベントデータだけでなく、関連するインデックスファイルを生成する
ために必要なすべての情報を保管しています。
raw データは、サーチ可およびサーチ不可の両方のバケツコピーに含まれています。サーチ可コピーにはインデッ
クスファイルも含まれます。
ピアノードは、一連のデータをフォワーダーから受け取ると、データを処理してそれをローカルのホットバケツの
raw データファイルに追加します。また、インデックス処理も行い、するインデックスファイルを作成します。
さらに、処理した raw データのコピーのみをターゲットピアに転送します。ターゲットピアは、その raw データ
ファイルを独自のバケツのコピーに追加します。オリジナルおよび複製されたバケツコピーの raw データは同一
です。
クラスタのサーチ可能データ保持数が 1 の場合、ターゲットピアのバケツのコピーには、raw データのみが保管さ
れます。データのインデックスファイルは作成されません。ターゲットピア上にインデックスファイルを保管しな
いことで、ストレージ要件を緩和することができます。raw データはジャーナルファイルとして保存されるため、
オリジナルの完全にインデックス処理されているデータを管理しているピアが停止した場合、いずれかのターゲッ
トファイルがその raw データのコピーからインデックスを生成することができます。
クラスタのサーチ可能データ保持数が 2 以上の場合、一部または全部のターゲットピアもデータのインデックス
ファイルを作成します。たとえば、複製データ保持数が 3 で、サーチ可能データ保持数が 2 の場合を考えてみま
しょう。この場合、ソースピアは自己の raw データのコピーを、2 台のターゲットピアに転送します。これらのピ
91
アのいずれかは raw データを使ってインデックスファイルを作成します。このインデックスファイルは、バケツ
のコピーに保管されます。このようにして、データのサーチ可コピーが 2 つ存在することになります (元のコピー
とインデックスファイルを持つ複製されたコピー)。「サーチ可能データ保持数」で明されているように、これに
よってピアノード障害発生時にも、クラスタをより素早く復旧することができます。サーチ可バケツコピーの詳細
は、このトピックの後半にある「バケツのサーチ可否」を参照してください。
バケツの移行
バケツは時間の過とともに、さまざまな段階 (ステージ) に移行します。
ホット
ウォーム
コールド
フローズン
これらのステージの詳細は、「Splunk によるインデックス保管方法」を参照してください。
クラスタのアーキテクチャを明する前に、これらのバケツの各ステージの基本的な概念を理解しておく必要があ
ります。ホットバケツは、現在も続して書き込まれているバケツです。インデクサーがホットバケツへの書き込
みを終了すると (たとえば、バケツが最大サイズに達したため)、そのバケツはウォームに移行され、新しいホット
バケツへの書き込みが開始されます。ウォームバケツは読み取り可能ですが (例：サーチ用)、それに新しいデータ
が書き込まれることはありません。その後バケツは「コールド」に移行し、最後には「フローズン」になります。
フローズン状態のバケツはアーカイブされるか、または削除されます。
これ以外にもいくつかの事項をえておく必要があります。
ホット/ウォームおよびコールドバケツは、ソースピアノード上の個別に設定可能なディレクトリに保管され
ます。
すべての複製されたバケツのコピーは、それがホット、ウォーム、またはコールドの場合でも、すべてター
ゲットノードのコールド保管用ディレクトリに保管されます。
ウォームまたはコールドバケツのファイル名には、バケツ内のデータの時間範が含まれています。バケツの
命名規則の詳細は、「インデックスディレクトリの内容」を参照してください。
サーチは、ホット、ウォーム、およびコールドバケツにまたがって行われます。
バケツの移行条件は、「Splunk によるインデックスの保管方法」で明するように、設定を更することが可
能です。
ストレージ要件の見積もり方法などの、ストレージのハードウェア情報については、「ストレージの討事
項」を参照してください。
バケツのサーチの可否と優先度状態
クラスタは複数バケツのコピーを管理しているため、どのバケツのコピーをサーチするのかを判断する方法が必要
になります。任意の時点で、バケツのコピーはサーチ可またはサーチ不可になります。また、バケツのサーチ可コ
ピーはプライマリまたは非プライマリにすることができます。
バケツのコピーに、raw データファイルに加えてインデックスファイルも含まれている場合、それはサーチ可とな
ります。外部データを受信するピアは、raw データのインデックスを作成し、raw データのコピーをそのターゲッ
トピアに送信します。サーチ可能データ保持数が 1 より大きい場合は、それにじてピアの一部または全部が複製
したバケツのインデックスファイルを生成します。たとえば、複製データ保持数が 3、サーチ可能データ保持数が
2、そしてクラスタが完全な場合、クラスタには各バケツのコピーが 3 つ存在することになります。3 つのコピー
すべてが raw データファイルを保持し、その中の 2 つ (ソースピア上のコピーといずれかのターゲットピア上のコ
ピー) にはインデックスファイルが含まれており、サーチ可となります。3 番目のコピーはサーチ不可になります
が、必要にじてサーチ可に換することができます。サーチ不可コピーをサーチ可に換する処理は、主にバケツの
サーチ可コピーを保持するピアが停止した場合などに行われます。
バケツのプライマリコピーは、サーチに参加するサーチ可コピーです。有効なクラスタには、各バケツに 1 つのプ
ライマリコピーが存在しています。このようにして、各バケツの 1 つのコピーのみがサーチされます。プライマリ
コピーを保有しているノードが停止した場合、プライマリではない他のノード上のサーチ可バケツが即座にプライ
マリとして指名され、サーチが続行されます。新たにインデックスファイルが生成されるまで待機する必要はあり
ません。
最初は、オリジナルのデータを保有するピアのバケツのコピーがプライマリコピーになりますが、これは時間の
過に伴い更される可能性があります。たとえば、そのピアが停止した場合は、いずれかのターゲットピアのサー
チ可コピーに優先度が与えられます。
重要：ピアが停止した場合にのみ、優先度の再割り当てが行われます。この場合、マスターは停止したピアのプラ
イマリコピーの代わりに、残りのピアのいずれかのサーチ可コピーをプライマリにします。このプロセスの詳細
は、「ピアノード停止時の処理」を参照してください。
すべてのピアにまたがったバケツの例を以下の図に示します。クラスタの複製データ保持数は 3、サーチ可能デー
92
タ保持数は 2 です。この場合、クラスタは 2 つのサーチ可コピーを保持します。ここで、ソースピア上のバケツ
のコピーはすべてプライマリ (そしてサーチ可) になります。2 番目のサーチ可コピーは、クラスタ内の残りのピア
にまたがって存在しています。
プライマリバケツコピーのセットは、次のセクションで明するようにクラスタの世代を定義しています。
世代
世代は、クラスタのバケツのどのコピーがプライマリでサーチに関与するのかを識別します。世代は時間が過
し、ピアがクラスタから離脱/参加していくに伴って化していきます。ピアが停止すると、そのプライマリバケツ
コピーは他のピアに割り当て直されます。
注意：実際にサーチ象となるバケツのセットは、サーチの時間範などの要因によっても異なります。このこと
は、インデクサーがクラスタ化されているかどうかに関係なく当てはまります。
世代は他の方法でも定義することができます。世代は、クラスタの有効な状態のスナップショットです。ここで、
「有効」とは、クラスタ内の各バケツが 1 つのプライマリコピーを保持していることを表しています。
任意の時点で、現在マスターに登されているすべてのピアが、現在の世代に参加します。ピアがクラスタに参加
またはクラスタから離脱すると、マスターは新しい世代を作成します。
クラスタコンポーネントによる世代の使用方法
ここでは、各種クラスタコンポーネントが世代情報をどのように使用するのかについて明していきます。
マスターはそれぞれの新しい世代を作成し、それに世代 ID を割り当てます。必要にじて、ピアやサーチ
ヘッドと現在の世代 ID をやり取りします。また、各世代のプライマリバケツのコピーおよびそれがどのピア
に存在しているのかも追跡しています。
ピアは、どのバケツのコピーが各世代のプライマリなのかを追跡しています。ピアは複数世代にまたがって
優先度情報を保持しています。
各サーチでサーチヘッドはマスターから取得した世代 ID を使って、サーチ象ピアを判断します。
世代の更時期
世代は以下の状況下で更されます。
マスターがオンラインになった。
ピアがクラスタに追加された。
ピアが意図的 (CLI の offline コマンド) または偶発的 (障害発生) に停止した。
ピアが停止した場合、マスターは停止したノードのバケツのプライマリコピーの代わりに、残りのノード上にある
同じバケツのサーチ可コピーをプライマリに割り当て直し、新しい世代を作成します。
マスターは、バケツがホットからウォームに移行する場合には新たな世代を作成しません。そのため、新しいホッ
トバケツが作成されます (バケツが前述の理由により移行された場合を除く)。そのような状況では、一連のピアは
更されません。サーチヘッドは、どのピアがその世代に属しているのかを知る必要しかありません。特定のピア
上のどのバケツのコピーがプライマリであるかを知る必要はありません。この情報はピア自体が管理しています。
93
上のどのバケツのコピーがプライマリであるかを知る必要はありません。この情報はピア自体が管理しています。
サーチにおける世代の使用方法
サーチヘッドは定期的に、マスターに最新の世代情報を問い合わせます。世代が更されると、マスターはサーチ
ヘッドに新しい世代 ID とその世代に属するピアのリストを通知します。サーチヘッドは、サーチ実行時にピアに
その ID を渡します。ピアはその ID を使って、サーチのプライマリバケツを判別します。
一般的に、サーチは最新世代のプライマリバケツコピーを使って行われます。長時間実行されるサーチの場合、以
前の世代にまたがってサーチを実行できる場合もあります (一般的には、サーチの途中でピアが停止したため)。こ
れにより、一部のデータが失われている場合でも (停止ノードによる)、長時間に渡るサーチを完了することができ
ます。必要にじて手動で再び代替サーチを実行することもできます。
ピアの停止により世代が更される理由
ピアの停止により、マスターが新たな世代を作成する理由は、ピアの停止時にマスターは停止したピアのプライマ
リコピーの代わりとなる、他のピアのコピーをプライマリとして割り当て直すためです。以前の世代でプライマリ
でなかったコピーが、新しい世代のプライマリになります。サーチに関連する世代 ID を知ることで、ピアはその
サーチのプライマリであるバケツを判断することができます。
たとえば以下の図は、すべてのプライマリコピーを保持するソースノードが停止して、マスターが残りのピアにバ
ケツの修復を指示した後の、以前と同じ簡素化版のクラスタを表しています。まず、マスターノードは優先度を、
各バケツの残りのサーチ可コピーに割り当て直します。次に、マスターノードは失われたサーチ可コピーを補うた
めに、サーチ不可コピーをサーチ可コピーに換するようにピアに指示します。最後にマスターは、新たなサーチ
不可コピーセット (1D、2D など) を複製し、残りのピアに分散させることを指示します。
ソースノードが停止しても、合計バケツコピー数の複製データ保持数 (3) と合計サーチ可バケツコピー数のサーチ
可能データ保持数、および各バケツの 1 つのプライマリコピーにより、クラスタは完全状態と有効状態の両方を復
元することができます。この図では、プライマリコピーが別のピアに移動されているため、前の図とは世代が異
なっていることが分かります。
注意：この図には、ある 1 台のピアからのバケツのみが表示されています。この図を詳細に記述すると、複数のピ
アから転送されたさまざまなバケツが表示されることになります。
クラスタの状態
正常に動作、機能しているクラスタは、有効で完全な状態です。
有効なクラスタには、各バケツに 1 つのプライマリコピーが存在しています。
完全クラスタには、各バケツの複製データ保持数だけのコピーが存在しており、また各バケツにしてサーチ
可能データ保持数だけのサーチ可コピーを保有しています。
有効なクラスタは、データセット全体にしてサーチリクエストを処理することができます。
完全クラスタは、障害策の点で指定された要件をたしています。
また、確実なデータ可用性を実現するために、クラスタは完全状態であるだけでなく、サーチ可能データ保持数に
最低 2 以上を設定する必要があります。こうすることによって、サーチヘッドはあるピアが停止しても、クラスタ
94
全体にまたがるサーチを続行することができます。
ピアノードが停止した場合、マスターはクラスタの有効な状態と完全な状態を復元するための作業を指示します。
クラスタを有効な状態にすことはできても、完全な状態にすことはできない場合があります。(たとえば、3 台の
ピアを持つクラスタで複製データ保持数が 3 の場合を考えてみましょう。1 台のピアが停止すると、ピアが再稼働
しない限りクラスタを完全状態に回復することはできません。ただし、有効状態に復することは可能です。)ノー
ド停止時のクラスタの復旧処理については、「ピアノード停止時の処理」を参照してください。
クラスタでのインデックス作成の仕組み
クラスタ内でのインデックス作成について明する前に、2 種類のピアノードの違いを理解しておきましょう。
ソースノード：ソースノードは、フォワーダーまたは他のソースからデータを取り込みます。
ターゲットノード：ターゲットノードは、複製されたデータのストリームをソースノードから受信します。
実際には、1 台のピアがソースノードとターゲットノードの両方として機能します。ただし、クラスタコンポーネ
ント間のデータおよびメッセージの流れを理解するために、これらの 2 種類の区別を理解しておくことが役立ちま
す。
重要：一般的なクラスタデプロイ環境では、すべてのピアノードがソースノードとなります (各ノードが独自の外
部入力を保有している)。これは必要条件ではありませんが、一般的には最善の方法です。一部のピアをターゲッ
トノード専用として保有することに、何も意義はありません。複製データ保管の処理コストはとても小さく、また
現在の所複製データを受信するノードを指定することはできません。受信ノードはマスターがバケツ単位に決定
し、その動作を設定することはできません。すべてのピアノードがターゲットとしての役割も果たすことに留意し
てください。
注意：外部データの複製に加えて、各ピアはその内部インデックスも他のピアに同の方法で複製します。ただ
し、ここでは明を簡素化するために、外部データがどのように処理されるかについてのみ注目していきます。
ピアノード起動時
これらのイベントは、ピアノードの起動時に発生します。
1. ピアノードはマスターに登して、マスターから最新の設定バンドルを受け取ります。
2. マスターは新しい世代を開始します。
3. ピアは他のインデクサーと同に、外部データの取り込みを開始します。ピアはデータを処理してイベントに
し、それを raw データファイルに追加します。また、関連するインデックスファイルも作成します。これらの
ファイル (raw データとインデックスファイルの両方) はローカルのホットバケツに保管されます。これがバケツ
のプライマリコピーになります。
4. マスターは、ピアにその複製データのターゲットピアのリストを渡します。たとえば、複製データ保持数が 3
の場合、マスターは 2 台のターゲットピアのリストを渡します。
5. サーチ可能データ保持数が 2 以上の場合、マスターはピアに、データのコピーをサーチ可にするターゲットピ
アも指示します。たとえば、サーチ可能データ保持数が 2 の場合、マスターはコピーをサーチ可にする 1 台の
ターゲットピアを選出し、その情報をソースピアに伝えます。
6. ピアは、マスターが指示したターゲットピアへの、処理み raw データの転送を開始します。ピアは、raw デー
タファイル全体の処理が完了するまで転送を開始しないのではなく、処理みのデータをブロック単位で転送して
いきます。また、ステップ 5 でマスターが通信したターゲットピアが、そのコピーをサーチ可にする必要がある場
合は、その旨も伝えます。
7. ソースピアから raw データを受信したターゲットピアは、それをローカルのバケツコピーに保管します。
8. サーチ可コピーの作成を指示されたターゲットは、必要なインデックスファイルの生成を開始します。
9. ピアはそのホットバケツを移行するまでの間、ターゲットへのデータ転送を続します。
注意：ソースおよびターゲットピアは相互に管理ポートを通じて通信する訳ではありません。複製ポートを介し
て、相互にデータを送受信するだけです。総合的なプロセスはマスターノードが管理します。
これは、単に 1 台のピアにおけるデータの流れです。クラスタ内では、複数のピアが常時相互にデータを送受信し
ます。
ピアノードのホットバケツの移行時期
95
ソースピアがホットバケツをウォームバケツに移行する場合 (たとえば、バケツが最大サイズに達したため)、以下
の一連のイベントが発生します。
1. ソースピアはマスターおよびターゲットピアに、バケツを移行することを伝えます。
2. ターゲットピアは各自のバケツのコピーを移行します。
3. ソースピアはこの間にも、外部データの取り込みを続しています。新しいホットバケツ内にローカルにデータ
のインデックスを作成し、raw データを、マスターから取得した新たなターゲットピアセットに転送します。
4. ソースピアから新しいホットバケツの raw データを受信したターゲットピアは、それをローカルのバケツコ
ピーに保管します。サーチ可コピーの作成を指示されたターゲットは、必要なインデックスファイルの作成も開始
します。
5. ソースピアは次のホットバケツを移行するまでの間、ターゲットへのデータ転送を続します。以降も同の処理
が行われます。
ピアノードとフォワーダーのやり取り
ピアノードがフォワーダーからデータを取得すると、フォワーダーからのデータを受け取る他のインデクサーと同
に処理が行われます。ただし、大部分のクラスタリング環境では、ピアにデータを送信する各フォワーダー上
でインデクサー答確認を有効にする必要があります。こうすることによって、フォワーダーとピア間でデータが
失われることを防止できます。また、これが終端間のデータ忠実度を確保する唯一の方法です。フォワーダーがピ
アに送信したデータブロックにする確認答を受信しなかった場合、そのブロックが再送信されます。
インデクサー答確認の有効化も含めた、フォワーダーのピアへのデータ送信の設定方法の詳細は、「フォワー
ダーを使ったデータの取り込み」を参照してください。ピアとフォワーダーがインデクサー答確認をどのように
処理しているかについては、「インデクサー答確認の仕組み」を参照してください。
クラスタ化サーチの仕組み
クラスタでは、サーチヘッドを使って一連のピアにまたがるサーチを行います。後述するように希な状況下では、
1 台のピア上でサーチを実行することもできます。
クラスタにまたがるサーチ
クラスタ化サーチは、非クラスタ環境で分散サーチが動作する仕組みと非常に似ています。主な違いは、サーチ
ヘッドがマスターノードからサーチピアのリストを取得することにあります。また、世代 ID もマスターから取得
します。その後は、ピアと直接通信を行います。
注意：クラスタ化サーチで、サーチピアとは現在マスターに登されている一連のクラスタピアのことです (稼働し
ていてクラスタに参加しているピア)。
サーチヘッドがサーチを開始すると：
1. サーチヘッドはマスターノードと通信します。
2. マスターノードはサーチヘッドに現在の世代 ID およびその世代のピア (現在マスターに登されているピア) のリ
ストを伝えます。
3. サーチヘッドは、非クラスタ環境の分散サーチと同じようにサーチピアと通信し、ピアに同じ情報 (サーチリク
エストと複製バンドル) を渡します。ただし、クラスタの場合は世代 ID もサーチピアに渡します。
4. サーチピアは世代 ID を使って、各自が保有するその世代のプライマリバケツコピーを判別し (ある場合)、そし
てサーチに参加する必要があるかどうかを判断します。他のサーチと同に、ピアはサーチの時間範も使って特定
のバケツをサーチするかどうかを判断します。
5. サーチピアは、各自のバケツのプライマリコピーをサーチして、結果をサーチヘッドに渡します。サーチヘッド
はそれらの結果を統合します。
非クラスタ環境の分散サーチと同に、複数のサーチヘッドを用意してそれらを単一のユニットのように動作させ
ることができます。これは、サーチヘッドプールと呼ばれています。また、非クラスタ分散サーチのように、マウ
ントされたバンドルを使ってサーチヘッドからピアに渡されるデータ量を減らすことができます。
これらの機能および他の分散サーチで利用できる機能については、『Distributed Deployment manual』の
「Search across multiple indexers」を参照してください。また、クラスタ構成のサーチヘッドと非クラスタサー
チヘッドの設定の違いについては、このマニュアルの「サーチヘッドの設定」を参照してください。
96
単一ピアのサーチ
デバッグ目的で、1 台のピアノードにしてのみサーチを行わなければならないこともあります。この場合は、その
ピア上で直接サーチを行います。このサーチは、ピア上にある任意のサーチ可データにアクセスします。ピア上の
サーチ不可データ、または他のピア上のサーチ可データのコピーにアクセスすることはありません。
注意：各ピア上でどのデータをサーチ可にするかを設定する方法は存在しないことに注意してください。ただし最
低でも、ピアからクラスタに取り込まれたデータはすべて、そのピア上でサーチ可になります。
クラスタノードの起動方法
このトピックは、以下の場合にどのような処理が行われるのかを明しています。
マスターノードの開始時
ピアが新しいクラスタに参加した場合
ピアが既存のクラスタに参加した場合
マスターノードの開始時
マスターノードがオンラインになると (初回またはそれ以降)、クラスタピアの待機を開始します。オンラインに
なっているピアはマスターに登します。マスターは、それらのピアをクラスタに追加します。マスターは複製
データ保持数に等しい台数のピアが登されるまで待ち、その後クラスタの実行を開始します。
初めてクラスタをデプロイする場合、まずマスターを有効にしてから、次にピアノードを有効にする必要がありま
す。「デプロイの概要」を参照してください。マスターは、複製データ保持数と同じ台数のピアが有効になり再起
動されるまで、ピアのインデックス作成をブロックします。
その後マスターを再起動すると、60 秒の間ピアの登のために待機します。この期間が過ぎて、複製データ保持数
以上のピアが登された場合、マスターはクラスタとして動作するために、取り込んだデータのコピーの転送先の
指示などの、ピアの調整を開始します。そのため、マスターを再起動する場合は、複製データ保持数以上のピアが
稼働していることを確認してください。
最初の 60 秒間が過すると、マスターダッシュボードでクラスタのステータスを確認することができます。
マスターの停止および再起動時にどのような処理が行われるかについては、「マスターノード停止時の処理」を参
照してください。
ピアが新しいクラスタに参加した場合
初めてクラスタをデプロイする場合は、まずマスターを有効にしてから、次にピアノードを有効にする必要があり
ます。「デプロイの概要」を参照してください。マスターは、複製データ保持数と同じ台数のピアが有効になり再
起動されるまで、ピアのインデックス作成をブロックします。
各ピアはオンラインになるとマスターに登します。マスターは、そのピアに最新の設定バンドルを自動的に配布
します。次にピアはローカルに設定ファイルを証します。バンドルの証が正常に完了した場合にのみ、ピアはク
ラスタに参加します。
クラスタに複製データ保持数以上のピアが参加したら、ピアはデータのインデックス作成を開始します。
ピアが既存のクラスタに参加した場合
ピアは後ほど、すでにマスターと複製データ保持数の台数のピアが稼働し、クラスタが機能するようになってか
ら、オンラインにすることもできます。ピアをオンラインにすると、そのピアはマスターに登します。マスター
は、そのピアに最新の設定バンドルを自動的に配布します。次にピアはローカルに設定ファイルを証します。バ
ンドルの証が正常に完了した場合にのみ、ピアはクラスタに参加します。
注意：既存のクラスタに新しいピアを追加しても、即座にバケツの再配置が行われる訳ではありません。新しいピ
アは今後のバケツ複製に参加しますが、マスターが既存のピアから新しいピアにバケツのコピーの移動やプライマ
リの再割り当てを指示することはありません。
ピアノード停止時の処理
ピアノードは意図的に (「ピアをオフラインにする」に記述されているように CLI の offline コマンドを使用) 停
止、または意図せずに (サーバークラッシュなど) 停止することがあります。offline コマンドを使用してピアを停
止すれば、サーチの中断を最低限に抑えられます。
97
ピアがどのように停止した場合でも、マスターが復旧措置を指示して代わりのバケツコピーを配置します。このプ
ロセスは、バケツの修復と呼ばれています。マスターは続的に、各ノード上に保管されているバケツのコピーお
よびその状態 (優先度、サーチの可否) を追跡しています。あるピアが停止すると、マスターはクラスタを以下の
状態に回復する目的で、残りのピアにバケツセットの修復を指示できます。
各バケツのプライマリコピーが 1 つずつのみ存在している。(有効な状態)
各バケツのサーチ可コピーのフルセットが、サーチ可能データ保持数と一致している。
各バケツのコピーのフルセット (サーチ可およびサーチ不可の両方) が、複製データ保持数と一致している。
(完全な状態)
通常は複数ノードに致命的な障害が発生しなければ、マスターは有効なクラスタを再作成することができます。ク
ラスタのサーチ可能データ保持数が 2 以上の場合は、ほぼ即座にその作業を完了できます。マスターが完全クラス
タを再構築できるかどうかは、複製データ保持数以上のピアが引き続き稼働しているかどうかによって決まりま
す。最低でも複製データ保持数と同じ数のノードが動作していないと、クラスタを完全状態に復させることはで
きません。
クラスタが完全状態にるまでには非常に時間がかかることがあります (最初にあるピアから他のピアにバケツを転
送し、バケツのサーチ不可コピーをサーチ可にする必要があるため)。詳細は、「ピア離脱時のクラスタ復旧時間
の見積もり」を参照してください。
ノードの停止時には、バケツ修復の復旧措置のほかにも、いくつかの主要イベントが発生します。
マスターは新たな世代に移行して、新しい世代 ID を作成します。世代 ID は必要にじてピアやサーチヘッド
に通知します。
停止したノードのホットバケツのコピーを保有するピアは、それらのコピーをウォームに移行します。
ピアノードを意図的にオフラインにした場合
コマンドは、クラスタからピアを削除します。また、このコマンドはピアを停止します。この場合、処理
中のサーチを完了し、クラスタを完全なサーチ可状態に素早くせるように、順次処理を行いながらピアを正常に
停止します。
offline
offline
コマンドには 2 種類のバージョンがあります。
splunk offline：高速版の offline
コマンドです。ピアはサーチ実行中または復旧処理中の場合でも、最大
で 5 10 分後に停止します。
splunk offline --enforce-counts：enforce-counts
版のコマンドで、クラスタが完全状態に復したことを
証することを目的にしています。enforce-counts フラグを使用すると、すべてのサーチおよび復旧処理が完
了するまでの間、ピアはシャットダウンされません。
ピアをオフラインにする基本的な方法については、「ピアをオフラインにする」を参照してください。
高速な offline コマンド
高速版の offline コマンドの構文を以下に示します。
splunk offline
このバージョンのコマンドは、以下の一連の処理を実行します。
1. 部分シャットダウン。ピアは即座に部分シャットダウンを行います。ピアは外部入力および複製データの受け付
けを停止します。ただし、サーチ処理は続します。
2. 優先度割り当て。マスターは、ピア上の任意のプライマリバケツコピーの優先度を、他のピア上のそれらのバケ
ツのサーチ可コピーに割り当て直します。このステップの最後には、クラスタが有効状態に復します。サーチ可
能データ保持数が 2 以上の場合、この処理はあっという間に完了します。このステップの間、ピアのステータスは
ReassigningPrimaries になります。
3. 世代 ID の更。マスターはクラスタの世代 ID を更します。このステップの最後には、ピアは新しいサーチに参
加しなくなりますが、引き続き処理中のサーチには関与します。
4. 完全シャットダウン。ピアは最大で 5 10 分後または処理中のサーチおよび優先度の再割り当て処理が完了した
場合に (どちらかが先に発生した時点で)、完全にシャットダウンされます。また、マスターへのハートビートの送
信を中止します。
5. 再起動カウント。ピアのシャットダウン後、マスターは server.conf に設定されている restart_timeout の期間
(デフォルトは 10 分) 待機します。その期間内にピアがオンラインに復した場合、それ以上の復旧措置は行われま
せん。このステップの間、ピアのステータスは Restarting になります。ピアがタイムアウト期間内に復しなかっ
た場合は、そのステータスが Down に化します。
98
6. 復旧処理。ピアが restart_timeout に指定されている期間内に再起動されなかった場合、マスターはクラスタバ
ケツの修復処理を開始します。残りのピアにして、停止するピア上にあったバケツのコピーを複製するように指
示します。また、停止するピアのバケツのサーチ可コピーの代わりとなるように、それらのバケツの他のピア上の
サーチ不可コピーをサーチ可コピーに換することも指示します。このステップの最後には、クラスタが完全状態
にります。ピアの停止により複製データ保持数未のピアしか稼働していない場合は、このステップを完了して完
全クラスタにることができません。このプロセスは、ピアがすでにオフライン状態でも実施されます。
enforce-counts を指定した offline コマンド
enforce-counts 版の offline コマンドの構文を以下に示します。
splunk offline --enforce-counts
このバージョンのコマンドは、離脱と呼ばれるプロセスを開始します。離脱プロセス時には、以下の一連の処理が
行われます。
1. 部分シャットダウン。ピアは即座に部分シャットダウンを行います。ピアは外部入力および複製データの受け付
けを停止します。ただし、サーチ処理は続します。
2. 優先度割り当て。マスターは、ピア上の任意のプライマリバケツコピーの優先度を、他のピア上のそれらのバケ
ツのサーチ可コピーに割り当て直します。このステップの最後には、クラスタが有効状態に復します。サーチ可
能データ保持数が 2 以上の場合、この処理はあっという間に完了します。このステップの間、ピアのステータスは
ReassigningPrimaries になります。
3. 世代 ID の更。マスターはクラスタの世代 ID を更します。このステップの最後には、ピアは新しいサーチに参
加しなくなりますが、引き続き処理中のサーチには関与します。
4. 復旧処理。マスターはクラスタのバケツの修復処理を開始します。残りのピアにして、停止するピア上にあっ
たバケツのコピーを複製するように指示します。また、停止するピアのバケツのサーチ可コピーの代わりとなるよ
うに、それらのバケツの他のピア上のサーチ不可コピーをサーチ可コピーに換することも指示します。このス
テップの最後には、クラスタが完全状態にります。ピアの停止により複製データ保持数未のピアしか稼働してい
ない場合は、このステップを完了して完全クラスタにることができません。このステップの間、ピアのステータ
スは Decommissioning になります。
5. 完全シャットダウン。ピアは、1) 処理中のサーチが完了した、および 2) クラスタが完全状態に復した場合に
シャットダウンされます。シャットダウンされたピアは、マスターへのハートビートの送信を中止します。この時
点で、ピアのステータスは GracefulShutdown に化します。
注意：クラスタが完全状態に復できない場合、バケツの修復処理は完了できず、ピアはシャットダウンされませ
ん。一般的には、残りピアの台数が、複製データ保持数を下回った場合にそのような状況が発生します。
予期せずにピアノードが停止した場合
コマンド実行以外の何らかの理由でピアノードが停止した場合、マスターへの定期的なハートビート送信
が中断します。マスターはこれによりノード停止を出し、復旧措置を開始します。基本的にマスターは、ピアを
意図的に停止する場合と同じ処理を指示しますが、以下の例外があります。
offline
停止したピアは、処理中のサーチには参加しません。
マスターはハートビートタイムアウトの時間 (デフォルトは 60 秒) だけ待機して、その後優先度の再割り当
てとバケツの修復処理を開始します。
ノードが停止してもクラスタにまたがってサーチは続されますが、クラスタが有効な状態に回復するまでの間
は、部分的な結果しか表示されません。
バケツ修復のシナリオ
バケツ修復には 3 種類の作業が関与しています。
バケツの他のサーチ可コピーにプライマリステータスを割り当て直す。
バケツのサーチ不可コピーをサーチ可コピーにする。
複製したバケツのコピーを、バケツのコピーを保有していないピアに転送する。
バケツのサーチ可コピーの、非プライマリからプライマリへの換は即座に行われます。サーチ可バケツのコピー
にはすでにインデックスファイルが存在しているため、実質的にはほとんど何の処理も行われません。(サーチ可
コピーの予備が存在していることを前提にしています。そのためには、サーチ可能データ保持数が 2 以上でなけれ
ばなりません。そうでない場合は、まずサーチ不可コピーをサーチ可コピーに換してから、それをプライマリと
して指定します。)しかし、バケツのサーチ不可コピーをサーチ可コピーに換する作業は、バケツのインデックス
ファイルを作成する必要があるため、多少時間がかかります。サーチ不可コピーをサーチ可に換するためにかか
99
る時間の見積もり方法については、「ピア離脱時のクラスタ復旧時間の見積もり」を参照してください。
ここでは 2 つの例を参考に、マスターによる 1) 有効で完全なクラスタの再作成、および 2) 有効だけれども不完全
なクラスタの作成 (残りノード数が不十分な場合) について明していきます。このプロセスは、ピアを意図的に停
止した場合でも、ピアが意図せずに停止した場合でも同じです。
以下の事項を忘れないようにしてください。
クラスタは、各バケツのサーチ可コピーが 1 つ存在している場合に「有効」となります。有効なクラスタに
するサーチでは、完全なサーチ結果が返されます。
クラスタに、複製データ保持数と同数のバケツのコピー、およびサーチ可能データ保持数と同数のサーチ可
コピーが存在している場合、そのクラスタは「完全」です。
すべてのバケツのサーチ可コピーが存在しているけれども、複製データ保持数よりも少ない数のバケツコ
ピーしか存在していない場合、クラスタは有効だけれども不完全になります。そのため、複製データ保持数
が 3 で 3 台のピアノードしか存在していないクラスタで、いずれかのピアが停止した場合、クラスタを有効
な状態にすることは可能ですが、2 台のノードしか稼働していないため完全な状態にすることはできません
(複製データ保持数に指定されている 3 つのバケツコピーを維持できないため)。
例：バケツの修復による有効で完全なクラスタの作成
前提：
停止したピアは、以下のようなクラスタのメンバーだった。
停止したピアを含めて 5 台のピアが存在
複製データ保持数 = 3
サーチ可能データ保持数 = 2
停止したピアは以下バケツコピーを保有していた。
バケツのプライマリコピー数は 3
サーチ可コピー数は 10 (プライマリコピーを含む)
合計バケツコピー数は 20 (サーチ可およびサーチ不可を含む)
ピアが停止すると、マスターは以下のように、残りのピアにしてさまざまなメッセージを送信します。
1. 停止ノードの 3 個のプライマリコピーのそれぞれにして、マスターは当該バケツのサーチ可コピーを保有する
他のノードを探し、そのノードにして保有するコピーをプライマリにするように指示します。
このステップが完了すると、クラスタは有効状態に復し、それ以降のサーチにしては完全な結果セットを返せる
ようになります。
2. 停止ノードの 10 個のサーチ可コピーのそれぞれにして、マスターは当該バケツのサーチ不可コピーを保有する
他のノードを探し、そのノードにして保有するコピーをサーチ可にするように指示します。そのノードは、その
コピーのインデックスファイルの作成を開始します。
3. 停止ノードの合計 20 個のバケツのコピーそれぞれにして、マスターは 1) そのバケツのコピーを保有するノー
ドおよび 2) そのバケツのコピーを保有していないノードを探します。次に、コピーを持つノードにして、バケツ
のデータを他のノード (データを持たないノード) にコピーするように指示します。
この最後のステップが完了すると、クラスタは完全状態に復します。
例：バケツの修復による有効だが不完全なクラスタの作成
前提：
停止したピアは、以下のようなクラスタのメンバーだった。
停止したピアを含めて 3 台のピアが存在
複製データ保持数 = 3
サーチ可能データ保持数 = 1
停止したピアは以下バケツコピーを保有していた。
バケツのプライマリコピー数は 3
サーチ可コピー数は 10 (プライマリコピーを含む)
合計バケツコピー数は 20 (サーチ可およびサーチ不可を含む)
クラスタには 3 台しかノードがなく、複製データ保持数が 3 のため、あるノードが停止すると複製データ保持数
の要件をたすことができません。そのため、クラスタを完全状態に復することはできません。
ピアが停止すると、マスターは以下のように、残りのピアにしてさまざまなメッセージを送信します。
1. 停止ノードの 10 個のサーチ可コピーのそれぞれにして、マスターは当該バケツのサーチ不可コピーを保有する
他のノードを探し、そのノードにして保有するコピーをサーチ可にするように指示します。そのノードは、その
100
コピーのインデックスファイルの作成を開始します。
2. 停止ノードの 3 個のプライマリコピーのそれぞれにして、マスターは当該バケツのサーチ可コピーを保有する
ノードを探し、そのノードにして保有するコピーをプライマリにするように指示します。前の例とは違い、クラ
スタのサーチ可能データ保持数が 1 であるため、サーチ不可コピーをサーチ可コピーに換しないと、他のバケツ
のコピーをプライマリとして指定することはできません。
ステップ 2 が完了すると、クラスタは有効状態に復し、それ以降のサーチにしては完全な結果セットを返せるよ
うになります。
3. 停止したノード上の合計 20 個のバケツコピーについては、コピーを保持するために十分な数のノードが残って
いないため、マスターが代替コピーを作成するための処理を開始することはできません。
クラスタは複製データ保持数に相当する完全なバケツコピーのセットを作成できないため、クラスタは不完全な状
態となります。
画像
以下の図は、5 台のピアが存在する、複製データ保持数が 3 でサーチ可能データ保持数が 2 のクラスタを表してい
ます。バケツのプライマリコピーは、フォワーダーからデータを受信したソースピア上に存在しており、そのデー
タのサーチ可およびサーチ不可コピーが他のピアに保管されています。
注意：この図はとても単純化されています。分かりやすいように、この図ではある 1 台のピアが保有するデータの
バケツのみを表しています。実際の環境では、すべてではないですが、その他のピアもデータの送信元となり、そ
れをクラスタ内の他のピアに複製します。
以下の図は、すべてのプライマリコピーを保持するソースノードが停止して、マスターが残りのピアにバケツの修
復を指示した後の、前と同じように単純化されたクラスタを表しています。
101
マスターは、停止したピアのバケツを回復するために、クラスタにさまざまな作業を指示します。
1. マスターは停止ピア上のバケツのコピーの優先度を、残りのピア上にあるサーチ可コピーに割り当て直します。
このステップが完了すると、世代 ID が更されます。
2. マスターはピアにして、サーチ不可コピーセットをサーチ可に換して、失われたサーチ可コピーを補完するよ
うに指示します。
3. マスターは、新たなサーチ不可コピーセット (1D、2D など) を複製し、残りのピアに分散させることを指示しま
す。
ソースノードが停止しても、合計バケツ数の複製データ保持数と合計サーチ可バケツ数のサーチ可能データ保持
数、および各バケツにするそれぞれ 1 つのプライマリコピーにより、クラスタは完全状態と有効状態の両方を復
元することができます。この図では、プライマリコピーが別のピアに移動されているため、前の図とは世代が異
なっていることが分かります。
ピアノードが復した場合の処理
ピアノードは意図的 (CLI の offline コマンド) に、または偶発的 (サーバークラッシュなど) に停止することがあり
ます。ピアが停止すると、「ピアノード停止時の処理」で明しているように、バケツの修復と呼ばれるクラスタ
の復旧処理が行われます。現在ご覧のトピックでは、ピアがその後クラスタに復した場合にどのような処理が行
われるのかについて明していきます。
ピアが復すると、マスターへのハートビート送信を開始します。マスターはそれを認識すると、ピアをクラスタ
に追加します。前にクラスタに参加していた場合と同じ完全なバケツのコピーをピアが保有している場合、マス
ターはそれらのコピーを管理象バケツ数に追加します。
注意：ピアはマスターに接続すると、最新版の設定バンドルを保有しているかどうかを確認します。ピアの停止中
にバンドルが更新された場合は、最新版の設定バンドルをダウンロードして、それをローカルに証し、再起動し
ます。バンドルの証が正常に完了した場合にのみ、ピアはクラスタに再参加します。
マスターのバケツのカウント方法
ピアがクラスタに復した場合に何が起きるのかを理解するために、まずマスターがバケツのコピーをどのように
追跡しているのかを理解する必要があります。
マスターは、クラスタ内の各バケツの数を管理しています。マスターは、各バケツにする、以下の情報を保有し
ています。
クラスタ内に存在しているバケツのコピー数。
クラスタ内に存在しているバケツのサーチ可コピー数。
またマスターは、特定のバケツのプライマリコピーが常に 1 つだけ存在するように制御しています。
マスターは、これらのカウントにより、クラスタが有効で完全であるかを判断します。完全クラスタの条件を以下
に示します。
各バケツのプライマリコピーが 1 つずつのみ存在している。
各バケツのサーチ可コピーのフルセットが、サーチ可能データ保持数と一致している。
各バケツのコピーのフルセット (サーチ可およびサーチ不可) が、複製データ保持数と一致している。
バケツの修復とピア上のコピー
ピアが停止すると、マスターは残りのピアにバケツの修復処理を指示します。最終的にバケツの修復が成功した場
合、クラスタは完全状態に復します。
その後ピアがクラスタに復した場合、マスターはそのバケツコピーをカウント数に追加します (ピア停止の原因と
なった問題により、それらのコピーが壊れていない場合)。その結果がどうなるかは、ピアの復時までにバケツの
修復処理が完了しているかどうかによって異なります。
バケツの修復が完了している場合
バケツの修復がすでに完了し、クラスタが完全状態になっている場合、復したピアのコピーは単に余分なコピー
となります。たとえば、複製データ保持数が 3 の場合に、クラスタですべてのバケツの修復処理が完了すると、ク
ラスタには再び各バケツの 3 つのコピーが存在することになります (停止したピアが停止前に管理していたバケツ
を含む)。停止したピアが完全な状態のコピーを持った状態でクラスタに復すると、マスターは単純にそれらのコ
ピーをカウント象としてコピー数に追加します。そのため、一部のバケツにしては、3 つではなく 4 つのコピー
102
が存在することになります。同に、復したピアが一部のバケツのサーチ可コピーを保持していた場合は、余分な
サーチ可バケツが存在することになります。これらの余分なコピーは、後ほどそれらのバケツの一部のコピーを保
持している、その他のピアが停止した場合などに役立ちます。
バケツがまだ修復中の場合
クラスタが、ピア停止時に失われたコピーを引き続き再作成している場合、ピアの復によりバケツの修復処理作
業を減らせます。マスターが復したピア上のコピーをカウント象に追加すると、クラスタは不完全だが有効な状
態であることが分かります。そこで、その他のピアにそれらのバケツのコピー作成を指示する必要がなくなりま
す。ただし、バケツのコピーやコピーのサーチ可への換などの、バケツ修復処理中のピアは、それらのコピーに
する作業を完了するまで行います。バケツの修復処理には時間がかかるため、停止したピアをオンライン状態に復
させることには、そうするだけの価値があります (特にピアが大量のバケツコピーを保有している場合)。
マスターノード停止時の処理
マスターは、クラスタが正常に動作するために必要不可欠で、大部分のクラスタ活動を指示、調整する役割を果た
しています。マスターが停止した場合、ピアとサーチヘッドは既定の行動を取り、しばらくの間は通常に近い動作
を行えます。それでも、マスターの停止は深刻な障害として処する必要があります。
マスターが停止した場合
マスターが停止しても、他の障害が発生しない限りクラスタは通常のように機能することができます。ピアは引き
続きデータの取り込み、他のピアへのコピーの転送、バケツの複製、およびサーチヘッドからのサーチリクエスト
への答を行えます。
ピアはホットバケツを移行する時に、通常はマスターに問い合わせて次のホットバケツの転送先ターゲットピアリ
ストを取得します。しかし、マスター停止中にピアがホットバケツを移行した場合、次のホットバケツは前のホッ
トバケツと同じ一連のターゲットピアに転送されます。
問題は徐々に現れてきます。たとえば、マスター停止中にピアが停止した場合、バケツの修復処理を実行すること
はできません。また、何らかの理由であるピアがターゲットピアと接続できない場合、他のターゲットに更する
ことはできません。
サーチもマスターなしで続することができますが、徐々にサーチがアクセスできるデータセットが不完全なもの
になっていきます。サーチヘッドは、マスターが停止する前に最後に取得した世代 ID を使用します。この世代の
ピアが停止した場合は、警告メッセージが表示されます。
マスターの停止の可能性に処するために、必要にじて処理をヒキ尽くスタンバイマスターを設定することができ
ます。詳細は、「スタンバイマスターの設定」を参照してください。
マスターが復した場合
ピアは引き続きハートビートを送信しているため、マスターが復すると、それを出して再接続することができま
す。
マスターが復すると、ピアが登できるように 60 秒間待機します。この期間が過すると、マスターはピアノード
やバケツの状態を含めた、クラスタの全状態を把握します。最低でも複製データ保持数だけのピアが登されてい
る場合、クラスタを有効で完全な状態にするために、マスターはバケツの修復に必要な作業を開始します。さら
に、必要にじて世代 ID も更新します。
このアクティビティが完了するまでには、ある程度の時間がかかります。特に、バケツのサーチ不可コピーをサー
チ可に換する処理には時間がかかります (特にピアノードが大量のデータを処理しなければならない場合)。サー
チ不可コピーをサーチ可に換するためにかかる時間の見積もりについては、ここを参照してください。
最初の 60 秒間が過すると、マスターダッシュボードでクラスタのステータスを確認することができます。
注意：マスターを再起動する場合は、複製データ保持数以上のピアが稼働していることを確認する必要がありま
す。
103