Comments
Description
Transcript
Caché - InterSystems
InterSystems Symposia 2012 Caché トラブルシューティング インターシステムズジャパン㈱ カ タ カスタマーサポート部 サポ 部 サポートエンジニア 三浦昌仁 概要 • トラブルシューティングに利用するユーティリティの紹介 • 情報収集を行う為のもの • 復旧/対処を行う為のもの • サポートセンターによく寄せられる障害事例について それらのトラブルシューティングについて解説 • ユーティリティによる障害の内容把握 • トラブルの原因解析 • トラブルへの対処 2 1 InterSystems Symposia 2012 トラブルシューティングに トラブルシュ ティングに 利用するユーティリティ 障害発生時の情報収集 • 現象の特定および原因調査の為に必要な情報 • 基本情報 • ^Buttonsユーティリティによる情報 • Cachéコンソールログファイル • 追加情報 • • • • • cstatユーティリティによる情報 g CacheHungスクリプトによる情報 プロセスダンプ /プロセスコア 監査ログ情報 システム管理ポータルの各種メニュ/ユーティリティ 4 2 InterSystems Symposia 2012 ^Buttonsユーティリティ • トラブル発生時の様々な情報を取得する • HTML形式ファイルにトラブル時の各種情報を記録 • 出力先 • Install_Dir¥mgr¥顧客名YYYYMMDDHHMM.html • C:¥InterSystem¥Cache¥Mgr¥Mycompany201206070930.html 5 ^Buttonsユーティリティの内容 • 基本情報 • 一般 6 • ホスト名 • Caché Direct サーバのバージョン情報 • IP アドレス • Caché WebLink のバージョン情報 • ユーザ名 • 各国言語サポート (NLS) 情報 • レポート作成日時 • データベース、ディスク空き容量情報 • Caché のバージョンの文字列 ($ZVersion) • オペレーティングシステムのバージョン • Caché オブジェクトのバージョンの文字列 • 拡張システム情報 • Caché ODBC/JDBC サーバのバージョン情報 • ライセンスキーファイル • セキュリティ設定情報 • ライセンス使用数 • %SS (Cachéのプロセス一覧) • 監査情報 • OSでのプロセスリスト • Cachéコンソールログ • シャドウイング設定情報 • Caché構成ファイル • SysLog (Caché内部エラー) 3 InterSystems Symposia 2012 ^Buttonsユーティリティの内容 • 詳細情報 • cstatスナップ情報 • ネットワークステータス ネ ト ク テ タ • ipconfig /all (Windows システムのみ) • netstat -an • netstat -s • ライセンスダンプ情報 • Cachéプロセスダンプファイルの一覧 • GloStatデータベースアクセス統計情報 7 ^Buttonsユーティリティでの注意点 • SysInternalsユーティリティを事前インストール • Windowsの場合、OSにない機能を補完する為に以下のツー ルを使用 • PsInfo.Exe :詳細なシステム情報を表示 • PsList.Exe :OSレベルのプロセス一覧を取得 以下のURLからダウンロード http://technet.microsoft.com/ja-jp/sysinternals/bb896649 • インストール方法 インスト ル方法 ダウンロードしたファイルを以下ディレクトリに展開 <Install_Dir>¥Bin¥ • Linuxでは不要(OSにより提供される為) 8 4 InterSystems Symposia 2012 ^Buttonsユーティリティでの注意点 • cconsole.log のサイズが 5 MB 以上の場合、 出力ファイルに含まれない • 以下のようなメッセージが出力ファイルに記録 以下のようなメッセ ジが出力ファイルに記録 • File /usr/cachesys/mgr/cconsole.log is too big to be appended to the Log File. A copy has been left in the Directory. • cstat 出力ファイルが 5 MB 以上の場合、 個別のファイルに保存 • 以下のようなメッセ 以下のようなメッセージが出力ファイルに記録 ジが出力ファイルに記録 • File /usr/cachesys/mgr/cstat201103151102.html is too big to be appended to the Log File. A copy has been left in the Directory • ファイルの圧縮後、弊社への送付をお願い致します 9 ^Buttonsユーティリティの実行方法 • ターミナルからの実行 • USER>zn “%SYS” • %SYS>D ^B ^Buttons tt • 管理ポータルからの実行 • 管理ポータル>システムオペレーション>診断レポート • 実行完了まで数分要する • 業務中実行してもシステムに負荷は与えない 業務中実行 もシ ム 負荷は与えな 10 5 InterSystems Symposia 2012 ^Buttonsユーティリティの実行方法 11 Cachéコンソールログ • Cachéコンソールログの内容 Caché開始時/停止時の状態やCachéシステムより送られる メッセージ/エラーを記録 • • • • Cachéシステムエラー 一般(情報)メッセージ OSエラー ネットワークエラー • OS上のファイルとして以下のディレクトリに保存 • <Install_Dir>¥mgr¥cconsole.log • MaxConsoleLogSizeの設定値のサイズにて次回の起動時に cconsole.old にリネーム 12 6 InterSystems Symposia 2012 Cachéコンソールログ • フォーマット 日付-時刻 (PID) n メッセージ 日付-時刻 付 時刻 PID:メッセージを出力したプロセスのPID n : 深刻度レベルを示す数値 13 Cachéコンソールログ • メッセージには重要度を示す数値が記録 • 数値の意味 • 0:情報 エラーではない • 1:警告 警告 回復可能なエラー(Cachéプロセスやシステム停止/ハングに 復 能な プ 停 グ なるエラーではない) • 2:深刻なエラー Cachéプロセスやシステムのハングの恐れ • 3:致命的エラー Cachéシステムハングやシステム強制停止が発生 重要度の高いメッセージの例) 04/25/11-18:18:30:003 (1080) 2 <FILEFULL> in database c:¥intersystems¥cache¥mgr¥ttt¥ 04/25/11-18:19:27:572 ((4344)) 2 The database in c:¥intersystems¥cache¥mgr¥ttt¥ y g has reached its maximum size • 重要度2(深刻なエラー)と3(致命的エラー)は以下のファイル にもメッセージが記録 • <Install_Dir>¥mgr¥alerts.log 14 7 InterSystems Symposia 2012 cstatユーティリティ • システムレベルの問題を調査するユーティリティ • Cachéのハング、ネットワークトラブル、パフォーマンス Cachéのハング、ネットワ クトラブル、パフォ マンス 問題、内部エラーなど • 実行形式ファイルで以下の内容を出力 • Cachéが使用している共有メモリの内部構造や 内部テーブル • 弊社サポートセンターにcstatの出力を圧縮して送付を お願い致します 15 cstatユーティリティの実行 • cstatは問題発生時に弊社の指示により実行 • 実行コマンド • Windowsの場合 cd/d <Install_Dir>¥Bin コマンドオプション/d はドライブも変更する際に有用 cstat -s..¥Mgr -オプション >出力ファイル • Linuxの場合 cd <Install_Dir>/bin cstat –s../mgr s /mgr -オプション オプション >出力ファイル または ccontrol stat <Cachéインスタンス> -オプション >出力ファイル • cstatオプションについては問題の種類により弊社より指示 • 出力結果をファイルに保存 16 8 InterSystems Symposia 2012 cstatユーティリティの実行例 17 CacheHungスクリプト • Cachéがハングした場合、Caché外部から情報を取得する OSレベルのスクリプト(^Buttonsの代替え) • OS別に用意 • Windows : <Install_Dir>¥Bin¥cachehung.cmd • Unix: <Install_Dir>/bin/CacheHung.sh • Buttons と同様の情報を HTML形式のファイルへ取得 • 出力先 • <Install_Dir>¥mgr¥CaheHungYYYYMMDD_HHMM.html 例 C:¥InterSystem¥Cache¥Mgr¥CacheHung2012060_70930.html 18 9 InterSystems Symposia 2012 CacheHungスクリプトの実行例 19 CacheHungスクリプトの出力ファイル 20 10 InterSystems Symposia 2012 プロセスダンプ/プロセスコア • 動作中のプロセスのメモリ内容が出力されたファ イル • プロセスダンプ(Windows)/プロセスコア(Linux) • 以下の障害の原因解析に使用 • Caché内部でのプロセスハング • Caché内部でのプロセスループ 21 プロセスダンプの取得方法(Windows) • Caché2010.1.0以降 cstatユーティリティにて取得可能 cd/d <Install_Dir>¥bin cstat –s..¥Mgr –d <pid>,<opt> opt : 出力するダンプ形式 0 (既定値)フルダンプ , 1 パーシャルダンプ • 実行例 C:¥Users¥miura>cd/d C:¥Users¥miura cd/d c:¥intersystems¥cache¥bin c:¥InterSystems¥Cache¥bin>cstat -s..¥mgr -d 3312,1 cstat -s ..¥mgr -d 3312,1 Dump request level 1 sent to process 3312. 次のプロセスダンプが出力 C:¥intersystems¥cache¥mgr¥cachep3312.dmp 22 11 InterSystems Symposia 2012 プロセスダンプの取得方法 (Windows) • Windows2008の場合 Windowsタスクマネージャ>プロセスタブ >該当プロセス > 右クリック>ダンプファイルの作成 23 出力ファイル例 C:¥Users¥Administrator¥AppData¥Local¥Temp¥cache.DMP プロセスダンプの取得方法(Windows) • Windows2003かつCaché2010.1.0以前の場合 マイクロソフト提供のUserdump.exeを使用 http://support.microsoft.com/kb/241215/ja userdump <pid> • 実行例 C:¥Documents and Settings¥Administrator> userdump 3068 User Mode Process Dumper (Version 8.1.2929.5) Copyright (c) Microsoft Corp. All rights reserved. Dumping process 3068 (cache.exe) to C:¥Documents and Settings¥Administrator¥cache.dmp... The process was dumped successfully. 24 12 InterSystems Symposia 2012 プロセスコアの事前設定(Linux) • プロセスコア生成を有効にする設定が必要 • (1)ファイル/etc/security/limits.confに以下の行を追加 * soft core unlimited * hard core unlimited • (2)ファイル/etc/profile の以下の行をコメント # No core files by default #ulimit -S -c 0 > /dev/null 2>&1 この行をコメントに 25 • (3) 上記設定後、 Cachéの再起動が必要 プロセスコアの取得方法(Linux) • Caché2010.1.0以降の場合 cstat ユーティリティにて取得可能 ccontrol stat <Cachéインスタンス> -d <pid>,<opt> opt : 出力するダンプ形式 0 (既定値)フルダンプ , 1 パーシャルダンプ • 実行例 # ccontrol stat CACHE –dd 7324,1 7324 1 /usr/cachesys/bin/cstat -s /usr/cachesys/mgr -d 7324,1 Dump request level 1 sent to process 7324. 以下のプロセスダンプが出力 26 /usr/cachesys/mgr/user/core.7330 13 InterSystems Symposia 2012 プロセスコアの取得方法(Unix) • Caché2010.1.0以前の場合 kill -11 <pid> コマンドにて取得 出力ファイルは、core.id ただし、プロセスは消滅(強制停止)する 27 Cachéインスタンスのハングの原因となっている プロセスのダンプ/コアの取得方法 • Caché2010.1.0以降の場合 cstatユーティリティにて取得可能 • 実行コマンド • Windowsの場合 cd/d <Install-Dir>¥Bin g -a0 -S9 cstat -s..¥Mgr • Linuxの場合 ccontrol stat <Cachéインスタンス> -a0 -S9 28 14 InterSystems Symposia 2012 Cachéインスタンスのハングの原因となっている プロセスのダンプ/コアの取得方法 • 実行例 29 監査ログ • Cachéへのログインやプロセス終了状況の確認としても 有用 • 監査の有効およびシステムイ 監査の有効およびシステムイベントの構成 ントの構成 • 監査の有効 システム管理>セキュリティ>監査>監査を有効に 30 15 InterSystems Symposia 2012 監査ログ • 監査イベントの有効 システム管理>セキュリティ>監査 システムイ ントを構成 >システムイベントを構成 – – – – – %System/%Login/LoginFailure %System/%Login/Terminate %System/%Login/Login %System/%Login/Logout %System/%Security/Protect y y 31 監査ログ • 監査データベースの閲覧 システム管理>セキュリティ>監査 >監査データベースの閲覧 32 16 InterSystems Symposia 2012 管理ポータルのユーティリティ • システムダッシュボード • プロセス • ロック • ライセンス使用量 33 情報収集の為の事前準備 • Windows Sysinternalsユ ティリティの事前インスト ル • Sysinternalsユーティリティの事前インストール • Windows2003かつCaché2010.1.0以前の場合 Userdumpユーティリティの事前インストール • Linux • プロセスコア生成を有効にする設定 34 17 InterSystems Symposia 2012 障害の復旧処理 • トラブルシューティングでの復旧処理にて以下の処置を 行う場合がある • Cachéプロセスの停止 • Cachéインスタンスの再起動 • Cachéインスタンスの強制停止 • OSの再起動 • ただし、これらの処理は、復旧後の原因調査の為、 情 報収集を行った後に実施 35 Cachéプロセスの終了 • 管理ポータル>プロセス >プロセスの詳細>終了 • 以下のユーティリティからもプロセスの終了が可能 • %SYS>do ^JOBEXAM または do ^RESJOB • Cachéのユーティリティから終了できない場合はOSレベルのユー ティティにてプロセスを停止する場合がある • Windowsタスクマネージャ>プロセスの終了 36 • Linux kill -9 コマンド 18 InterSystems Symposia 2012 Cachéインスタンスの強制停止 • 以下の状態の場合、 Cachéインスタンスの強制停止にて復旧 • Cachéインスタンス全体がハング状態 • Caché起動処理/停止処理がハング状態 • 強制停止を行うコマンド • Windowsの場合 cd/d <Install_Dir>¥Bin css force <Cachéインスタンス>またはccontrol force <Cachéインスタンス> • Linuxの場合 ccontrol force <Cachéインスタンス> 37 トラブルシューティングの トラブルシュ ティングの 実例 19 InterSystems Symposia 2012 障害別のトラブルシューティング • プロセスの問題 • ループ/ハング • ロックの問題 • ロック待ち/ロックテーブルフル • データベースの問題 • ディスクフル/整合性エラー • ジャーナルの問題 • ディスクフル • Cachéインスタンスのハング 39 プロセスの問題 • プロセスがループしている • プロセスがハング状態になっている • ユーザプログラムのコーディングの問題 • Caché提供ルーチンの問題 • Caché内部またはOSの問題 40 20 InterSystems Symposia 2012 プロセスの問題(プロセスのループ) • ループしているプロセスの特定 • Windowsタスクマネージャ/Linux topコマンドよりCPU の使用率が高いプロセスを確認 • イメージ名/コマンドがCachéのプロセスのPID 41 プロセスの問題(プロセスのループ) • ループ状態がどこで発生しているのか確認 • 管理ポータル>システムオペレーション>プロセス • 該当するプロセスの行の [詳細]を選択 タスクマネージャ/Top に て確認したPID 42 21 InterSystems Symposia 2012 プロセスの問題(プロセスのループ) • プロセスの詳細 • 各種詳細情報が表示 ルーチンの実行行数 グローバル参照回数 ローカル変数の表示 実行中のルーチンの行 ソースコード内容 43 プロセスの問題(プロセスのループ) • ループ状態がどこで発生しているのか確認 • 問題のプロセスが実行している以下の項目を確認 • • • • 実行行数 増加しているか? ルーチン Caché提供のものか? 実行ソースコード どのようなコマンドを実行しているか? 必要に応じてローカル変数情報 • ユ ユーザプログラムのコーディングの問題かCaché内 ザプログラムのコ ディングの問題かCaché内 部の問題かの切り分け 44 22 InterSystems Symposia 2012 プロセスの問題(プロセスのループ) • ユーザプログラムのコーディングの問題 • ルーチンがユーザ作成のもの • 実行行数が増加している • プログラムのコーディングの問題確認の為 プ グ ム デ グ 問題確認 為 ループしているルーチン、ローカル変数等の情報を取得 • 対処としてプロセスの終了 • Caché提供ルーチンの問題 • 実行ルーチンがCaché提供のもの • 実行行数が増加している • インターシステムズにて調査 • プロセス詳細情報 (ルーチン行、ローカル変数等) • ^Buttons情報の取得 45 • 対処としてプロセスの終了 プロセスの問題(プロセスのループ) • Caché内部またはOSの問題 • 実行行数が増加しない (Caché内部またはOS内部でループ) • インタ インターシステムズにて調査 システムズにて調査 • プロセス詳細情報(取得できない場合がある) • ^Buttons情報の取得 • 必要であればプロセスダンプ/コアの取得 • 対処としてプロセスの終了 • Cachéユーティリティにより終了(できない場合がある) • タスクマネージャ/kill コマンドによる強制停止 • Caché再起動 • OS再起動 46 23 InterSystems Symposia 2012 プロセスの問題(プロセスのハング) • プロセスがハング(待ち状態)になっている • 何に対する待ちであるかの確認 • 管理ポータル>システムオペレーション>プロセス ポ プ >プロセスの詳細 より以下を確認 • 実行されたコマンド 実行行数が増加しない • プロセス状態を確認 47 プロセス状態(プロセスのハング) RUN JOB 実行中 JOBコマンド実行中 OPEN デバイスのオープン中 CLOSE デバイスのクローズ中 HANG HANGコマンド実行中 USE USEコマンド実行中 LOCK ロックコマンド実行中 READ デバイスから読み込み中 EXAM ジョブ検査中 WRITE デバイスに書き込み中 GINCR $increment実行中 SUSP 中断中 GBITSET ビット文字列設定中 GGET グローバル読み込み中 GBITGET ビット値取得中 GSET グローバル設定中 GORDER グローバル$Order グロ バル$O d 実行中 GKILL グロ バルKill中 グローバルKill中 GDEFINE グローバル$Data実行中 ZF $ZF呼び出し実行中 GQUERY グローバル$Query実行中 接尾子: BROAD メッセージ送信中 H – 停止処理中、 W – 待ち、 N – リモートネット ワーク、 NH – ネットワークハーディニング、 S – 中断要求済み GW – グローバルウェイト、 NR – ネット読み込み D – 消滅 48 24 InterSystems Symposia 2012 プロセスの問題(プロセスのハング) • 主なハング時のプロセス状態 • HANGW Hangコマンドでの待ち • OPENW Openコマンド待ち(ファイルなどの外部入出力装置のOpen待ち) • LOCKW Lockコマンドでの待ち • Lockの問題 • JOBW Jobコマンドでの待ち(バックグランドジョブの起動完了待ち) • 新規プロセスが作成できない • ライセンス数超過 • %ZSTART(プロセス起動時に実行するルーチン)での問題 • GxxxxW グローバルアクセスでの待ち 例) GSETW • データベースの問題(データベース整合性エラー) • ジャーナルの問題(ジャーナルディスクフル) 49 • Caché内部の問題 プロセスの問題(プロセスのハング) • 対処方法 • 情報収集 • プロセス詳細情報(取得できない場合がある) 詳細情報(取得 きな 場合 ある) • ^Buttons情報の取得 • 必要であればプロセスダンプ/コアの取得 • プロセスの終了 • Cachéユーティリティにより終了(できない場合がある) • タスクマネージャ/kill コマンドによる強制停止 • Caché再起動 再起動 • OS再起動 50 25 InterSystems Symposia 2012 ロックの問題 • プロセスのロック待ち • アプリケーションの問題 • ロックの所有者が何らかの理由で解放しない • プロセス間でのデッドロック • トランザクション処理の完了待ち ロック解放はトランザクション完了まで延期 • ロックテーブルフル • アプリケーションの問題 アプリケ ションの問題 • ロックテーブルのサイズ以上のロックが実施 51 ロックの問題(プロセスのロック待ち) • ロックリソースおよび所有者の確認 • 管理ポータル>システムオペレーション>ロック ロックリソース、所有者、ロックモード、ロック待ちプロセス • 所有者のプロセスのルーチン • 待ちのプロセスのルーチン • アプリケーションのコーディングの確認 • 対処 • 所有者のプロセスの終了 52 26 InterSystems Symposia 2012 ロックの問題(ロックテーブルフル) • ロックテーブルフルが発生した場合 • 新規ロックコマンドは待ち状態 • プロセス状態 LOCKW • コンソールログに LOCK TABLE FULL のメッセージ 06/07-10:00:00 1 (1972) 2 LOCK TABLE FULL!!! • ロックテーブルの情報より以下を確認 • 大量にロックを発行しているプロセス • プロセス詳細情報よりルーチンの確認 • 大量にロックされているリソース • アプリケーションのコーディングの確認 • 対処 53 • 所有者のプロセスの終了 • ロックテーブル拡張 データベースの問題 • データベース拡張によるディスクフル • データベース整合性のエラー デ タベ 整合性の ラ 54 27 InterSystems Symposia 2012 データベースの問題(ディスクフル) • データベース拡張によりディスクドライブの空き容量がな くなった場合 • データベースおよびディスク空き容量が0 デ タベ スおよびディスク空き容量が0 となる 管理ポータル>システムオペレーション>データベース>空き容量 • 新規ブロックを確保するSet, Mergeコマンドは<FILEFULL>エラー • コンソールログに以下のエラー 05/30/12-17:39:27:649 (5712) 3 No space left on filesystem for database e:¥symposia¥ 05/30/12-17:43:41:226 (7648) 2 <FILEFULL> in database e:¥symposia¥ 55 データベースの問題(ディスクフル) • 急激にデータベースが拡張したのか • コンソールログにデータベース拡張の情報 06/02/12-22:55:57:011 (7152) 0 Starting Expansion for database e:¥symposia¥. 10 MB requested. 06/02/12-22:55:58:587 (7152) 0 Expansion completed for database e:¥symposia¥. Expanded by 10 MB. • ジャーナルファイルの解析(ジャーナルプロファイルを利用) • グローバルのサイズ確認 • ^%GSIZEユーティリティにてサイズが大きいグローバルの特定 使用ブロック数 (8KB/1Bl k) (8KB/1Block) 56 28 InterSystems Symposia 2012 データベースの問題(ディスクフル) • 対処 • 不要なグローバルを削除 • 拡張したデータベースファイルは再作成にてサイズ縮小 • ディスクフル防止の為、データベース最大サイズを設定する 構成>システム構成>ローカルデータベース>該当データベース「編集」 57 データベースの問題(整合性エラー) • データベースファイルに整合性エラーが発生した場合 • 問題のあるグローバルへアクセスしたプロセスは 以下の状態となる • <DATABASE>エラーが発生 • GxxxW状態でのハング • Gxxx状態でCaché内部でループ • Cachéインスタンス自体のハング コンソールログに以下のエラーが記録される場合もある グに が記録される場合もある 01/18-18:48:17:212 (20270e9b) 0 Suspending system due to <DATABASE> error 01/18-18:48:17:218 (20277f02) 3 *** SERIOUS CACHE ERROR THAT COULD CAUSE DATABASE DEGRADATION HAS OCCURRED. TO PREVENT DEGRADATION THE WRITE DAEMON WILL NOT RUN *** 58 29 InterSystems Symposia 2012 データベースの問題(整合性エラー) • 対処 • データベース整合性チェックの実施 • エラー発生グローバルの特定 管理ポータル>システムオペレーション>データベース>整合性チェック 対象のデータベースを選択 ^Integrityユーティリティでも 出力結果を保存するファイル 整合性チェック可能 59 データベースの問題(整合性エラー) • 整合性チェックの出力結果例 整合性エラーが有る場合 整合性エラーが無い場合 60 30 InterSystems Symposia 2012 データベースの問題(整合性エラー) • データベースバックアップファイルのリストア ^DBRESTユーティリティ およびジャ ナルファイルのリストアで復旧 • およびジャーナルファイルのリストアで復旧 ^JRNRESTOユーティリティ 61 ジャーナルの問題(ディスクフル) • ジャーナルファイルの増加によりディスクの空き容量がなくなり ジャーナルファイルへの書き込みが不可となる • ジャーナルファイルへのI/Oエラー時の動作設定パラメータ “エラー発生時に凍結する”の設定値により以下の動作となる 管理ポータル>システム管理>構成>システム構成>ジャーナル設定 • いいえ(既定値) ジャーナリングが無効になり、更新処理は続行 これ以降、更新処理がジャーナルされない 可用性は高いが、ジャーナルレコードの喪失 • はい ジャーナルファイルへのI/O処理が回復するまでジャーナリングが フリーズされ、更新処理もフリーズ 62 可用性は低いが、ジャーナルレコードの喪失を防止 31 InterSystems Symposia 2012 ジャーナルの問題(ディスクフル) • 急激にジャーナルファイルが拡張したのか コンソールログにジャーナルファイル拡張の情報 06/03/12-12:41:27:130 (3808) 0 CACHE JOURNALING SYSTEM MESSAGE Automatic journal file roll to: c:¥intersystems¥cache¥mgr¥journal¥20120603.003 06/03/12-12:41:27:614 (3808) 0 CACHE JOURNALING SYSTEM MESSAGE Automatic journal file roll to: c:¥intersystems¥cache¥mgr¥journal¥20120603.004 • ジャーナルファイルの解析(ジャーナルプロファイルを利用) グローバルより原因となるアプリケーションの特定 管理ポータル>システムオペレーション>ジャーナル>プロファイル 63 ジャーナルの問題(ディスクフル) • 対処 • ジャーナルファイルのディスクの空き容量を確保 • 古い世代のジャーナルファイルを別ディスクに移動等 • エラー発生時に凍結する”はい“の場合は、この時点で復旧 • エラー発生時に凍結する”いいえ“の場合 • ジャーナルファイルの切り替えにてジャーナルが有効 • なるべく早くデータベースバックアップの実施 • さらにシャドウイング構成の場合 シャドウサ バのデ タベ スの同期 シャドウサーバのデータベースの同期 • プロダクションサーバよりデータベースを再複製 シャドウイングの再開始 • 予防として主ジャーナルディレクトリと二次ジャーナルディレクトリ を設定 64 32 InterSystems Symposia 2012 Cachéインスタンスのハング Caché インスタンスのハングでは以下のような状態に なる • OSレベルのプロセスは動作している • Cachéのプロセスのみがハング • 新規のCachéへのログインがハング • 65 Cachéインスタンスのハング 対処 • CacheHungスクリプトの実行 要 得 必要ならばプロセスダンプ/コアの取得 • cstat –S9 オプション • Caché の強制停止 • css force / ccontrol force コマンド • OSレベルでCaché のプロセスがすべて停止していることを 確認 • Windowsタスクマネージャ/ ps コマンド • 必要に応じてOSレベルよりプロセス強制停止 またはOS再起動 • • 66 33 InterSystems Symposia 2012 Cachéトラブルシューティングに関する 技術情報 • Caché Startup時のトラブル Caché SYMPOSIA 2004 トラブルシュ トラブルシューティングとFAQ ティングとFAQ http://www.intersystems.co.jp/events/2004/2004symposia/zip/TroubleShoot_FAQ.zip • Caché SYMPOSIA 2009 トラブルシューティング http://www.intersystems.co.jp/events/2009/2009symposia/pdf/b4 pdf symposia/pdf/b4.pdf 67 ご質問? 68 34 InterSystems Symposia 2012 ありがとうございました 「InterSystems FAQ」のお知らせ キーワードでのトピック検索が可能になり キ ド トピ ク検索が 能になり 参照の多いトピックのご紹介や 関連トピックの相互参照機能などを追加いたしました。 より使いやすくなったFAQサイトを是非ご活用ください。 http://faq.intersystems.co.jp InterSystemsでは、お客様の疑問や不明点を速やかに解消できるよう、 ウェブサイトにFAQを掲載し、定期的に内容を更新しています。 70 35