機能説明
現時刻から一定時間さかのぼってSystemwalkerのメッセージログ内を検索し、正常時に出力されるべきイベントが存在しない場合にイベントを新規発行します。
また、その動作を一定間隔で繰り返すことができます。
サンプルスクリプトファイル
OS種別 | 格納場所とファイル名 |
---|---|
Windows | Systemwalkerインストールディレクトリ\mpwalker.dm\mpsc\sample\scMsgSearch.swt |
Solaris | /etc/opt/FJSVssc/sample/scMsgSearch.swt |
Linux | /etc/opt/FJSVssc/sample/scMsgSearch.swt |
HP-UX | 提供なし |
AIX | 提供なし |
実行に必要な権限
Windowsの場合、Administrator権限が必要です。
UNIXの場合、root権限が必要です。
編集可能な項目
編集可能な項目を以下に示します。各項目の詳細については、格納されているサンプルスクリプトを参照してください。
さかのぼり時間
メッセージログの検索において、現在時刻からさかのぼる時間を定義します。
検索は、ここで指定した時間だけ過去の時刻から現在時刻までの範囲で行います。
必要イベントテキスト
正常に出力しているべきイベントのテキストを定義します。
このテキストをメッセージログから検索します。
必要イベントノード名
メッセージログの検索において、メッセージの発生元ノードを限定する場合、対象とするノード名をリストで定義します。複数のノードを定義した場合、ノードごとにメッセージログ内から“必要イベントテキスト”を検索します。ノード名は、[ノードプロパティ]画面の[インタフェース]タブの[ホスト名]に設定されている名前を使用します。ノードを特定しない定義もできます。この場合、どのノードからも“必要イベントテキスト”に定義した内容が出力されていないと、“発行イベントテキスト”を通知します。
発行イベントテキスト
“必要イベントテキスト”が“さかのぼり時間”から現在時刻までの間のメッセージログ中に存在しなかった場合に、発行するイベントテキストを定義します。エラー種別、ラベル等を含んだ書式で定義することができます。
“必要イベントノード名”を定義していた場合、通知するイベントテキストには、未発生のノード名を埋め込むことができます。また、未発生の通知イベントは、ノードごとに発行します。
繰り返し回数
1回の起動でメッセージログの検索を繰り返す回数を定義します。
繰り返し間隔
メッセージログの検索を繰り返す間隔を定義します。
初回調査開始までの待ち時間
起動後、必要イベント未発生調査の処理開始までの待ち時間を設定します。
注意事項
アプリケーションが出力するログファイルを検索対象に含める場合は、該当ログファイルをあらかじめ監視ログファイルに設定しておいてください。
クラスタ運用をしている場合
クラスタ運用している運用管理サーバ上で、必要イベント未発生調査スクリプトを使用する場合、スクリプトを常に運用系で動作させる必要があります。常に運用系で動作させるには、スクリプトの自動起動機能を使用してください。
クラスタ運用している部門管理サーバ/業務サーバ上で、下位システムから通知されるイベントの未発生を調査する場合、以下の注意が必要です。
切り替え、切戻し時は、実際には通知されているイベントに対して、未発生を通知する場合があります。これはクラスタ運用している部門管理サーバ/業務サーバでは、切り替え、切戻し時に、システム監視のログファイル自体が切り替わり、その直前までに下位システムから送信されたイベントが格納されていない状態になるためです。
使用例
過去1時間以内に、“nodeA”、“nodeB”、“nodeC”の3つのノードで、イベント“001: started AplName=Jb01”が発生していなかった場合、異常通知イベントとして“Program not started AplName=Jb01 (Node=xxxxx)”を通知する処理を、6時間間隔で3回行います。また、初回未発生調査までの待ち時間は、1分とします。
編集内容
[さかのぼり時間]
set GoUpTime 60
[必要イベントテキスト]
set TargetText {001: started AplName=Jb01}
[必要イベントノード名]
set TargetNode {nodeA nodeB nodeC}
[発行イベントテキスト]
set OutText {Program not started AplName=Jb01 (Node=%s)}
[繰り返し回数]
set ChkNum 3
[繰り返し間隔]
set Interval 360
[初回調査開始までの待ち時間]
set BeginWaitTime 1
実行結果例
“NodeB”と“NodeC”から必要イベントが発生していない場合、以下の2つのイベントを発行します。
“Program not started AplName=Jb01 (Node=nodeB) ” “Program not started AplName=Jb01 (Node=nodeC) ”