対象バージョンレベル
Systemwalker Centric Manager
Windows版:V5.0L10以降
Solaris版:5.0以降
Linux版:V11.0L10以降
本章に記載されている[サーバ間連携定義]は、バージョンレベルによって起動方法が異なります。
[システム監視設定]-[サーバ間連携定義]-[連携先システム]
[システム監視設定]-[サーバ環境定義]-[詳細設定]-[サーバ環境定義]-[サーバ間連携定義]タブ
対処1
確認ポイント
監視イベント状態変更コマンド(evtutlnt)にて、イベントの一括対処(ustatusall)を実施していませんか。
原因
監視イベント状態変更コマンドによる監視イベントの一括対処は、サーバ間連携機能(全体監視運用や二重化運用において、複数運用管理サーバ間で、同一監視イベントの状態変更を同期する機能)の対象外です。
対処方法
サーバ間連携機能を使用されている場合は、サーバごとに監視イベント状態変更コマンドによる一括対処を行ってください。
対処2
確認ポイント
サーバ間連携を複数台(3台以上)で実施していませんか。
原因
サーバ間連携は設定された連携先システムと連携をとります。
対処方法
連携先システムが複数台存在した場合、各サーバにて複数の相手サーバを[システム監視設定]-[サーバ間連携定義]-[連携先システム]で設定する必要があります。以下の例を参考にして正しく設定してください。
【例】運用管理サーバ A、B、C でサーバ間連携を実施する場合
A の[サーバ間連携定義]-[連携先システム]の設定には “B”、“C”を設定する
B の[サーバ間連携定義]-[連携先システム]の設定には “A”、“C”を設定する
C の[サーバ間連携定義]-[連携先システム]の設定には “A”、“B”を設定する
対処3
確認ポイント
連携できなかったイベントは、以下に示すイベントですか。
ネットワークのメッセージ:ネットワーク異常のメッセージ(以下のラベルで始まるメッセージ)
Windows版 : AP:MpCNappl
UNIX版 : UX:MpCNappl
ハードウェアのメッセージ:SVPMが監視するハードウェア異常のメッセージ
対処方法
各サーバにて、[システム監視設定]-[サーバ間連携定義]-[詳細]-[サーバ間連携定義詳細]の“監視イベントの同期時間”を適切な値で設定する必要があります。以下の例(ネットワークの場合)を参考にして正しく設定してください。
【例】“ネットワークで発生した事象の同期時間”の設定“15秒”(デフォルト)とする
運管A・Bのシステム時間、または、通信状況により、監視時間20秒の差が生じた場合です。
下記の監視時間を各サーバでは“イベント発生時間”として扱われます。
上記の場合、運管Aで対処を行った場合、運管Bでは00:00:00の±15秒(23:59:45~00:00:15)で連携すべき対象のイベントを検索します。しかし、00:00:20は同期時間の範囲外のメッセージとなり、対処されません。そのため、“監視イベントの同期時間-ネットワークで発生した事象の同期時間”を20秒以上に設定してください。
ネットワーク、ハードウェアで発生したイベントが運用管理サーバ(主系、従系共に)へ通知されている環境において、メッセージ発生時間(1))の違いから対処できない場合があります。[通信環境定義]-[サーバ間連携定義]-[サーバ間連携定義詳細]にて“監視イベントの同期時間”-“ネットワークで発生した事象の同期時間”(2))で設定された時間内に連携する対象イベントが存在しない場合です。
ネットワーク、ハードウェアで発生したイベントのメッセージ発生時間
下位サーバからトラップ通知された上位サーバで時間設定されます。そのため、運用管理サーバが複数台存在した場合、各サーバで監視された時間が設定され、各サーバのシステム時間が異なった場合、またはイベントを受信したタイミングが異なった場合、同一メッセージでも発生時間が異なってきます。
ネットワーク、ハードウェアで発生したイベントの同期時間
アラームイベントを同一のものと判断するための時間範囲を指定します。初期値には15秒が設定されています。
アラームイベントは、イベントの発生日時が複数の運用管理サーバで異なるため、対処したイベントの発生日時から特定時間の範囲内のイベントを同一イベントとして扱います。
対処4
確認ポイント
連携元サーバでネットワークのメッセージ(UX:MpCNappl: …/AP:MpCNappl: …)を大量に対処したことにより、連携先でサーバ間連携の反映処理が遅くなる、または、サーバ間連携ができなくなっていませんか。
また、それに伴って運用管理サーバのイベントログ/シスログに、以下のメッセージが出力されていませんか。
MpOpmln: 警告: 1010: 未送信データの個数が指定した数を超えた為、データ(監視イベント番号=%1)は破棄されました (%2) |
%1:破棄したデータの監視イベント番号
%2:連携先システム名
原因
ネットワークのメッセージ(UX:MpCNappl: …/AP: MpCNappl: …)はネットワーク機器から発生するイベントです。
このイベントの特徴はメッセージ発生時刻の情報を持たない特殊のメッセージであり、Systemwalker Centric Managerではネットワークのイベントを監視したサーバで、擬似の発生時間をイベントの情報に付加しています(通常はイベント自身に発生時間の情報を持っています)。そのため、サーバ間連携で連携先サーバのDBから対処処理を実行しなければならないイベントを検索する際、発生時間をキーにして検索が行えず、DBの中からネットワークのイベント、同一ホスト名、同一メッセージテキストを、主なキーにして検索を行っています。そのため、検索処理が通常のイベントより時間が掛かります。よって、多数のネットワークのイベントが発生している環境(DBに多数格納された環境)でネットワークのイベントをサーバ間連携で短期間に連続 して反映処理を行うことにより、大きな負荷が掛かり、処理が遅れることがあります。
なお、処理の遅れの程度は、[サーバ間連携定義詳細]-[監視イベントの同期時間]-[ネットワークで発生した事象の同期時間]に関係し、この時間範囲が大きいほどデータベースの検索負荷が高まり、遅れの程度が大きくなります。([無制限]が最も大きくなります。)
対処方法
[サーバ間連携定義詳細]-[監視イベントの同期時間]-[ネットワークで発生した事象の同期時間]を可能な限り短縮することで、処理の遅れが改善される可能性があります。(この場合、設定する時間が、連携元/連携先サーバのシステム時間のずれよりも短くならないように注意してください。)
上記の方法で効果が見られない場合は、大量のネットワークイベントを同時に対処する必要があるときに、監視イベント一括対処(ustatusall)コマンドを使用し、両サーバで対処を行ってください。
対処5
原因
“被監視システムに関係なく連携する”が無効になっている場合は、連携情報受信時に登録されているシステムで発生したメッセージのみを連携します。つまり、以下の場合は、連携されません。
一度も連携情報受信を行っていない場合。または、
連携情報受信後に追加されたシステムで発生したメッセージ。
対処方法
サーバ間連携をおこなう各運用管理サーバにて、以下のいずれかの対処を行ってください。
“被監視システムに関係なく連携する”を有効にしてください。(サーバ連携定義-連携先システム設定画面)
被監視システムを追加した場合は連携情報受信を行ってください。(サーバ連携定義画面)
対処6
確認ポイント
連携されなかったイベントはすべて同一ですか。例えば、ネットワークのイベントは本文に日時が含まれることがあります。この日時は各運用管理サーバで同一にならない場合があります。
例)下記の場合、timestamp:以降の日時が異なるため連携されません。
運用管理サーバA
MpCNappl: ERROR: 106: ネットワークで事象が発生しました.~~~ timestamp:35703463 ~~~
運用管理サーバB
MpCNappl: ERROR: 106: ネットワークで事象が発生しました.~~~timestamp:35703464 ~~~
原因
サーバ間連携機能はイベントの内容がすべて同一である必要があります。
対処方法
特にありません。