ページの先頭行へ戻る
Systemwalker Centric Manager/Systemwalker Event Agent トラブルシューティングガイド 監視編

9.2.6 監視イベント一覧画面に特定ホストのメッセージが表示されない

対象バージョンレベル

対処1

確認ポイント

インストール後にシステムを再起動しましたか。

対処方法

メッセージが通知されない被監視サーバに、Systemwalker Centric Managerをインストールしたあと、被監視サーバのシステムを再起動したか確認してください。システムを再起動していない場合は、再起動を実施してください。

なお、UNIX版10.1以降ではOSの再起動をしなくとも監視を始められますので、各バージョンレベルの“Systemwalker Centric Manager 導入手引書”を参照してください。

対処2

確認ポイント

メッセージ発生元のメッセージ送信先システムの定義は正しいですか。また、メッセージ送信先システムの設定後にサービスの再起動は実施されていますか。

原因

メッセージ送信先システムの定義に問題があると考えられます。また、メッセージ送信先システム設定後、サービスを再起動しないと定義が反映されません。

対処方法

監視イベントが表示されない(定を確認する)”を参照し、対処してください。再起動していないのであれば定義を反映するために、Systemwalker Centric Managerを再起動してください。

対処3

確認ポイント

被監視サーバ、監視サーバのservicesファイルの定義は正しいですか。

被監視サーバ、監視サーバで、以下の定義が存在しているか確認してください。

存在していない場合、以下の要因から定義が削除されていることが考えられます。それぞれの原因について対処してください。

対処方法

対処4

確認ポイント

ADJUST、SystemWalker/CharsetMGRがインストールされていますか。

メッセージ送信先システムに定義しているサーバがWindows版で、メッセージ発生元の文字コードがEUCの場合は、メッセージ送信先システムに定義しているサーバ(Windows版)にコード変換機能を導入する必要があります。

ただし、送信先システムに定義されているサーバが、Systemwalker Centric Manager V11.0L10以降の場合は除きます。

対処方法

syslogに出力すメッセージが表示されない”を参照して、対処してください。

対処5

確認ポイント

運用管理サーバで以下のエラーメッセージが出力されていませんか。

[Windows版の場合]

[Solaris版の場合]

[Linux版の場合]

原因

運用管理サーバ上のノード情報に、別々のインタフェースとして登録されているホスト名とIPアドレスが、同じインタフェースとして上がってきた場合に出力されるエラーメッセージです。

対処方法

以下に発生例とその対処方法を示します。

ポイント

nodeA110.10.10.2のデータが発生する原因

Systemwalker Centric Managerでは通信に使用したIPアドレスを、メッセージのデータに付加して処理します。複数インタフェースを持つシステムの場合、この通信に使用するIPアドレスが一意になりません。このため、メッセージのデータに付加されるホスト名とIPアドレスの組み合わせは不定です。

  1. 以下の修正を適用します。(障害レポート番号:P139002)

    V5.0L10 EE

    TP03309以降

    V5.0L20 EE

    TP02555以降

    V5.0L20 SE

    TP02557以降

    5.0 EE

    910261-3以降

    5.0 SE

    910371-2以降

    5.0 GEE

    910360-03以降

    5.1 EE

    910735-02以降

    5.1 SE

    910736-02以降

    上記以外

    障害はありません

  2. [Systemwalkerコンソール]で、該当ノードが1つのノードとして定義されているか確認します。

    定義されていない場合は、各コンソールより該当ノードのノードプロパティを以下のように定義してください。

    ネットワークタブ

    インタフェースタブ

    ホスト名

    ホスト名

    IPアドレス

    nodeA

    nodeA1
    nodeA2

    10.10.10.1
    10.10.10.2

対処6

確認ポイント

メッセージが表示されないサーバにて、ファイルシステムの空き容量は十分ですか。

または、以下のメッセージが出力されていませんか。

Windows版の場合   MpOpagt: エラー: 51: writeでエラーが発生しました:デバイス上に十分な領域がありません。(%1)
UNIX版の場合   opagtd: エラー: 51: writeでエラーが発生しました:デバイス上に十分な領域がありません。(%1)

%1: write関数の実行に失敗したプロセス名

原因

ファイルシステムが100%使用されている場合、Systemwalker Centric Managerは正しく動作しません。

対処方法

以下のように対応してください。

Windows版の場合

  1. 不要なファイルを削除します。

  2. Systemwalker Centric Managerのサービスを再起動します。

  3. イベントログで、Systemwalker Centric Managerのエラーメッセージが出力されていないことを確認します。

    エラーメッセージが出力されている場合は、メッセージに対応した対処をしてください。

UNIX版の場合

  1. 不要なファイルを削除します。

  2. Systemwalker Centric Managerのサービスを再起動します。

  3. 以下のコマンドを実行し、syslogと通信するプロセスを再起動します。

    • SystemWalker/CentricMGR 10.0以前

      • [Solaris版の場合]

        sh /etc/rc2.d/S73opagt.syslog stop
        sh /etc/rc2.d/S73opagt.syslog start

      • [HP-UX版の場合]

        sh /opt/FJSVsagt/sbin/init.d/opagt.syslog stop
        sh /opt/FJSVsagt/sbin/init.d/opagt.syslog start

      • [AIX版の場合]

        sh /opt/FJSVsagt/etc/script/opagt.syslog stop
        sh /opt/FJSVsagt/etc/script/opagt.syslog start

      • [Linux版の場合]

        sh /opt/FJSVsagt/etc/init.d/opagt.syslog stop
        sh /opt/FJSVsagt/etc/init.d/opagt.syslog start

    • Systemwalker Centric Manager 10.1以降

      /opt/systemwalker/bin/stpopasyslog
      /opt/systemwalker/bin/stropasyslog

  4. syslogdにHUPシグナルを通知します。

    ps -ef | grep syslogd
    kill -HUP <上記で求めたプロセスID>

  5. 以下のsyslogのメッセージファイルを確認し、Systemwalker Centric Managerのエラーメッセージが出力されていないことを確認します。(ファイル名は標準定義の場合です)

    • Solaris版:/var/adm/messages

    • HP-UX版 :/var/adm/syslog/syslog.log

    • AIX版 :/var/adm/messages

    • Linux版 :/var/log/messages

    エラーメッセージが出力されている場合は、メッセージに対応した対処をしてください。

UXP/DS版の場合

  1. 不要なファイルを削除します。

  2. Systemwalker Centric Managerのサービスを再起動します。

  3. 以下のコマンドを実行し、Systemwalker Centric Managerのエラーメッセージが出力されていないことを確認します。

    Msgrpt

    エラーメッセージが出力されている場合は、メッセージに対応した対処をしてください。

対処7

確認ポイント

メッセージが通知されないホストのイベント監視の条件定義は正しいですか。

イベント監視の条件定義で、通知されないメッセージについての定義行に、[上位送信:しない]と定義されていないか確認してください。

対処方法

[上位送信:しない]と定義されている場合は、[上位送信:する]と定義を変更してください。

対処8

確認ポイント

メッセージ送信先システムで設定されているシステムでホスト名の変更が行われた場合、メッセージ送信先システムに設定されている内容もホスト名にあわせて変更していますか。

対処方法

ホスト名の変更が行われた場合、メッセージ送信先システムに設定されている内容も変更にあわせて設定し、サービスの再起動を実施してください。

対処9

確認ポイント

以下のメッセージがイベントログ/シスログへ出力されていませんか。

[Windows版の場合]

MpOpagt: 警告: 158: %1 への接続処理に失敗しました。再接続処理を行います

[UNIX版の場合]

opagtd: 警告: 158: %1 への接続処理に失敗しました。再接続処理を行います

または

opagtd: 警告: 154: %1 への接続処理に失敗しました。再接続処理を行います(通信用IPアドレス:%2)

%1: ホスト名

%2: IPアドレス

注) メッセージ“opagtd: 警告: 154: …”が出力され、クラスタシステムの場合、“クラスタシステムのメッセージが監視できない(メッセージ発生元がSafeCLUSTERPRIMECLUSTERの場合)”も参照してください。

対処方法

確認ポイントのメッセージが発生後、該当システムからのメッセージが通知されていないか(自動再接続処理が成功している)確認し、通知されていない場合は下記を実施してください。(通知されていれば、自動再接続処理は成功しています。)

備考

対処10

確認ポイント

監視できないノードと同一ホスト名のノードが上位システムに存在していませんか。

V11.0L10/11.0以降の場合

下記メッセージが、上位システムより出力されていませんか

[Windows版の場合]

MpOpagt: 警告: 320: 下位システムから自ホストと同じホスト名のデータを受信しました(%1,%2)。論理的通信構造に誤りがないか確認してください

[UNIX版の場合]

opagtd: 警告: 320: 下位システムから自ホストと同じホスト名のデータを受信しました(%1,%2)。論理的通信構造に誤りがないか確認してください

%1:ホスト名

%2:IPアドレス

※論理的通信構造に誤りがない場合でも、自ノードと同一ホスト名のデータを下位システムより受信した場合に出力されます。

原因

同一ホスト名のシステムが存在する環境では、Systemwalker Centric Managerで管理している内部的な管理情報に矛盾が発生し、正しく監視ができません。

対処方法

ネットワーク全体で、一意のホスト名となるようにOSを設定してください。また、Systemwalker Centric Manager が意識するホスト名([通信環境定義]ダイアログボックスで設定ができます)を異なるように定義することで対処することもできます。

※同一ホスト名のシステムの特定方法は“5”を参照してください。

対処11

確認ポイント

メッセージが通知されない被監視システム側で、前回のシステム起動日時に、イベントログ(システム)に以下のエラーメッセージが出力されていませんか。

ソース:Service Control Manager
イベントID:7009
説明:Systemwalker MpOpagt サービスへの接続中にタイムアウト (30000 ミリ秒) になりました。

ソース:Service Control Manager
イベントID:7000
説明:Systemwalker MpOpagt サービスは次のエラーのため開始できませんでした: そのサービスは指定時間内に開始要求または制御要求に応答しませんでした。

原因

Windows版で、システムの起動時に高負荷な状態が発生したことにより、OSのサービスコントロールマネージャがサービス「Systemwalker MpOpagt」の起動に失敗する場合があります。

対処方法

起動に失敗したサービス「Systemwalker MpOpagt」を手動で起動してください。また予防策として以下の負荷分散の対処を実施してください。

  1. サービスの設定で、Systemwalker Centric Managerのサービスでスタートアップの種類が「自動」であるものについて、「手動」に変更します。
    Systemwalker Centric Managerのサービスは、“機能区/プロセス名対応一覧”を参照してください。

  2. Systemwalker Centric Managerの起動コマンド「scentricmgr」を組み込んだバッチファイルを作成します。

    • バッチファイルによるSystemwalker Centric Managerの起動が、OS起動時の自動起動サービスの起動タイミングと重ならないようにするため、「scentricmgr」の前に待ち合わせ処理を組み込んでください。

    • 待ち合わせ処理については、OS標準のコマンドは存在しませんので、Sleep()関数等を使用したコマンドを作成してバッチファイルに組み込んでください。

    • 待ち合わせ時間は、OS起動時の自動起動サービスの起動完了に要する時間を目安に設定してください。イベントログに出力されるサービスの起動完了メッセージ等の発生時間を参考に、妥当な待ち合わせ時間を設定してください。

  3. 作成したバッチファイルを、スタートアップあるいはタスクスケジューラでOSの起動時に起動されるように設定します。

対処12

確認ポイント

問題のホストで以下のコマンドを2回実行し、以下の観点で確認してください。

[Windows版の場合]

opamsgrev

[UNIX版の場合]

/opt/systemwalker/bin/opamsgrev

【観点】

表示結果が1回目と2回目で異なり、かつ、過去に発生したメッセージが表示されている場合は、Systemwalker Centric Managerでのメッセージ処理が遅延していると考えられます。定常的に短時間に大量のメッセージが出力されている場合は、それが原因であると考えられます。

原因

問題のホストで大量のメッセージが発生し続けた場合、Systemwalker Centric Managerがリアルタイムにメッセージを処理できなくなり、メッセージが発生してからSystemwalkerコンソールに表示されるまで遅延が発生することがあります。

対処方法

大量に発生しているメッセージの出力元のアプリケーション等で、メッセージの出力頻度を抑えるように調整してください。

なお、以下の方法により、Systemwalker Centric Manager側での対処も可能です。

[Windows版]

[UNIX版]

対処13

確認ポイント

メッセージが通知されない被監視システム側で、前回のSystemwalker Centric Manager起動時にイベントログ/シスログへ、以下のエラーメッセージが出力されていませんか。

[Windows]

MpOpagt: 警告: 126: メッセージ送信先システム定義に定義されているホスト(%1)はシステムに定義されていません。この行を無視します

%1: メッセージ送信先システムに定義してある名前

[UNIX]

opagtd: 警告: 21: ホスト名 (%1) はシステムに定義されていません

%1: システムに定義されていないホスト名[Windows版の場合]

原因

Systemwalker Centric Manager起動時にメッセージ送信先システムに定義されているホスト名の名前解決に失敗したことが原因です。

対処方法

以下のどちらかの対処を行った後、Systemwalker Centric Managerを再起動してください。