対象バージョンレベル
Systemwalker Centric Manager
Windows版:V5.0L10以降
Solaris版:5.0以降
HP-UX版:5.1以降
AIX版:10.0以降
Linux版:5.2、V10.0L10以降
Systemwalker Event Agent
Windows版:V10.0L20以降
Solaris版:10.1以降
Linux版:V11.0L10以降
対処1
確認ポイント
インストール後にシステムを再起動しましたか。
対処方法
メッセージが通知されない被監視サーバに、Systemwalker Centric Managerをインストールしたあと、被監視サーバのシステムを再起動したか確認してください。システムを再起動していない場合は、再起動を実施してください。
なお、UNIX版10.1以降ではOSの再起動をしなくとも監視を始められますので、各バージョンレベルの“Systemwalker Centric Manager 導入手引書”を参照してください。
対処2
確認ポイント
メッセージ発生元のメッセージ送信先システムの定義は正しいですか。また、メッセージ送信先システムの設定後にサービスの再起動は実施されていますか。
原因
メッセージ送信先システムの定義に問題があると考えられます。また、メッセージ送信先システム設定後、サービスを再起動しないと定義が反映されません。
対処方法
“監視イベントが表示されない(設定を確認する)”を参照し、対処してください。再起動していないのであれば定義を反映するために、Systemwalker Centric Managerを再起動してください。
対処3
確認ポイント
被監視サーバ、監視サーバのservicesファイルの定義は正しいですか。
被監視サーバ、監視サーバで、以下の定義が存在しているか確認してください。
uxpopagt 9294/tcp
uxpopagt 9294/udp
存在していない場合、以下の要因から定義が削除されていることが考えられます。それぞれの原因について対処してください。
対処方法
インストール前のservicesファイルをコピーしてしまった場合、またはservicesファイルから定義を削除してしまった場合は、servicesファイルを元に戻してください。
Solaris ではservicesファイルは、/etc/inet/servicesへのリンクですが、Systemwalker Centric Managerのインストール時にリンクが外れている場合があります。これが原因でインストール時に定義が追加されません。以下の手順を実施してください。
Systemwalker Centric Managerをアンインストールします。
servicesファイルを/etc/inet/servicesへのリンクに戻します。
Systemwalker Centric Managerをインストールします。
対処4
確認ポイント
ADJUST、SystemWalker/CharsetMGRがインストールされていますか。
メッセージ送信先システムに定義しているサーバがWindows版で、メッセージ発生元の文字コードがEUCの場合は、メッセージ送信先システムに定義しているサーバ(Windows版)にコード変換機能を導入する必要があります。
ただし、送信先システムに定義されているサーバが、Systemwalker Centric Manager V11.0L10以降の場合は除きます。
対処方法
“syslogに出力するメッセージが表示されない”を参照して、対処してください。
対処5
確認ポイント
運用管理サーバで以下のエラーメッセージが出力されていませんか。
[Windows版の場合]
SystemWalker/CentricMGR V5.0L20以前
MpOpaddRep: エラー: 0008:The system error occurred. (Detailedcode=30009101,0x00000000) |
MpOpaddRep: エラー: 0004:Failed in MpFwcm_MpCm_AddNode() (-1) |
Systemwalker Centric Manager V5.0L30~V11.0L10
MpOpaddRep: 警告: 0013:The overlapping node has already been defined.(XXX,YYY) |
Systemwalker Centric Manager V12.0L10以降
MpOpaddRep: 警告: 13: The node is already defined. (XXX,YYY) |
XXX: ホスト名
YYY: IPアドレス
[Solaris版の場合]
SystemWalker/CentricMGR 5.2.1以前
MpOpaddRep: ERROR: 0008: The system error occurred. (Detailedcode=30009101,0x00000000) |
MpOpaddRep: ERROR: 0004: Failed in MpFwcm_MpCm_AddNode() (-1) |
Systemwalker Centric Manager 10.0~11.0
MpOpaddRep: WARNING: 13: The overlapping node has already been defined.(XXX,YYY) |
Systemwalker Centric Manager 12.0/12.1以降
MpOpaddRep: 警告: 13: The node is already defined. (XXX,YYY) |
XXX: ホスト名
YYY: IPアドレス
[Linux版の場合]
Systemwalker Centric Manager V11.0L10
MpOpaddRep: WARNING: 13: The overlapping node has already been defined.(XXX,YYY) |
Systemwalker Centric Manager V12.0L10以降
MpOpaddRep: 警告: 13: The node is already defined. (XXX,YYY) |
XXX: ホスト名
YYY: IPアドレス
原因
運用管理サーバ上のノード情報に、別々のインタフェースとして登録されているホスト名とIPアドレスが、同じインタフェースとして上がってきた場合に出力されるエラーメッセージです。
対処方法
以下に発生例とその対処方法を示します。
1つのシステムに複数のIPアドレスがある場合
1つのシステムに複数(ここでは2つ)のIPアドレスがあるとします。
この時、運用管理サーバ上のSystemwalker Centric Manager構成情報に以下のような定義が行われているとします。
| ホスト名 | IPアドレス |
---|---|---|
ホストA | nodeA1 | 10.10.10.1 |
この時にメッセージデータなどでnodeA1の10.10.10.2のデータが上がってきた場合、以下の手順で対処してください。
ポイント
nodeA1の10.10.10.2のデータが発生する原因
Systemwalker Centric Managerでは通信に使用したIPアドレスを、メッセージのデータに付加して処理します。複数インタフェースを持つシステムの場合、この通信に使用するIPアドレスが一意になりません。このため、メッセージのデータに付加されるホスト名とIPアドレスの組み合わせは不定です。
以下の修正を適用します。(障害レポート番号:P139002)
V5.0L10 EE | TP03309以降 |
V5.0L20 EE | TP02555以降 |
V5.0L20 SE | TP02557以降 |
5.0 EE | 910261-3以降 |
5.0 SE | 910371-2以降 |
5.0 GEE | 910360-03以降 |
5.1 EE | 910735-02以降 |
5.1 SE | 910736-02以降 |
上記以外 | 障害はありません |
[Systemwalkerコンソール]で、該当ノードが1つのノードとして定義されているか確認します。
定義されていない場合は、各コンソールより該当ノードのノードプロパティを以下のように定義してください。
ネットワークタブ | インタフェースタブ | |
---|---|---|
ホスト名 | ホスト名 | IPアドレス |
nodeA | nodeA1 | 10.10.10.1 |
定義によるSystemwalker Centric Managerの構成情報の矛盾が発生した場合
定義ミスなどにより運用管理サーバ上のSystemwalker Centric Managerの構成情報が以下のようになった場合、[Systemwalkerコンソール]で、構成情報を正しく変更してください。
[実際の環境]
| ホスト名 | IPアドレス |
---|---|---|
ホストA | nodeA | 10.10.10.1 |
ホストB | nodeB | 10.10.10.2 |
[Systemwalker Centric Manager:構成情報]
| ホスト名 | IPアドレス |
---|---|---|
ホストA | nodeA | 10.10.10.2 |
ホストB | nodeB | 10.10.10.1 |
注意
上記対処で改善されない場合、同一ホスト名、同一IPアドレスのシステムが監視システム配下中に既に存在している可能性があります。
同一ホスト名、同一IPアドレスのシステムが複数存在する環境でイベント監視はできません。また、クラスタ運用の運用管理サーバで使用している論理ホスト名と同一ホスト名のシステムを監視することもできません。そのため、同一のシステムが存在していないか確認してください。既に存在した場合、自身のホスト名、IPアドレスを適切な設定になおしてから上記設定を実施してください。
ポイント
Windows版V5.0L30以降、Solaris版10.0以降、Linux版V11.0L10以降では、以下のコマンドでノードを確認することができます。メッセージに出力された“XXX(ホスト名)”と重複するノード、“YYY(IPアドレス)”と重複するノードを“node.csv”より特定します。
[Windows版の場合]
SystemWalker/CentricMGR V5.0L30
mpcmnout node.csv |
Systemwalker Centric Manager V10.0L10以降
mpcmcsv -m OUT -o NODE -f node.csv |
[Solaris版の場合]
Systemwalker Centric Manager 10.0以降
/opt/systemwalker/bin/mpcmcsv -m OUT -o NODE -f node.csv |
[Linux版の場合]
Systemwalker Centric Manager V11.0L10以降
/opt/systemwalker/bin/mpcmcsv -m OUT -o NODE -f node.csv |
コマンドの詳細は、“Systemwalker Centric Manager リファレンスマニュアル”を参照してください。
対処6
確認ポイント
メッセージが表示されないサーバにて、ファイルシステムの空き容量は十分ですか。
または、以下のメッセージが出力されていませんか。
Windows版の場合 MpOpagt: エラー: 51: writeでエラーが発生しました:デバイス上に十分な領域がありません。(%1) |
%1: write関数の実行に失敗したプロセス名
原因
ファイルシステムが100%使用されている場合、Systemwalker Centric Managerは正しく動作しません。
対処方法
以下のように対応してください。
Windows版の場合
不要なファイルを削除します。
Systemwalker Centric Managerのサービスを再起動します。
イベントログで、Systemwalker Centric Managerのエラーメッセージが出力されていないことを確認します。
エラーメッセージが出力されている場合は、メッセージに対応した対処をしてください。
UNIX版の場合
不要なファイルを削除します。
Systemwalker Centric Managerのサービスを再起動します。
以下のコマンドを実行し、syslogと通信するプロセスを再起動します。
SystemWalker/CentricMGR 10.0以前
[Solaris版の場合]
sh /etc/rc2.d/S73opagt.syslog stop |
[HP-UX版の場合]
sh /opt/FJSVsagt/sbin/init.d/opagt.syslog stop |
[AIX版の場合]
sh /opt/FJSVsagt/etc/script/opagt.syslog stop |
[Linux版の場合]
sh /opt/FJSVsagt/etc/init.d/opagt.syslog stop |
Systemwalker Centric Manager 10.1以降
/opt/systemwalker/bin/stpopasyslog |
syslogdにHUPシグナルを通知します。
ps -ef | grep syslogd |
以下のsyslogのメッセージファイルを確認し、Systemwalker Centric Managerのエラーメッセージが出力されていないことを確認します。(ファイル名は標準定義の場合です)
Solaris版:/var/adm/messages
HP-UX版 :/var/adm/syslog/syslog.log
AIX版 :/var/adm/messages
Linux版 :/var/log/messages
エラーメッセージが出力されている場合は、メッセージに対応した対処をしてください。
UXP/DS版の場合
不要なファイルを削除します。
Systemwalker Centric Managerのサービスを再起動します。
以下のコマンドを実行し、Systemwalker Centric Managerのエラーメッセージが出力されていないことを確認します。
Msgrpt |
エラーメッセージが出力されている場合は、メッセージに対応した対処をしてください。
対処7
確認ポイント
メッセージが通知されないホストのイベント監視の条件定義は正しいですか。
イベント監視の条件定義で、通知されないメッセージについての定義行に、[上位送信:しない]と定義されていないか確認してください。
対処方法
[上位送信:しない]と定義されている場合は、[上位送信:する]と定義を変更してください。
対処8
確認ポイント
メッセージ送信先システムで設定されているシステムでホスト名の変更が行われた場合、メッセージ送信先システムに設定されている内容もホスト名にあわせて変更していますか。
対処方法
ホスト名の変更が行われた場合、メッセージ送信先システムに設定されている内容も変更にあわせて設定し、サービスの再起動を実施してください。
対処9
確認ポイント
以下のメッセージがイベントログ/シスログへ出力されていませんか。
[Windows版の場合]
MpOpagt: 警告: 158: %1 への接続処理に失敗しました。再接続処理を行います |
[UNIX版の場合]
opagtd: 警告: 158: %1 への接続処理に失敗しました。再接続処理を行います |
または
opagtd: 警告: 154: %1 への接続処理に失敗しました。再接続処理を行います(通信用IPアドレス:%2) |
%1: ホスト名
%2: IPアドレス
注) メッセージ“opagtd: 警告: 154: …”が出力され、クラスタシステムの場合、“クラスタシステムのメッセージが監視できない(メッセージ発生元がSafeCLUSTERまたはPRIMECLUSTERの場合)”も参照してください。
対処方法
確認ポイントのメッセージが発生後、該当システムからのメッセージが通知されていないか(自動再接続処理が成功している)確認し、通知されていない場合は下記を実施してください。(通知されていれば、自動再接続処理は成功しています。)
メッセージ送信先に定義されているシステムのホスト名または、IPアドレスが正しいことを確認し、誤りがある場合は、メッセージ送信先定義の変更し、サービスの再起動を実施してください。
メッセージの通信に使用するポート(デフォルトでは9294/TCP)が、メッセージ送信先との間で使用可能か確認してください。使用できない場合、使用可能にしてください(firewall等で)。
メッセージ送信先システムに設定されている上位システムにて、Systemwalker Centric Manager がメッセージ発生時間帯より停止されていないか確認してください。停止されている場合はSystemwalker Centric Manager を起動させてください。
“opasetip”コマンドにて設定している場合、設定内容が正しいことを確認し、誤りがある場合は、設定の変更を実施(再度、コマンドを実施)してください。
本コマンドを実施した場合は、以下の操作を実施してください。
メッセージ送信先と常時接続で接続している場合
Systemwalker Centric Managerの再起動
メッセージ送信先と必要時接続で接続している場合
Systemwalker Centric Managerの再起動
下記コマンドの実行
|
注) “opasetip”コマンドはUNIX版の10.0以降で提供されているコマンドになります。コマンドの詳細は、“Systemwalker Centric Manager リファレンスマニュアル”を参照してください。
備考
V11.0L10/11.0 以降の場合
確認ポイントに示したメッセージが最初に出力された後、24時間経っても自動再接続処理が続いている場合(自動再接続処理が一度も成功しない場合)、再度、確認ポイントに示したメッセージが出力されます。
V12.0L10/12.0 以降の場合
自動再接続処理が成功した場合は、下記メッセージがイベントログ/シスログへ出力されます。
[Windows版の場合]
MpOpagt: 警告: 165: %1への再接続処理が完了しました |
[Unix版の場合]
opagtd: 警告: 165: %1への再接続処理が完了しました |
%1: 上位システム名
対処10
確認ポイント
監視できないノードと同一ホスト名のノードが上位システムに存在していませんか。
V11.0L10/11.0以降の場合
下記メッセージが、上位システムより出力されていませんか
[Windows版の場合]
MpOpagt: 警告: 320: 下位システムから自ホストと同じホスト名のデータを受信しました(%1,%2)。論理的通信構造に誤りがないか確認してください |
[UNIX版の場合]
opagtd: 警告: 320: 下位システムから自ホストと同じホスト名のデータを受信しました(%1,%2)。論理的通信構造に誤りがないか確認してください |
%1:ホスト名
%2:IPアドレス
※論理的通信構造に誤りがない場合でも、自ノードと同一ホスト名のデータを下位システムより受信した場合に出力されます。
原因
同一ホスト名のシステムが存在する環境では、Systemwalker Centric Managerで管理している内部的な管理情報に矛盾が発生し、正しく監視ができません。
対処方法
ネットワーク全体で、一意のホスト名となるようにOSを設定してください。また、Systemwalker Centric Manager が意識するホスト名([通信環境定義]ダイアログボックスで設定ができます)を異なるように定義することで対処することもできます。
※同一ホスト名のシステムの特定方法は“対処5”を参照してください。
対処11
確認ポイント
メッセージが通知されない被監視システム側で、前回のシステム起動日時に、イベントログ(システム)に以下のエラーメッセージが出力されていませんか。
ソース:Service Control Manager ソース:Service Control Manager |
原因
Windows版で、システムの起動時に高負荷な状態が発生したことにより、OSのサービスコントロールマネージャがサービス「Systemwalker MpOpagt」の起動に失敗する場合があります。
対処方法
起動に失敗したサービス「Systemwalker MpOpagt」を手動で起動してください。また予防策として以下の負荷分散の対処を実施してください。
サービスの設定で、Systemwalker Centric Managerのサービスでスタートアップの種類が「自動」であるものについて、「手動」に変更します。
Systemwalker Centric Managerのサービスは、“機能区分/プロセス名対応一覧”を参照してください。
Systemwalker Centric Managerの起動コマンド「scentricmgr」を組み込んだバッチファイルを作成します。
バッチファイルによるSystemwalker Centric Managerの起動が、OS起動時の自動起動サービスの起動タイミングと重ならないようにするため、「scentricmgr」の前に待ち合わせ処理を組み込んでください。
待ち合わせ処理については、OS標準のコマンドは存在しませんので、Sleep()関数等を使用したコマンドを作成してバッチファイルに組み込んでください。
待ち合わせ時間は、OS起動時の自動起動サービスの起動完了に要する時間を目安に設定してください。イベントログに出力されるサービスの起動完了メッセージ等の発生時間を参考に、妥当な待ち合わせ時間を設定してください。
作成したバッチファイルを、スタートアップあるいはタスクスケジューラでOSの起動時に起動されるように設定します。
対処12
確認ポイント
問題のホストで以下のコマンドを2回実行し、以下の観点で確認してください。
[Windows版の場合]
opamsgrev |
[UNIX版の場合]
/opt/systemwalker/bin/opamsgrev |
【観点】
最後に表示されている、最新のメッセージが1回目と2回目で異なっているか。
表示されている最新のメッセージが、過去に発生したものではないか。
定常的に、短時間に大量のメッセージが出力されていないか。
表示結果が1回目と2回目で異なり、かつ、過去に発生したメッセージが表示されている場合は、Systemwalker Centric Managerでのメッセージ処理が遅延していると考えられます。定常的に短時間に大量のメッセージが出力されている場合は、それが原因であると考えられます。
原因
問題のホストで大量のメッセージが発生し続けた場合、Systemwalker Centric Managerがリアルタイムにメッセージを処理できなくなり、メッセージが発生してからSystemwalkerコンソールに表示されるまで遅延が発生することがあります。
対処方法
大量に発生しているメッセージの出力元のアプリケーション等で、メッセージの出力頻度を抑えるように調整してください。
なお、以下の方法により、Systemwalker Centric Manager側での対処も可能です。
[Windows版]
大量に発生しているメッセージがイベントログ(セキュリティ)に出力された監査機能のイベントである場合
→“[Systemwalkerコンソール]での表示、操作に時間がかかる(遅延している)、各サーバでCPU使用率が高くなっている”の対処2を参照してください。
[UNIX版]
大量に発生しているメッセージがsyslog経由のメッセージである場合
→/etc/syslog.confのメッセージ監視の定義を編集し、Systemwalker Centric Managerに通知するメッセージの条件を絞り込んでください。
詳細は、“syslogに出力するメッセージが表示されない”の対処4を参照してください。
対処13
確認ポイント
メッセージが通知されない被監視システム側で、前回のSystemwalker Centric Manager起動時にイベントログ/シスログへ、以下のエラーメッセージが出力されていませんか。
[Windows]
MpOpagt: 警告: 126: メッセージ送信先システム定義に定義されているホスト(%1)はシステムに定義されていません。この行を無視します |
%1: メッセージ送信先システムに定義してある名前
[UNIX]
opagtd: 警告: 21: ホスト名 (%1) はシステムに定義されていません |
%1: システムに定義されていないホスト名[Windows版の場合]
原因
Systemwalker Centric Manager起動時にメッセージ送信先システムに定義されているホスト名の名前解決に失敗したことが原因です。
対処方法
以下のどちらかの対処を行った後、Systemwalker Centric Managerを再起動してください。
/etc/hostsでホスト名を管理している場合
/etc/hostsにホスト名を定義するか、メッセージ送信先システムに定義したホスト名をIPアドレスに修正してください。
DNS/NISサーバでホスト名を管理している場合
DNS/NISサーバにメッセージホスト名を定義するか、メッセージ送信先システムに定義したホスト名をIPアドレスに修正してください。