リソース異常が発生した場合に、SNMPマネージャが動作するサーバへSNMP Trap を送信できます。
本機能を用いることで、SNMPマネージャによりクラスタシステムを監視できます。
本機能の設定方法の詳細については、"PRIMECLUSTER 導入運用手引書 (Linux)" の "6.10.1 クラスタアプリケーションの設定内容" を参照してください。
SNMP Trap はバージョン2cが使用され、送信するSNMP Trapには以下の情報が含まれます。
リソース種別に応じたOID
リソース異常検出時のメッセージ
SNMP Trapの送信には、snmptrapコマンドが使用され、以下が実行されます。
snmptrap -v 2c -c <コミュニティ名> <送信先ホスト> .1.3.6.1.4.1.211.4.68.257 <OID> s <メッセージ本文>
SNMP Trapに設定されるOIDは以下の通りです。
No | OID | 説明 |
---|---|---|
1 | .1.3.6.1.4.1.211.4.68.257.1 | アプリケーションやミドルウェアのリソースで異常が発生した場合に設定されるOIDです。 |
2 | .1.3.6.1.4.1.211.4.68.257.2 | ネットワークの異常が発生した場合に設定されるOIDです。Glsリソース、または、引継ぎネットワークリソースで異常を検出した場合に設定されます。 |
3 | .1.3.6.1.4.1.211.4.68.257.3 | ファイルシステムの異常を検出した場合に設定されるOIDです。Fsystemリソースで異常を検出した場合に設定されます。 |
4 | .1.3.6.1.4.1.211.4.68.257.4 | ディスクの異常を検出した場合に設定されるOIDです。Gdsリソースで異常を検出した場合に設定されます。 |
「リソース異常検出時のメッセージ」には、リソース異常検出時にRMSがswitchlogへ出力したメッセージが格納されています。このメッセージの内容から、どのリソースで、どのような異常を検出したのかを確認できます。
含まれるメッセージの例:
2014-07-28 17:07:09.254:(DET, 7): ERROR: FAULT REASON: Resource <ManageProgram000_Cmd_APP1> transitioned to a Faulted state due to the resource unexpectedly becoming Offline.
また、メッセージ本文を“PRIMECLUSTER 活用ガイド<メッセージ集>” 内で探すことで、原因と対処方法を確認することができます。
注意
クラスタノードからSNMPマネージャが動作するホストまでの通信経路上で異常が発生した場合、SNMP Trapで異常を通知することはできません。
1つのクラスタアプリケーションにて複数のリソースの異常を同時に検出して、クラスタアプリケーションの切替えが発生した場合、そのうち1つのリソース異常のメッセージを通知します。このため、リソース異常の対処をクラスタノード上で実施後、他の異常が発生していないかをswitchlogで確認してください。