PRIMECLUSTER導入運用手引書 4.1(Linux版)
|
目次
索引

|
7.4.1.1 異常発生時の異常検出と原因の特定
リソースに異常が発生した場合には、PRIMECLUSTER、およびOS等の機能を利用して異常を検出、および原因となる障害発生リソースの特定を行うことができます。
以下、文中の(a)、(b)...は、後述の◆異常確認機能一覧に対応しています。
◆異常の検出
通常、RMSメインウィンドウ(a)を使用して、クラスタアプリケーションの監視を行います。
- リソースやシステムに故障が発生した場合
userApplicationのフェイルオーバが発生したり、ノードのパニックが発生します。
この場合、以下の現象が発生することで、異常を検出することができます。
- RMSメインウィンドウ(a)内のアイコンの色が変わる。
- msgメインウィンドウ(c)、Syslog(f)、コンソール(g)にメッセージが表示される。
- システムに警告レベルの異常が発生した場合
システムに警告レベル(ディスク容量不足、swap領域不足等)が発生した場合、以下の現象が発生することで、異常を検出することができます。
- Syslog(f)、コンソール(g)にメッセージが表示される。
- RMS起動時にuserApplicationが起動しない
RMS起動時に、全てのノードでRMSが起動していない場合、userApplicationは起動しません。このような場合、以下を行うことで、userApplicationを起動することができます。
- clreplyコマンドを実行することで、未応答のオペレータ介入要求を確認することができます。未応答のオペレータ介入要求メッセージ応答することで、userApplicationを起動することができます。clreplyコマンドについては、マニュアルページを参照してください。
- Syslog(f)、コンソール(g)にオペレータ介入要求メッセージが表示されます。オペレータ介入要求メッセージに応答することで、userApplicationを起動することができます。
オペレータ介入要求メッセージの詳細については、"オペレータ介入メッセージ" を参照してください。

未応答のオペレータ介入要求メッセージが複数ある場合は、オペレータ介入要求メッセージごとに複数回応答してください。
他にも、以降の「◆異常確認機能一覧」の機能を利用して異常を検出できます。
◆原因の特定
異常の検出を行った機能、および以下の「◆異常確認機能一覧」の機能を利用して原因となる障害発生リソースの特定を行うことができます。
◆異常確認機能一覧
異常確認機能 |
マニュアル参照先 |
(a) |
RMSメインウィンドウ
RMSツリー、RMSクラスタテーブルを使用します。 |
"RMSメインウィンドウ" |
(b) |
CFメインウィンドウ
CFツリーを使用できます。 |
"CFメインウィンドウ" |
(c) |
MSGメインウィンドウ
クラスタ制御のメッセージを参照できます。
Cluster Admin 画面の[msg]タブを選択時に表示されます。 |
|
(d) |
アプリケーションログ |
"アプリケーションログの表示" |
(e) |
switchlog |
"switchlogの表示" |
(f) |
Syslog |
|
(g) |
コンソール
コンソール上またはSyslogに表示されるメッセージで確認できます。※ |
"メッセージ" |
(h) |
GDS の GUI |
"PRIMECLUSTER Global Disk Services 説明書" |
※コンソールについて
- RMSが全てのノードで起動していない場合のオペレータ介入要求メッセージ(メッセージ番号:1421,1423)は、userApplicationのAutoStartUp 属性にyes(1)が設定されている場合のみ表示されます。userApplicationの属性については、"PRIMECLUSTER RMS 導入運用手引書"の"8 付録-オブジェクトタイプ"を参照してください。
- リソースやシステム故障発生後のRMS起動時のオペレータ介入要求メッセージ(メッセージ番号:1422,1423)と故障リソースのメッセージは、userApplicationのPresistentFault 属性にyes(1)が設定されている場合のみ表示されます。userApplicationの属性については、"PRIMECLUSTER RMS 導入運用手引書"の"8 付録-オブジェクトタイプ" を参照してください。
- オペレータ介入要求と故障リソースのメッセージは、clwatchlogdデーモンがswitchlogを監視することで表示しています。RMS のhvenv.local ファイルに設定されているRELIANT_LOG_PATH の値を変更したときは、clwatchlogd にSIGHUP シグナルを送信する必要があります。clwatchlogd はこのシグナルを受信すると、RELIANT_LOG_PATH の最新の値を取得します。RELIANT_LOG_PATHの値を変更したときは、この操作を実行してからRMS を起動してください。
All Rights Reserved, Copyright (C) 富士通株式会社 2005