ページの先頭行へ戻る
PRIMECLUSTER 導入運用手引書 4.3

7.4.1 資源の状態が異常となった場合の対処方法

資源の状態が異常となった場合の対処方法について説明します。

以下の手順で、対処を行ってください。

7.4.1.1 異常発生時の異常検出と原因の特定

リソースに異常が発生した場合には、PRIMECLUSTER、およびOS等の機能を利用して異常を検出、および原因となる障害発生リソースの特定を行うことができます。

以下、文中の(a)、(b)...は、後述の◆異常確認機能一覧に対応しています。

◆異常の検出

通常、RMSメインウィンドウ(b)を使用して、クラスタアプリケーションの監視を行います。

他にも、以降の「◆異常確認機能一覧」の機能を利用して異常を検出できます。

◆原因の特定

異常の検出を行った機能、および以下の「◆異常確認機能一覧」の機能を利用して原因となる障害発生リソースの特定を行うことができます。

◆異常確認機能一覧

異常確認機能

マニュアル参照

(a)

メッセージ画面

C.3.1 故障リソースメッセージ

(b)

RMSメインウィンドウ
RMSツリー、RMSクラスタテーブルを使用します。

7.1.3 RMSメインウィンドウ

(c)

CFメインウィンドウ
CFツリーを使用できます。

7.1.1 CFメインウィンドウ

(d)

CRMメインウィンドウ
CRMツリーを使用します。
ハードウェアリソースの異常検出に有用です。

7.1.2 CRMメインウィンドウ

(e)

“Resource Fault History”画面
ハードウェアリソースの異常検出に有用です。

C.3.2 リソースの障害履歴

(f)

現時点で障害が発生しているリソースのリスト

C.3.3 故障リソースの一覧

(g)

MSGメインウィンドウ
クラスタ制御のメッセージを参照できます。
Cluster Admin 画面の[msg]タブを選択時に表示されます。

(h)

アプリケーションログ

7.3.4.2 アプリケーションログの表示

(i)

switchlog

7.3.4.1 switchlogの表示

(j)

Syslog

(k)

コンソール
コンソール上に表示されるメッセージで確認できます。
コンソールの“console problem”情報を参照することで、故障原因の特定を助けることができます。

付録D メッセージ

(l)

マシン管理のGUI

マシン管理説明書

(m)

MultiPathDisk view

マルチパスディスク制御ロードバランスオプション説明書

(n)

GDS の GUI

PRIMECLUSTER Global Disk Services 説明書

7.4.1.2 障害が発生したリソースの対処

以下の対処を行ってください。

  1. 障害が発生したリソースの対処

    障害が発生したリソースの問題を解決します。詳細は、“PRIMECLUSTER RMS リファレンスガイド”を参照してください。

    パトロール診断のエラーメッセージが表示された場合は、“7.4.2 パトロール診断で異常が検出された場合の対処方法”を参照し、対処してください。

    パトロール診断のメッセージは、メッセージを出力したプログラム名に“hvdet_sptl”が表示されるメッセージです。

    注意

    PRIMECLUSTER 製品以外に運用管理製品を使用している場合は、各運用管理製品で対処が必要な場合があります。

    詳細は、各運用管理製品のマニュアルを参照してください。

    (例) マシン管理、MultiPathDisk view、GDS

  2. クラスタアプリケーションの復旧

    RMSメインウィンドウで、対処したリソースが登録されているクラスタアプリケーションの状態を確認します。クラスタアプリケーションがFaulted状態の場合は、Faultedのクリア操作を行ってください。

    Faultedのクリア操作については、“7.2.2.4 Faulted 状態のクラスタアプリケーションを運用状態にする”を参照してください。