パトロール診断で異常を検出した場合の対処方法について説明します。
以下の手順で、対処を行ってください。
以下のいずれかの方法で、故障したハードウェアを特定します。
CRMメインウィンドウまたはsyslogd(1M)に表示されたメッセージ本文
メッセージについては、“PRIMECLUSTER 活用ガイド<メッセージ集>”の“3.2 CRMビューのメッセージ”および“第4章 FJSVcluster 形式のメッセージ”を参照してください。
CRMメインウィンドウ
CRMメインウィンドウでは、故障したハードウェアはOFF-FAIL状態で表示されます。CRMメインウィンドウの詳細については、“7.1.2 CRMメインウィンドウ”を参照してください。
clgettree(1)コマンド
clgettree(1)コマンドでは、故障したハードウェアはOFF-FAIL状態で表示されます。clgettree(1)コマンドの詳細については、clgettree(1)のマニュアルページを参照してください。
以下の手順で対処します。
◆操作手順
故障したハードウェアが接続されているノードを停止します。
故障したハードウェアを修復します。
ノードを起動します。
注意
GDS に登録されているディスク装置を交換する場合は、GDS のディスク交換手順に従って作業してください。GDS のディスク交換手順については、“PRIMECLUSTER Global Disk Services 説明書”を参照してください。
故障したハードウェアが回復したことを確認します。
以下のいずれかの方法で、ハードウェアが回復したことを確認してください。
CRMメインウィンドウで、故障が回復したことを確認する
clgettree(1)コマンドで、故障が回復したことを確認する
上記の方法で故障が回復していなかった場合、以下のいずれかの手順でハードウェアが回復したことを確認してください。
CRMメインウィンドウで、故障状態のハードウェアに対して、診断操作を行う
診断操作後、CRMメインウィンドウで、故障が回復したことを確認してください。故障が回復した場合、ON状態で表示されます。
clsptl(1M)コマンドで、診断操作を行う
clsptl(1M)コマンドは、故障状態のハードウェアを指定して診断を行う機能と、全ての共用ディスク装置または全てのネットワークインタフェースカードを一括診断する機能があります。複数のハードウェアが故障した場合は、一括診断機能を使用すると便利です。
故障状態の共用ディスク装置を指定して診断を行う場合の例
# /etc/opt/FJSVcluster/bin/clsptl -u generic -n c1t4d4
全ての共用ディスク装置に対して一括診断を行う場合の例
# /etc/opt/FJSVcluster/bin/clsptl -a DISK
診断操作後、clgettree(1)コマンドで、故障が回復したことを確認してください。故障が回復した場合、ON状態で表示されます。
Faulted 状態のクラスタアプリケーションを運用状態にします。
RMSメインウィンドウまたはhvdisp(1M)コマンドで、故障が回復したハードウェアが登録されているクラスタアプリケーションの状態を確認します。
クラスタアプリケーションがFaulted状態の場合、RMSメインウィンドウまたは hvutil(1M)コマンドで、Faulted 状態のクラスタアプリケーションを運用状態にします。CRMメインウィンドウでの操作手順は、“7.2.2.4 Faulted 状態のクラスタアプリケーションを運用可能な状態にする”を参照してください。
オペレータ介入要求を動作するように設定を行っている場合、RMS起動時にsyslogd(1M)とCluster Adminにメッセージが表示されます。このメッセージに応答することでもFaulted 状態のクラスタアプリケーションを運用状態にすることができます。オペレータ介入要求の設定手順は、“5.4 故障リソース特定とオペレータ介入要求の設定”を参照してください。
以下にオペレータ介入要求のメッセージ例を示します。オペレータ介入要求が表示するメッセージの詳細については、“PRIMECLUSTER 活用ガイド<メッセージ集>”の“3.2 CRMビューのメッセージ”および“4.2 応答(QUESTION)メッセージ”を参照してください。
1422 SysNode "node1RMS" のuserApplication "app0" はリソース"apl1" が故障したためFaulted 状態です。Faulted 状態をクリアしますか。(yes/no) メッセージ番号: 1001
注意
クラスタアプリケーションのAutoStartUp属性に“Yes”が設定されている場合、ノード起動時にオペレータ介入要求メッセージが表示されます。クラスタアプリケーションのAutoStartUp属性に“Yes”が設定されている場合は、操作手順“4.”を行った後に、オペレータ介入要求メッセージに応答してください。