故障リソースの特定は、クラスタアプリケーションに登録しているリソースやノードに故障が発生した場合、syslogd(1M)とCluster Adminにメッセージを表示し、Resource Fault Historyに故障リソースの履歴を表示する機能です。リソースデータベースの初期構成設定後は、必ず故障リソース特定とオペレータ介入要求を動作させる設定を行ってください。以下に、故障リソース特定が表示するメッセージ例を示します。
6750 リソース故障が発生しました。SysNode:node1RMS userApplication:app0 Resource:apl1
オペレータ介入要求は、クラスタアプリケーション起動時に、故障したリソースが存在する場合やRMSが起動していないノードが存在する場合に、オペレータに質問形式のメッセージを表示する機能です。オペレータ介入要求のメッセージは、syslogd(1M)とCluster Adminに表示されます。
1421 userApplication "app0" は、userApplication を構成する全てのSysNodeが所定時間内に起動しなかったため、自動起動しませんでした。 userApplication をSysNode "node1RMS" で強制起動しますか? (no/yes) メッセージ番号: 1001 警告:userApplication の強制起動は安全性チェックが無効になります。使い方を誤ると、データが破損したり整合性が失われる場合があります。 強制起動するuserApplicationが、クラスタ内でオンラインでないことを確認した上で実行してください。
参照
故障リソース特定が表示するメッセージ、およびオペレータ介入要求が表示するメッセージの詳細については、“D.7.2 故障リソースとオペレータ介入のメッセージ(GUI)”と“D.5 オペレータ介入メッセージ”を参照してください。
本節では、故障リソース特定とオペレータ介入要求を動作させるための手順について説明します。
注意
PRIMECLUSTERインストール後、故障リソース特定とオペレータ介入要求は動作しません。また、以下のCluster Adminの機能も動作しません。
Cluster Adminに故障リソース特定とオペレータ介入要求のメッセージが表示されません
Cluster Adminの“Resource Fault History画面”で、現在故障が発生しているリソースのリストが表示されません
Cluster Adminの“Resource Fault History画面”で、リソースの故障履歴が表示されません
各コマンドのマニュアルページを参照するには、“/etc/opt/FJSVcluster/man”をMANPATH変数に追加してください。
■故障リソース特定とオペレータ介入要求を動作させる場合
以下の手順を行ってください。
◆操作手順
clsetparam(1M)コマンドを実行し、故障リソース特定とオペレータ介入要求を動作させるように設定します。本手順は、クラスタシステムを構成するいずれかのノードで行ってください。
# /etc/opt/FJSVcluster/bin/clsetparam -p AppWatch ON
clsetparam(1M)コマンドを実行し、故障リソース特定とオペレータ介入要求が動作するように設定されたことを確認します。本手順は、クラスタシステムを構成するいずれかのノードで行ってください。
# /etc/opt/FJSVcluster/bin/clsetparam -p AppWatch
ON
起動している全てのノードを再起動します。
停止しているノードの故障リソース特定とオペレータ介入要求は、次回ノード起動時から動作するようになります。
■故障リソース特定とオペレータ介入要求を動作させない場合
一旦設定した「故障リソース特定とオペレータ介入要求を動作させる」の設定を解除する場合は、以下の手順を行ってください。
◆操作手順
clsetparam(1M)コマンドを実行し、故障リソース特定とオペレータ介入要求を動作しないように設定します。本手順は、クラスタシステムを構成するいずれかのノードで行ってください。
# /etc/opt/FJSVcluster/bin/clsetparam -p AppWatch OFF
clsetparam(1M)コマンドを実行し、故障リソース特定とオペレータ介入要求が動作しないように設定されたことを確認します。本手順は、クラスタシステムを構成するいずれかのノードで行ってください。
# /etc/opt/FJSVcluster/bin/clsetparam -p AppWatch
OFF
起動している全てのノードを再起動します。
停止しているノードの故障リソース特定とオペレータ介入要求は、次回ノード起動時から動作しないようになります。