故障リソースの特定は、クラスタアプリケーションに登録しているリソースやノードに故障が発生した場合、syslogd(1M)とCluster Adminにメッセージを表示し、Resource Fault Historyに故障リソースの履歴を表示する機能です。リソースデータベースの初期構成設定後は、必ず故障リソース特定とオペレータ介入要求を動作させる設定を行ってください。以下に、故障リソース特定が表示するメッセージ例を示します。
6750 リソース故障が発生しました。SysNode:node1RMS userApplication:app0 Resource:apl1
オペレータ介入要求は、クラスタアプリケーション起動時に、故障したリソースが存在する場合やRMSが起動していないノードが存在する場合に、オペレータに質問形式のメッセージを表示する機能です。オペレータ介入要求のメッセージは、syslogd(1M)とCluster Adminに表示されます。
1421 クラスタアプリケーション "userApplication" は、クラスタアプリケーションを構成するすべての SysNode が 所定時間内に起動しなかったため、自動起動しませんでした。 クラスタアプリケーションを SysNode " SysNode " で強制起動できます。 警告: 強制起動を行う場合、クラスタを構成するすべてのノードでRMSが起動しているか確認し、起動していない ノードは、手動でシャットダウンしてから行ってください。強制起動では、複数ノードからの同時アクセスによる データ破損のリスクがあります。そのリスクを低減するため、RMSが起動していないノードを強制停止する場合が あります。 強制起動してもよろしいですか ? (no/yes) メッセージ番号: 1001
参照
故障リソース特定が表示するメッセージ、およびオペレータ介入要求が表示するメッセージの詳細については、“D.7.2 故障リソースとオペレータ介入のメッセージ(GUI)”と“D.5 オペレータ介入メッセージ”を参照してください。
本節では、故障リソース特定とオペレータ介入要求を動作させるための手順について説明します。
注意
PRIMECLUSTERインストール後、故障リソース特定とオペレータ介入要求は動作しません。また、以下のCluster Adminの機能も動作しません。
Cluster Adminに故障リソース特定とオペレータ介入要求のメッセージが表示されません
Cluster Adminの“Resource Fault History画面”で、現在故障が発生しているリソースのリストが表示されません
Cluster Adminの“Resource Fault History画面”で、リソースの故障履歴が表示されません
各コマンドのマニュアルページを参照するには、“/etc/opt/FJSVcluster/man”をMANPATH変数に追加してください。
■故障リソース特定とオペレータ介入要求を動作させる場合
以下の手順を行ってください。
◆操作手順
clsetparam(1M)コマンドを実行し、故障リソース特定とオペレータ介入要求を動作させるように設定します。本手順は、クラスタシステムを構成するいずれかのノードで行ってください。
# /etc/opt/FJSVcluster/bin/clsetparam -p AppWatch ON
clsetparam(1M)コマンドを実行し、故障リソース特定とオペレータ介入要求が動作するように設定されたことを確認します。本手順は、クラスタシステムを構成するいずれかのノードで行ってください。
# /etc/opt/FJSVcluster/bin/clsetparam -p AppWatch
ON
起動している全てのノードを再起動します。
停止しているノードの故障リソース特定とオペレータ介入要求は、次回ノード起動時から動作するようになります。
■故障リソース特定とオペレータ介入要求を動作させない場合
一旦設定した「故障リソース特定とオペレータ介入要求を動作させる」の設定を解除する場合は、以下の手順を行ってください。
◆操作手順
clsetparam(1M)コマンドを実行し、故障リソース特定とオペレータ介入要求を動作しないように設定します。本手順は、クラスタシステムを構成するいずれかのノードで行ってください。
# /etc/opt/FJSVcluster/bin/clsetparam -p AppWatch OFF
clsetparam(1M)コマンドを実行し、故障リソース特定とオペレータ介入要求が動作しないように設定されたことを確認します。本手順は、クラスタシステムを構成するいずれかのノードで行ってください。
# /etc/opt/FJSVcluster/bin/clsetparam -p AppWatch
OFF
起動している全てのノードを再起動します。
停止しているノードの故障リソース特定とオペレータ介入要求は、次回ノード起動時から動作しないようになります。