PRIMECLUSTER導入運用手引書 4.2 (Linux版) |
目次 索引 |
第2部 導入編 | > 第5章 クラスタの構築 |
故障リソースの特定は、クラスタアプリケーションに登録しているリソースやノードに故障が発生した場合、syslogd(8)とClusterAdminにメッセージを表示し、Resource Fault Historyに故障リソースの履歴を表示する機能です。リソースデータベースの初期構成設定後は、必ず故障リソース特定とオペレータ介入要求を動作させる設定を行ってください。以下に、故障リソース特定が表示するメッセージ例を示します。
6750 リソース故障が発生しました。SysNode:node1RMS userApplication:app0 Resource:apl1
オペレータ介入要求は、クラスタアプリケーション起動時に、故障したリソースが存在する場合やRMSが起動していないノードが存在する場合に、オペレータに質問形式のメッセージを表示する機能です。オペレータ介入要求のメッセージは、syslogd(8)とClusterAdminに表示されます。
1421 userApplication "app0" は、userApplication を構成する全てのSysNodeが所定時間内に起動しなかったため、自動起動しませんでした。 userApplication をSysNode "node1RMS" で強制起動しますか? (no/yes) メッセージ番号: 1001 警告:userApplication の強制起動は安全性チェックが無効になります。使い方を誤ると、データが破損したり整合性が失われる場合があります。 強制起動するuserApplicationが、クラスタ内でオンラインでないことを確認した上で実行してください。
故障リソース特定が表示するメッセージ、およびオペレータ介入要求が表示するメッセージの詳細については、"故障リソースとオペレータ介入のメッセージ(GUI)"と "オペレータ介入メッセージ" を参照してください。
本節では、故障リソース特定とオペレータ介入要求を動作させるための手順について説明します。
PRIMECLUSTERインストール後、故障リソース特定とオペレータ介入要求は動作しません。また、以下のClusterAdminの機能も動作しません。
ClusterAdminに故障リソース特定とオペレータ介入要求のメッセージが表示されません
ClusterAdminの "Resource Fault History画面" で、現在故障が発生しているリソースのリストが表示されません
ClusterAdminの "Resource Fault History画面" で、リソースの故障履歴が表示されません
各コマンドのマニュアルページを参照するには、"/etc/opt/FJSVcluster/man"をMANPATH変数に追加してください。
故障リソース特定とオペレータ介入要求メッセージは、syslogd(8)を利用してメッセージ表示を行っています。故障リソース特定とオペレータ介入要求メッセージのプライオリティ(facility.level)は、daemon.errを指定しています。
プライオリティについては、syslog.conf(5)のマニュアルページを参照してください。
故障リソース特定とオペレータ介入要求メッセージをコンソールに表示するための手順を以下に説明します。以下の手順は、全てのノードで実施してください。
ログイン
システム管理者権限でログインします。
syslogdの設定確認と変更
syslogdの設定を確認し、daemon.errがコンソールに表示される設定であることを確認します。
syslogdの設定は、"/etc/syslog.conf"です。"/etc/syslog.conf" については、syslog.conf(5)のマニュアルページを参照してください。
[例] daemon.errがコンソールに表示される設定例
daemon.err /dev/console
daemon.errがコンソールに表示される設定が行われていない場合は、syslogdの設定を変更します。
syslogdの設定変更は、"/etc/syslog.conf"を修正します。"/etc/syslog.conf"修正を反映させるため、syslogdにSIGHUPシグナルを送ります。以下のコマンドを実行してsyslogdに定義ファイルを再読込みさせてください。
# kill -SIGHUP `cat /var/run/syslogd.pid`
コンソールの起動
コンソールを起動します。
[例]
# kterm -C
日本語のシステムで運用している場合、日本語対応しているコンソールを使用してください。
本設定を行うことで、故障リソース特定とオペレータ介入要求以外のメッセージもコンソールに表示されるようになります。日本語対応していないコンソールの場合、日本語のメッセージが表示されません。
以下の手順を行ってください。
clsetparamコマンドを実行し、故障リソース特定とオペレータ介入要求を動作させるように設定します。本手順は、クラスタシステムを構成するいずれかのノードで行ってください。
# /etc/opt/FJSVcluster/bin/clsetparam -p AppWatch ON
clsetparamコマンドを実行し、故障リソース特定とオペレータ介入要求が動作するように設定されたことを確認します。本手順は、クラスタシステムを構成するいずれかのノードで行ってください。
# /etc/opt/FJSVcluster/bin/clsetparam -p AppWatch
ON
起動している全てのノードを再起動します。
停止しているノードの故障リソース特定とオペレータ介入要求は、次回ノード起動時から動作するようになります。
一旦設定した「故障リソース特定とオペレータ介入要求を動作させる」の設定を解除する場合は、以下の手順を行ってください。
clsetparamコマンドを実行し、故障リソース特定とオペレータ介入要求を動作しないように設定します。本手順は、クラスタシステムを構成するいずれかのノードで行ってください。
# /etc/opt/FJSVcluster/bin/clsetparam -p AppWatch OFF
clsetparamコマンドを実行し、故障リソース特定とオペレータ介入要求が動作しないように設定されたことを確認します。本手順は、クラスタシステムを構成するいずれかのノードで行ってください。
# /etc/opt/FJSVcluster/bin/clsetparam -p AppWatch
OFF
起動している全てのノードを再起動します。
停止しているノードの故障リソース特定とオペレータ介入要求は、次回ノード起動時から動作しないようになります。
目次 索引 |