ページの先頭行へ戻る
PRIMECLUSTER  導入運用手引書 4.3

5.2 故障リソース特定とオペレータ介入要求の設定

故障リソースの特定は、クラスタアプリケーションに登録しているリソースやノードに故障が発生した場合、syslogd(8)とClusterAdminにメッセージを表示し、Resource Fault Historyに故障リソースの履歴を表示する機能です。以下に、故障リソース特定が表示するメッセージ例を示します。

6750 リソース故障が発生しました。SysNode:node1RMS userApplication:app0 Resource:apl1

オペレータ介入要求は、クラスタアプリケーション起動時に、故障したリソースが存在する場合やRMSが起動していないノードが存在する場合に、オペレータに質問形式のメッセージを表示する機能です。オペレータ介入要求のメッセージは、syslogd(8)とClusterAdminに表示されます。

1421 userApplication "app0" は、userApplication を構成する全てのSysNodeが所定時間内に起動しなかったため、自動起動しませんでした。
userApplication をSysNode "node1RMS" で強制起動しますか? (no/yes)
メッセージ番号: 1001
警告:userApplication の強制起動は安全性チェックが無効になります。使い方を誤ると、データが破損したり整合性が失われる場合があります。
強制起動するuserApplicationが、クラスタ内でオンラインでないことを確認した上で実行してください。

リソースデータベースの初期構成設定後は、必ず故障リソース特定とオペレータ介入要求を動作させる設定を行ってください。

参照

故障リソース特定が表示するメッセージ、およびオペレータ介入要求が表示するメッセージの詳細については、“D.5.2 故障リソースとオペレータ介入のメッセージ(GUI)”と“D.4 オペレータ介入メッセージ”を参照してください。

注意

  • PRIMECLUSTERインストール後、故障リソース特定とオペレータ介入要求は動作しません。また、以下のClusterAdminの機能も動作しません。

    • ClusterAdminに故障リソース特定とオペレータ介入要求のメッセージが表示されません

    • ClusterAdminの“Resource Fault History画面”で、現在故障が発生しているリソースのリストが表示されません

    • ClusterAdminの“Resource Fault History画面”で、リソースの故障履歴が表示されません

  • 各コマンドのマニュアルページを参照するには、“/etc/opt/FJSVcluster/man”をMANPATH変数に追加してください。

故障リソース特定とオペレータ介入要求を動作させるための手順は、以下になります。

■故障リソース特定とオペレータ介入要求メッセージ表示のための準備

故障リソース特定とオペレータ介入要求メッセージは、syslogd(8)/rsyslogd(8)を利用してメッセージ表示を行っています。故障リソース特定とオペレータ介入要求メッセージのプライオリティ(facility.level)は、daemon.errを指定しています。

プライオリティについては、syslog.conf(5)/rsyslogd.conf(5)のマニュアルページを参照してください。

故障リソース特定とオペレータ介入要求メッセージをコンソールに表示したい場合、以下の手順をすべてのノードで実施してください。

◆操作手順

  1. ログイン

    システム管理者権限でログインします。

  2. syslogd/rsyslogdの設定確認と変更

    daemon.errがコンソールに表示されるように設定します。

    • RHEL5の場合

      1. syslogdにて、daemon.errがコンソールに表示される設定であることを確認します。

        syslogdの設定は、“/etc/syslog.conf”で行います。

        [例] daemon.errがコンソールに表示される設定例

        daemon.err        /dev/console

        “/etc/syslog.conf”については、syslog.conf(5)のマニュアルページを参照してください。

      2. daemon.errがコンソールに表示されない設定の場合は、syslogdの設定を変更するため“/etc/syslog.conf”を修正します。

        その後、“/etc/syslog.conf”の修正を反映させるため、以下のコマンドを実行して、システムログのデーモンを再起動します。

        # /etc/init.d/syslog restart
    • RHEL6の場合

      1. rsyslogdにて、daemon.errがコンソールに表示される設定であることを確認します。

        rsyslogdの設定は、“/etc/rsyslog.conf”で行います。

        [例] daemon.errがコンソールに表示される設定例

        daemon.err        /dev/console

        “/etc/rsyslog.conf”については、rsyslog.conf(5)のマニュアルページを参照してください。

      2. daemon.errがコンソールに表示されない設定の場合は、rsyslogdの設定を変更するため、“/etc/rsyslog.conf”を修正します。

        その後、“/etc/rsyslog.conf”の修正を反映させるため、以下のコマンドを実行して、システムログのデーモンを再起動します。

        # /etc/init.d/rsyslog restart
  3. コンソールの起動

    コンソールを起動します。

    [例]

    # kterm -C あるいは  # xterm -C

注意

日本語のシステムで運用している場合、日本語対応しているコンソールを使用してください。
本設定を行うことで、故障リソース特定とオペレータ介入要求以外のメッセージもコンソールに表示されるようになります。日本語対応していないコンソールの場合、日本語のメッセージが表示されません。

■故障リソース特定とオペレータ介入要求を動作させる場合

以下の手順を行ってください。

◆操作手順

  1. clsetparamコマンドを実行し、故障リソース特定とオペレータ介入要求を動作させるように設定します。本手順は、クラスタシステムを構成するいずれかのノードで行ってください。

    # /etc/opt/FJSVcluster/bin/clsetparam -p AppWatch ON
  2. clsetparamコマンドを実行し、故障リソース特定とオペレータ介入要求が動作するように設定されたことを確認します。本手順は、クラスタシステムを構成するいずれかのノードで行ってください。

    # /etc/opt/FJSVcluster/bin/clsetparam -p AppWatch
    ON
  3. 起動している全てのノードを再起動します。

    停止しているノードの故障リソース特定とオペレータ介入要求は、次回ノード起動時から動作するようになります。

■故障リソース特定とオペレータ介入要求を動作させない場合

一旦設定した「故障リソース特定とオペレータ介入要求を動作させる」の設定を解除する場合は、以下の手順を行ってください。

◆操作手順

  1. clsetparamコマンドを実行し、故障リソース特定とオペレータ介入要求を動作しないように設定します。本手順は、クラスタシステムを構成するいずれかのノードで行ってください。

    # /etc/opt/FJSVcluster/bin/clsetparam -p AppWatch OFF
  2. clsetparamコマンドを実行し、故障リソース特定とオペレータ介入要求が動作しないように設定されたことを確認します。本手順は、クラスタシステムを構成するいずれかのノードで行ってください。

    # /etc/opt/FJSVcluster/bin/clsetparam -p AppWatch
    OFF
  3. 起動している全てのノードを再起動します。

    停止しているノードの故障リソース特定とオペレータ介入要求は、次回ノード起動時から動作しないようになります。