ページの先頭行へ戻る
PRIMECLUSTER 導入運用手引書 4.3

C.1.1 fjsnapコマンドの実行

fjsnapコマンドはSolarisのシステム情報ツールで、FJSVsnap 拡張サポート機能パッケージに付属しています。PRIMECLUSTERシステムで障害が発生した場合は、必要なエラー情報を収集して原因を追及することができます。

fjsnapコマンド実行を以下に示します。

  1. システム管理者権限でログインします。

  2. fjsnap コマンドを実行します。

    /opt/FJSVsnap/bin/fjsnap -h output 、または

    /opt/FJSVsnap/bin/fjsnap -a output

    • -a は全ての詳細情報を収集するため、データが大きくなります。-h を指定すると、クラスタ制御情報のみが収集されます。

    • output には、fjsnap コマンドを使用して収集したエラー情報の出力先となる出力媒体の特殊なファイル名または出力ファイル名 ( /dev/rmt/0 など) を指定します。

    • クラスタを構成する一部のノードが停止している状態でfjsnapコマンドを実行した場合に、以下のメッセージが switchlogおよび/var/adm/messagesに出力されることがありますが、対処は不要です。

      (BM, 8) Failed sending message <message> to object <object> on host <host>.
      (WRP, 11) Message send failed, queue id <queueid>, process <process>, <name>, to host <node>.

参照

fjsnap コマンドの詳細については、FJSVsnapパッケージに含まれているREADMEファイルであるREADME.ja ファイルを参照してください。

参考

fjsnapコマンドの実行タイミングについて

  • エラーメッセージが出力された場合などの通常運用時のトラブルは、トラブル発生時に即座にfjsnapコマンドを実行してください。

  • システムハング等のためfjsnapコマンドが実行できない場合は、システムダンプを採取してください。その後、シングルユーザモードで起動し、fjsnapコマンドを実行してください。
    システムダンプは、アボートキーシーケンス(Break信号など)を入力して、ノードをOBPモードに強制停止した後、“sync”を実行して採取します。ノードをOBPモードに強制停止する詳細な手順は、Solarisのマニュアル“Solarisのシステム管理”を参照してください。

  • トラブル発生後に、ノードが自動的に再起動してしまった(シングルユーザモードで起動できなかった)場合や、誤ってマルチユーザモードで起動してしまった場合にも、fjsnapコマンドを実行してください。

  • fjsnapコマンドがエラーになる、またはfjsnapコマンドが復帰しない等により調査情報が採取できない場合は、システムダンプを採取してください。