fjsnapコマンドは、トラブルの解析に必要なシステム情報を一括で取得するツールです。PRIMECLUSTERシステムで障害が発生した場合は、必要なエラー情報を収集して原因を追及することができます。
手順は以下のとおりです。
システム管理者権限でログインします。
fjsnapコマンドを実行します。
/usr/sbin/fjsnap -a output
output には、fjsnap コマンドを使用して収集したシステム情報の出力先となる出力ファイル名を指定します。
クラスタを構成する一部のノードが停止している状態でfjsnapコマンドを実行した場合に、以下のメッセージが switchlog および /var/log/messages に出力されることがありますが、対処は不要です。
(BM, 8) Failed sending message <message> to object <object> on host <host>.
(WRP, 11) Message send failed, queue id <queueid>, process <process>, <name>, to host <node>.
参照
fjsnap コマンドの詳細については、FJSVsnapパッケージに含まれているREADMEファイルを参照してください。
参考
fjsnapコマンドの実行タイミングについて
エラーメッセージが出力された場合など、通常運用時のトラブル発生時には、即座にfjsnapコマンドを実行してください。
システムハングなどにより、fjsnapコマンドが実行できない場合は、クラッシュダンプを採取してください。その後、シングルユーザモードで起動し、fjsnapコマンドを実行してください。クラッシュダンプの採取については、“C.1.2 クラッシュダンプ”を参照してください。
トラブル発生後に、ノードが自動的に再起動してしまった(シングルユーザモードで起動できなかった)場合や、誤ってマルチユーザモードで起動してしまった場合にも、fjsnapコマンドを実行してください。
fjsnapコマンドがエラーになる、またはfjsnapコマンドが復帰しないなどにより、調査情報が採取できない場合は、クラッシュダンプを採取してください。