PRIMECLUSTER導入運用手引書 4.2 (Linux版) |
目次 索引 |
付録C トラブルシューティング | > C.1 トラブル調査情報の採取方法 |
pclsnapコマンドはPRIMECLUSTERの障害調査情報情報採取ツールです。PRIMECLUSTERシステムで障害が発生した場合は、必要なエラー情報を収集して原因を追及することができます。
pclsnapコマンド実行を以下に示します。
システム管理者権限でログインします。
pclsnap コマンドを実行します。
/opt/FJSVpclsnap/bin/pclsnap -a output 、または/opt/FJSVpclsnap/bin/pclsnap -h output
-a は全ての詳細情報を収集するため、データが大きくなります。-h を指定すると、クラスタ制御情報のみが収集されます。
output には、pclsnap コマンドを使用して収集したエラー情報の出力先となる出力媒体の特殊なファイル名または出力ファイル名 (/dev/st0 など) を指定します。
pclsnap コマンドの詳細については、FJSVpclsnapパッケージに含まれているREADMEファイルまたはREADME.ja ファイルを参照してください。
pclsnapコマンドの実行タイミングについて
エラーメッセージが出力された場合などの通常運用時のトラブルは、トラブル発生時に即座にpclsnapコマンドを実行してください。
システムハング等のためpclsnapコマンドが実行できない場合は、クラッシュダンプを採取してください。その後、シングルユーザモードで起動し、pclsnapコマンドを実行してください。クラッシュダンプの採取については、"クラッシュダンプ"を参照してください。
トラブル発生後に、ノードが自動的に再起動してしまった(シングルユーザモードで起動できなかった)場合や、誤ってマルチユーザモードで起動してしまった場合にも、pclsnapコマンドを実行してください。
pclsnapコマンドがエラーになる、またはpclsnapコマンドが復帰しない等により調査情報が採取できない場合は、クラッシュダンプを採取してください。
pclsnapコマンドの実行に必要なディレクトリの空き容量について
pclsnapコマンドの実行に必要なディレクトリの空き容量の目安を、次の表に示します。
デフォルトディレクトリ |
空き容量(目安)(MB) |
|
出力ディレクトリ |
コマンド実行時のカレントディレクトリ |
300 |
一時ディレクトリ |
/tmp |
500 |
システム環境によって、上記目安値(300MB, 500MB)では空き容量不足となる場合があります。
ディレクトリの空き容量不足を原因として情報採取が正常に行われなかった場合、pclsnapコマンドは終了時にエラーメッセージまたは警告メッセージを出力します。この場合、以下に示す対処方法に従って、再度コマンドを実行してください。
●出力ディレクトリの空き容量不足への対処
pclsnapコマンドは、出力ファイルの生成に失敗した場合、次のエラーメッセージを出力します。ERROR: failed to generate the output file "xxx".DIAG: ...対処方法:出力ディレクトリを空き容量の大きなディレクトリに変更して、再度コマンドを実行してください。例:出力ディレクトリを/var/crashにする場合# /opt/FJSVpclsnap/bin/pclsnap -a /var/crash/output
●一時ディレクトリの空き容量不足への対処
pclsnapコマンドはコマンド終了時、次の警告メッセージを出力することがあります。WARNING: The output file "xxx" may not contain some data files.DIAG: ...この警告メッセージが出力された場合、pclsnapコマンドの出力ファイルは生成されますが、一部の採取対象情報が出力ファイルに含まれていない可能性があります。対処方法:一時ディレクトリを空き容量の大きなディレクトリに変更して、再度コマンドを実行してください。例:一時ディレクトリを/var/crashに変更する場合# /opt/FJSVpclsnap/bin/pclsnap -a -T/var/crash output
一時ディレクトリを変更しても同様の警告メッセージが出力される場合、次の原因が考えられます。
(1) システム状態に起因して、特定の情報採取コマンドがタイムアウトする
(2) 採取対象ファイルが、一時ディレクトリの空き領域と比較して大きい
(1) の場合は、pclsnapの出力ファイルに含まれるpclsnap.elogファイルにタイムアウト発生のログが記録されています。pclsnapの出力ファイルとともに、可能であればクラッシュダンプを採取してください。
(2) の場合は、次の(a)(b)などが一時ディレクトリの空き容量よりも大きくなっていないか、確認してください。
(a) ログファイルのサイズ
/var/log/messages
/var/opt/SMAW*/log/ 配下のログファイル(SMAWsf/log/rcsd.log など)
(b) コアファイルの合計サイズ
GFSのコアファイル
/var/opt/FJSVsfcfs/cores/*GDSのコアファイル
/var/opt/FJSVsdx/*core/*
これらが一時ディレクトリの空き容量よりも大きい場合には、該当ファイルを出力ディレクトリおよび一時ディレクトリとは別パーティションに移動して、再度pclsnapコマンドを実行してください。なお、移動したファイルは消さずに保存しておいてください。
目次 索引 |