クラッシュダンプの確認
クラッシュダンプの保存ディレクトリ配下に、切替え発生時刻以降のクラッシュダンプが存在するか否かを確認してください。クラッシュダンプの採取時刻はls(1)コマンドなどを使用し、クラッシュダンプのタイムスタンプで確認します。
切替え発生時刻以降のクラッシュダンプが存在する場合
クラッシュダンプを採取してください。
切替え発生時刻以降のクラッシュダンプが存在しない場合
障害が発生したノードで再起動が可能な場合、手動でクラッシュダンプを採取してください。
参考
クラッシュダンプの保存ディレクトリ
クラッシュダンプは異常が発生したノードにファイルとして保存されます。保存先については、"Linuxユーザーズマニュアル" を参照してください。
KVM仮想マシン機能を使用した環境において、シャットダウン機構によりゲストOSの強制停止が行われた場合、またはゲストOSがパニックした場合、管理OSの以下のディレクトリにクラッシュダンプが保存されます。
/var/crash/<ゲストOS強制停止時刻(YYYYMMDDHHMMSS形式)>.<ゲストOSのドメイン名>.core
例:2011年4月20日12:34:56にnode1が強制停止された場合
/var/crash/20110420123456.node1.core
クラッシュダンプの採取
以下の機種の物理環境(物理マシン、または、KVM環境の管理OS上にPRIMECLUSTERを導入)では、OSのパニックによるクラッシュダンプが採取できません。
PRIMERGY RX1330M3 の RHEL8環境
PRIMERGY RX4770M3 の RHEL8環境
PRIMERGY TX1320M3 の RHEL8環境
PRIMERGY TX1330M3 の RHEL8環境
PRIMERGY CX1430M1 の環境
手動でクラッシュダンプを採取する場合、以下の手順で採取してください。この手順に従っていない場合、クラッシュダンプ採取中にノードの電源が切断され、クラッシュダンプの採取が途中で終了します。
シャットダウン機構の停止
全ノードで以下のコマンドを実行し、シャットダウン機構を停止します。
# sdtool -e
クラッシュダンプの採取
手動でクラッシュダンプを採取します。
以下のいずれかの方法でクラッシュダンプを採取してください。
本体装置の NMI ボタンを押下する
コンソールで <Alt> + <SysRq> + <C> キーを押下する
LEFTCLUSTER状態の確認
任意の1ノードで以下のコマンドを実行し、クラッシュダンプを採取しているノードがLEFTCLUSTER状態になっていることを確認します。LEFTCLUSTER状態になっていない場合、10秒ほど待って再度確認します。
# cftool -n
注意
CFハートビートのタイムアウト検出時間を変更している場合(/etc/default/cluster.configファイルにCLUSTER_TIMEOUTを設定している場合)、ハートビートタイムアウト時間だけ待ってから確認してください。
LEFTCLUSTER状態からの回復
“PRIMECLUSTER Cluster Foundation導入運用手引書”の“5.2 LEFTCLUSTERからの回復”を参照し、LEFTCLUSTER状態から回復します。
シャットダウン機構の起動
クラッシュダンプを採取しているノードを除いたすべてのノードで以下のコマンドを実行し、シャットダウン機構を起動します。
# sdtool -b