事象
ノード fuji2 がパニックし、再起動されました。ノード fuji2 のコンソールに以下のメッセージが表示されます。
Aug 28 10:38:25 fuji2 kernel: CF: fuji2: busy: local node not DOWN: retrying |
この場合、ノード fuji2が、LEFTCLUSTER 状態になっている可能性があります。
診断
ノード fuji2 の /var/adm/messages を参照します。
Aug 28 10:38: fuji2 kernel: CF: (TRACE): JoinServer: Startup. |
上記の内容は、ノード fuji2 はクラスタを離脱しているのに DOWN 宣言されていないことを示しています。
また、fuji3 のコンソールにも /var/adm/messages にも新しいメッセージはありません。
ノード fuji3 で cftool -n を実行して、ノードの状態を表示します。
fuji3:cftool -n |
上記のとおり、ノード fuji2 が LEFTCLUSTER 状態になっていることが確認されます。
修正方法
LEFTCLUSTER 状態は、cftool -k を実行することで解除できます。
このオプションを指定すると、ノードは DOWN 状態になります。
注意
稼動中のノードを DOWN 宣言すると重大な障害が発生し、最悪の場合にはデータが消失する可能性があります。ノードが停止していない場合には、cftool コマンドでノードを DOWN 状態にしないでください。
cftool -k |
ノード fuji3 のコンソールに以下のメッセージが表示されます。
Aug 28 10:47:39 fuji3 kernel: CF: FUJI: fuji2 is Down. (#0000 2) |
また、ノード fuji2 のコンソールに以下のメッセージが表示されます。
Aug 28 10:49:00 fuji2 kernel: CF: Local Node fuji2 Created Cluster FUJI. |