事象
ノード fuji2 をノード fuji3 のクラスタに参入させようとすると、fuji3 に以下のコンソールメッセージが表示される。
Aug 30 21:31:35 fuji3 kernel: CF: Local node is missing a route from node: fuji2. Aug 30 21:31:35 fuji3 kernel: CF: missing route on local device: eth1. Aug 30 21:31:35 fuji3 kernel: CF: Node fuji2 Joined Cluster FUJI. (#0000 3) |
診断1
ノード fuji2 のデバイス情報を cftool -d で参照します。
メッセージ内容はコンソールと同じです。
fuji2:cftool -d Number Device Type Speed Mtu State Configured Address 1 eth0 4 100 1432 UP YES 00.03.47.c2.a8.3c 2 eth1 4 100 1432 UP NO 00.02.b3.88.b8.89 3 eth2 4 100 1432 UP NO 00.02.b3.88.b7.46 |
ノード fuji3 のデバイス情報を cftool -d で参照します。
ノード fuji3 にはコンソールメッセージは表示されません。
fuji3:cftool -d Number Device Type Speed Mtu State Configured Address 1 eth0 4 100 1432 UP YES 00.03.47.c2.a8.82 2 eth1 4 100 1432 UP YES 00.02.b3.88.09.f1 3 eth2 4 100 1432 UP NO 00.02.b3.88.09.ea |
問題
上記の内容を見ると、ノード fuji2 の eth1 が構成されていない。あるいは正常に動作していないことがわかります。
診断2
ノード fuji3 の /var/adm/messages を参照します。
Look in /var/adm/messages on node fuji3 Aug 27 16:05:59 fuji3 kernel: e100: eth1 NIC Link is Down Aug 27 16:06:08 fuji3 kernel: CF: Icf Error: (service err_type route_src route_dst). (#0000 0 2 1 1) Aug 27 16:06:08 fuji3 kernel: CF: (TRACE): CFSF failure detected: no SFopen: passed to ENS: fuji2. (#0000 1) Aug 27 16:06:08 fuji3 kernel: CF: Node fuji2 Left Cluster FUJI. (#00001) |
上記の内容は、eth1 デバイスまたはインタコネクトが一時的に失敗していることを示します。
これは、クラスタノード、ケーブル、ハブのいずれかの NIC に問題がある可能性があることを示しています。