ページの先頭行へ戻る
PRIMECLUSTER  導入運用手引書 4.5
FUJITSU Software

E.6.1 全ノードに正しい情報が配布されなかった場合の復旧方法

シャットダウンエージェント設定更新機能が動作するとき、他ノードで通信が不可能な状態になっていると、シャットダウンエージェントの構成定義ファイルは他ノードに配布されません。

この場合、各ノードで保持している情報の整合性が取れず、シャットダウンエージェントが正常に動作できなくなります。

このような状況になった場合の復旧方法を、以下に例をあげて説明します。

nodeAのBMCのIPアドレスが変更になり、かつ、nodeBが停止しているため、nodeBへのシャットダウンエージェントの構成定義ファイルの配布に失敗した場合

nodeA:10.20.30.41 → 10.20.30.51 に変更
nodeB:10.20.30.42(停止)
nodeC:10.20.30.43

  1. メッセージの確認

    nodeA (BMCのIPアドレスが変更されたノード)において、以下のいずれかのメッセージがsyslogに出力されていることを確認します。

    sfsacfgupdate: ERROR: Failed to copy the backup of <file> on node <node>.
    sfsacfgupdate: ERROR: Failed to distribute <file> to node <node>.
    sfsacfgupdate: ERROR: Failed to change the access permission of <file> on node <node>.
    sfsacfgupdate: ERROR: Failed to change the group of <file> on node <node>.
    sfsacfgupdate: ERROR: Failed to change the owner of <file> on node <node>.

    上記のメッセージが出力されている場合、<node>に対しての処理が失敗しています。

  2. 停止ノードの確認

    シャットダウンエージェント設定更新サービスの動作時に、他ノードがすべて停止している場合は、手順1 のメッセージは出力されません。停止しているノードが存在してないかを確認してください。

  3. 停止ノードの復旧

    停止ノードの状態を確認し、復旧してください。

  4. 現在の状態確認

    いずれかのノードで以下のコマンドを実行し、現在の状態を確認します。

    # /opt/SMAW/SMAWsf/bin/sfsacfgupdate -s
    Node : nodeA
     Node status : UP
     Configuration Update Service status : ENABLE
     BMC IP Address :
      10.20.30.51 ←10.20.30.41から変更になっている
     Configuration file :
      nodeA 10.20.30.51  ← nodeAにおいて、変更後の情報に更新されている
      nodeB 10.20.30.42
      nodeC 10.20.30.43
    
    Node : nodeB
     Node status : UP
     Configuration Update Service status : ENABLE
     BMC IP Address :
      10.20.30.42
     Configuration file :
      nodeA 10.20.30.41 ← nodeBにおいて、変更後の情報に更新されていない
      nodeB 10.20.30.42
      nodeC 10.20.30.43
    
    Node : nodeC
     Node status : UP
     Configuration Update Service status : ENABLE
     BMC IP Address :
      11.22.33.46
     Configuration file :
      nodeA 10.20.30.51 ← nodeCにおいて、変更後の情報に更新されている
      nodeB 10.20.30.42
      nodeC 10.20.30.43

    上記の場合、nodeBで保持しているシャットダウンエージェントの構成定義ファイルの情報において、nodeAのBMCのIPアドレスが、変更後の情報に更新されていないことがわかります。

  5. 情報の復旧

    正しい情報を保持しているノードで、以下のコマンドを実行し、状態を復旧します。

    この場合、nodeA および nodeC の保持している情報が正しいため、nodeA または nodeCで実行します。

    # /opt/SMAW/SMAWsf/bin/sfsacfgupdate -r
  6. 復旧後の確認

    いずれかのノードで以下のコマンドを実行し、現在の状態を確認します。

    以下の場合、nodeBで保持しているシャットダウンエージェントの構成定義ファイルの情報において、nodeAのBMCのIPアドレスが、変更後の情報に更新されたことがわかります。

    # /opt/SMAW/SMAWsf/bin/sfsacfgupdate -s
    Node : nodeA
     Node status : UP
     Configuration Update Service status : ENABLE
     BMC IP Address :
      10.20.30.51
     Configuration file :
      nodeA 10.20.30.51
      nodeB 10.20.30.42
      nodeC 10.20.30.43
    
    Node : nodeB
     Node status : UP
     Configuration Update Service status : ENABLE
     BMC IP Address :
      10.20.30.42
     Configuration file :
      nodeA 10.20.30.51 ← nodeBにおいて、変更後の情報に更新された
      nodeB 10.20.30.42
      nodeC 10.20.30.43
    
    Node : nodeC
     Node status : UP
     Configuration Update Service status : ENABLE
     BMC IP Address :
      11.22.33.46
     Configuration file :
      nodeA 10.20.30.51 
      nodeB 10.20.30.42
      nodeC 10.20.30.43