ページの先頭行へ戻る
PRIMECLUSTER  Cluster Foundation 導入運用手引書 4.7

5.2.3 クラスタパーティションが発生した場合

クラスタパーティションとは、クラスタノード間ですべてのCF通信が失われ、クラスタ自体が複数のノード群に分断されることです。

SFがすべてのクラスタノード上で正常動作している場合は、SFがクラスタパーティションの問題を解決します。しかし、設定されたSFが正常動作していない場合、または、SFによる強制停止処理が失敗した場合は、手動で状態を回復する必要があります。

クラスタパーティション状態から手動で回復するには、以下の手順を実行する必要があります。

  1. どのクラスタノード群を残すかを決定します。通常は、最もノード数の多いクラスタノード群か、最も重要なハードウェアが接続されたノード群か、最も重要なアプリケーションが稼動しているノード群を選択します。

  2. 残さないノード群内のすべてのノードを停止します。

  3. ネットワークの障害を解決して、すべてのクラスタノード間の接続をリストアします。

  4. 停止していたノードを再起動します。ノード再起動時にこれらのノードは自動的にクラスタに再参入します。

  5. ノードが参入に失敗し、停止と再起動の後LEFTCLUSTER状態が継続している場合は、Cluster Adminを使用してクラスタ内の稼動中のノードにログオンし、GUIのCF部分を起動します。[ツール]メニューから[ノードにDOWNマークを付ける]を選択し、すべてのシャットダウンノードにDOWNマークを付けます。

  6. ノードがクラスタに参入したことを確認します。

たとえば、以下の図について考えてみます。

図5.4 ネットワークパーティションが発生した4ノードクラスタ

この図では、4ノードクラスタでネットワークパーティションが発生しています。両方のクラスタインタコネクト (インタコネクト1とインタコネクト2) が切断されています。クラスタが2つのノード群に分割されています。ノードAとノードBは同じノード群にあり、ノードCとノードDはもう一方のノード群にあります。

SFで問題を解決できない場合にこの状態から回復するには、以下の手順を実行する必要があります。

  1. どのノード群を残すかを決定します。この例では、ノードAとノードBを残すことにします。

  2. もう一方のノード群のノードすべて (ノードCとノードD) を停止します。

  3. インタコネクト1とインタコネクト2の故障を修理して、分断されたノード群が再び相互に通信できるようにします。

  4. ノードCとノードDを再起動します。

  5. ノードCとDでLEFTCLUSTER状態が続く場合は、ノードAまたはノードBでCluster Admin GUIを実行します。CFメインウィンドウを表示し、プルダウンメニューの[ツール] - [ノードにDOWNマークを付ける]を選択します。LEFTCLUSTER状態にあるノードにすべてDOWNマークを付けます。