ページの先頭行へ戻る
Systemwalker Centric Manager/Systemwalker Event Agent トラブルシューティングガイド 監視編
FUJITSU Software

3.2.14 フェールオーバー クラスタをシャットダウンすると、クォーラムを失ってサービスが停止することがある

エラーメッセージ

FailoverClustering: 重大: 1177: クォーラムが失われたためにクラスタ サービスがシャットダウンしています。クラスタ内の一部またはすべてのノードとのネットワーク接続が失われたか、監視ディスクのフェールオーバーが原因となっている可能性があります。

対象バージョンレベル

確認ポイント

エラーメッセージ発生後にSystemwalker Centric Managerのサービス停止時のイベントが発生している場合、対処方法に従って回避してください。

原因

OSがSystemwalker Centric Managerのリソース停止(オフライン処理)を要求後、何らかの原因でオフライン処理に時間がかかってタイムアウトした場合、共有ディスクリソースのオフライン処理が先に行われます。また、タイムアウトしたリソースは強制停止されます。

対処方法

Systemwalker Centric Managerのグループ(デフォルト:CentricMGR Group)をオフラインにしてから、フェールオーバークラスタのシャットダウン(システムのシャットダウンや再起動を含む)を行ってください。

以下の記事は、Microsoft社の情報 KB2536102 からの抜粋です。

ポイント

この問題を回避するには、次のいずれかの方法を実行してください。

方法 1 : QuorumArbitrationTimeMax の値を大きくする

QuorumArbitrationTimeMax の値を設定するには、コマンド プロンプトで以下のコマンドを入力し、Enter キーを押します。

: QuorumArbitrationTimeMax に指定する数値は秒単位で、既定値は 20 (0x14) 秒です。

ここでは例として 60 秒を設定します。

cluster /prop quorumarbitrationtimemax=60

現在の設定値は、以下のコマンドを実行することで確認できます。

cluster /prop:quorumarbitrationtimemax

コマンド実行後の出力例 :

'<クラスタ名>' のプロパティの一覧を作成しています:
T クラスタ      名前                        値
- ----------- ------------------------ ---------
D <クラスタ名> QuorumArbitrationTimeMax 60 (0x3c)

: 適正値は環境によって異なります。強制終了 (ターミネート) してしまうリソースがオフラインに必要とする時間に併せて、設定値を決定します。問題が何度も発生する場合には、環境に合わせて少しずつ大きくして確認することを推奨します。

QuorumArbitrationTimeMax の値はクラスタ内でクォーラムが失われた状態を障害として検知するまでの時間となります。この値を大きくすることにより、障害が発生したときの検知が遅くなります。

QuorumArbitrationTimeMax の値を大きくしても問題が改善されない場合には、次の「方法 2」を検討してください。

方法 2 : クラスタ全体のシャットダウンの前に時間の掛かるリソースを事前にオフラインにする

: クラスタ サービスは前回終了時のリソース状態を保持します。次にクラスタ サービスを起動した際にはオフライン状態となりますので別途、オンラインの操作を実行してください。