ページの先頭行へ戻る
PRIMECLUSTER Wizard for NAS(PRIMEQUEST) 4.3 導入運用手引書
FUJITSU Software

付録B NR1000F クラスタの自動 takeover 機能のチューニング方法

PRIMECLUSTER Wizard for NAS では、ping / ping6 コマンドにより NR1000F 装置へアクセス可能かどうか監視しています。そして、ping / ping6 の応答がない (アクセス不能) 場合に自動 takeover 処理を行います。以下では、NR1000F クラスタの自動 takeover 実行開始時間、および環境設定 Wizard で設定可能な ping / ping6 コマンドに対するパラメーターのチューニング方法について説明します。

自動 takeover 実行開始時間のチューニング

自動 takeover 処理の実行開始時間は、クラスタノード - HUB 間監視とクラスタノード -NR1000F 装置間監視を考慮する必要があります。

  1. クラスタノード - HUB 間では GLS リソースが監視を行っています。GLS 監視により、NIC 切替えが完了するまでは自動 takeover が実行しないように設定しなければいけません。
    つまり、
    GLS 監視開始時間 (a) + NIC 切替え時間 (b) < 自動 takeover 実行開始時間 (X)
    を満たす必要があります。
    よって、次式のようになります。

    (a) + (b) = 10 (秒)+ 約30 or 約60(秒) < X(秒)

    NIC切替えの所要時間

    HUB-HUB監視なしの場合

    約30秒

    HUB-HUB監視ありの場合

    約60秒

    参照

    GLS 監視については、「PRIMECLUSTER Global Link Services 導入運用手引書 (伝送路二重化機能編)」 を参照してください。

  2. クラスタノード -NR1000F 装置間を監視している RemoteFileSystems リソースは、障害を検知すると300秒 (推奨値) 経過後にリソース異常となります。
    よって、PRIMECLUSTER Wizard for NAS の自動 takeover 実行開始までの時間と takeover に要する時間の和が、300秒以内である必要があります。
    つまり、次式のようになります。

    自動 takeover の実行開始時間 (X) ≦
    RemoteFileSystems リソースタイムアウト時間 (300秒) - takeover に要する時間

1. と 2. より、以下の条件式 (1) が考えられます。(X = 自動 takeover 実行開始時間)

約40秒 or 約70秒 < X < 300(秒) - takeoverに要する時間  ・・・・・・(1)

次に、自動 takeover 処理の実行開始までの流れを以下の図に示します。

図より、(1) 式を満たす自動 takeover 処理実行開始時間は (m) の範囲となります。

環境設定ウィザード設定可能な ping / ping6 コマンドのパラメのチューニング

以上のことから、ping / ping6 処理は (m) の範囲内で完了することが必要です。
デフォルト値は以下のようになります。

A

NR1000F 装置への ping / ping6 コマンドの発行回数

10回

B

NR1000F 装置への ping / ping6 コマンドのタイムアウト時間

5秒

C

NR1000F 装置への ping / ping6コマンドの実行間隔

5秒

Netapp リソースで異常検知してから、自動 takeover を実行するまでに要する ping / ping6 処理時間は以下の式により算出できます。

( B. + C. ) × ( A. - 1 ) + B. = (5+5)×9 + 5 = 95秒

よって、デフォルト値での自動 takeover 実行開始時間は PRIMECLUSTER Wizard for NAS の監視開始から95秒後となります。

注意

takeover に要する時間は環境により変化します。