GS/SURE連携方式を運用する上で通信相手となるGS/SUREシステム(通信相手)について通信が可能かどうかを監視する機能を設定します。
監視先の設定には、hanetobservコマンドを使用します。設定方法については“7.5 hanetobservコマンド”を参照してください。
監視間隔の設定には、hanetpollコマンドを使用します。設定方法については、“7.7 hanetpollコマンド”を参照してください。
注意
なお、本設定を実施する前にGS/SURE連携方式(運用モード"c")の設定をしておく必要があります。
また、自システムがクラスタシステム上で運用されている場合には、GS/SUREシステム(通信相手)が停止した際にノード切替が発生します。この時、hanetobservコマンドにより定義されたすべての監視先から応答がない場合、自システムのNICが故障したと判断しノード切替を行いますが、GS/SUREシステム(通信相手)がすべて停止した場合についてもすべての監視先が応答を返さなくなり、不要な切替が発生します。このため、運用ノードと待機ノードの双方で、互いに監視を行うことで、すべての相手システムが停止した場合に誤ってノード切替が発生しないようにすることができます。
クラスタ運用時にはhanetobservコマンドで運用ノード、待機ノードの双方で、互いに監視を行うよう設定してください。なお、その場合には、運用ノード、待機ノードの双方で相手ノードを認識させるために、仮想IPアドレスには引継ぎIPアドレスを指定します。
伝送路異常検出シーケンスについて説明します。
GS/SURE連携方式では、通信相手ホスト監視機能で設定した通信相手の実IPアドレス、およびクラスタの他ノードのIPアドレスに対してpingを実行します。異常検出までの時間は以下のとおりです。
異常検出時間:
異常検出時間 = 監視間隔(秒)×(監視回数 - 1)+ pingのタイムアウト時間(*1) |
*1: 監視間隔が1秒の場合は1秒となり、それ以外の場合は2秒となります。
デフォルトの設定値では、以下のようになります。
5秒 × (5回 - 1) + 2秒 = 22秒
なお、通信相手が先に異常を検出した場合は、ping監視による異常検出を待たずに、伝送路が異常になったと判断します。
監視時間は、hanetpollコマンドで変更できます。設定方法については、“7.7 hanetpollコマンド”を参照してください。
図3.13 伝送路異常検出シーケンス
参考
ping監視は監視間隔(秒)で定期的に実行されます。また、監視先が故障してから次のpingが実行されるまで、最大で監視間隔(秒)が必要です。このため、故障発生時から検出まで最大27秒(22秒+最大5秒(デフォルトの監視間隔))程度の時間を必要とします。
アプリケーションがネットワークを監視する場合、伝送路二重化機能が伝送路を切替える間、異常を検出しないように監視時間を調整してください。
伝送路復旧検出シーケンスについて説明します。
GS/SURE連携方式では、通信相手ホスト監視機能で設定した通信相手の実IPアドレスに対してpingを実行します。伝送路異常を検出後、伝送路二重化機能は伝送路の復旧を監視するためにpingによる復旧監視を行います。復旧検出までの時間は以下のとおりです。
異常検出時間:
復旧検出時間 = 復旧監視間隔(秒) |
なお、通信相手が先に復旧を検出した場合は、ping監視による復旧検出を待たずに、伝送路が復旧したと判断します。
監視時間は、hanetpollコマンドで設定を変更できます。設定方法については、“7.7 hanetpollコマンド”を参照してください。
図3.14 伝送路復旧検出シーケンス