ネットワーク機器に異常がないにもかかわらず、以下のようなメッセージが出力されHUB監視が異常終了する。
hanet: ERROR: 87000: polling status changed: primary polling failed. (hme0,target=192.13.71.20) hanet: ERROR: 87100: polling status changed: secondary polling failed. (hme1,target=192.13.71.21) |
NIC切替方式では、インタフェースの活性化に伴うEthernetレベルでのデータリンクの確立処理、STP(スパニングツリープロトコル)の転送遅延タイマにより、通信可能になるまで時間がかかる場合があり、インタフェースを活性化しても即座に通信が可能な状態にはなりません。一般的には、インタフェースを活性化後、データリンクの確立処理は、数秒程度で完了しますが、STPを使用する設定となっている場合、STPの転送遅延タイマにより、通信可能な状態になるまでには、30~50秒程度を必要とします。
このため、hanetpoll onコマンドで、リンクアップの完了待ち時間(デフォルト値:60秒)を短くしていた場合に、ping監視に失敗し切替えが発生する場合があります。
このような場合、hanetpoll on コマンドで、転送遅延時間に合わせてリンクアップの完了待ち時間を延長してください。
なお、STPが動作しているHUBでは、リンクアップの完了後に実際に通信が可能となるまでに転送遅延時間の2倍(一般的な値は30秒)の時間を要します。STPが動作している場合の標準的なリンクアップの完了待ち時間は、以下の計算式により見積もることができます。
STP転送遅延時間の確認方法については、使用しているHUBのマニュアルを参照してください。
リンクアップの完了待ち時間 > STP転送遅延時間 × 2 + 監視時間 × 監視回数 |
注意
ファイアウォールが動作しているシステム上でping監視を行う場合は、監視先IPに対するpingが通過するようファイアウォールの設定を行う必要があります。通過設定が行われていない場合には、ping監視に失敗します。なお、ファイアウォール通過の設定は、プライマリインタフェースとセカンダリインタフェースで同じ設定を行うようにしてください。
伝送路二重化機能の運用コマンドの実行に時間がかかる。
クラスタ運用時にクラスタアプリケーションの起動やノード切替に時間がかかる。
仮想インタフェース情報や監視先情報等で指定したホスト名、IPアドレスが /etc/inet/hostsファイルに記述されていない場合や、/etc/nsswitch.confにおいて、アドレス解決順でfilesが先頭に指定されていない場合、内部的に実行している名前-アドレス変換処理に時間がかかり、コマンドの実行やクラスタ状態遷移に時間がかかる場合があります。伝送路二重化機能で使用するIPアドレス、ホスト名がすべて /etc/inet/hosts に記述されていること、および、名前-アドレス変換時に /etc/inet/hosts が最初に参照されることを確認してください。
GS/SURE連携方式で仮想IPによるTCP通信を行っているにもかかわらず、dsphanetコマンドによりコネクションの振り分け状態を表示した際に、コネクション数が表示されない。
# /opt/FJSVhanet/usr/sbin/dsphanet -c Name IFname Connection +------+------+----------+ sha0 sha2 - sha1 - sha10 sha12 - sha11 - |
GS/SURE連携方式でTCPコネクションの振り分けを行う場合には、hanetobservコマンドで相手システムの情報を定義する必要があります。また、TCP以外のプロトコルについては、振り分け対象とはなっていません。UDPやICMPについては、経路情報に従って送信されます。
セルフチェック機能によって仮想ドライバのハングアップが検出された。
セルフチェック機能は、監視用のプロセスを起動します。このプロセスがシステムの高負荷によって60秒以上動作しなかった場合、誤ってドライバのハングアップを検出することがあります。
ハングアップ検出のメッセージ出力後に、dsphanetコマンドによる状態表示が正常に動作する場合は、ドライバはハングアップしていません。
ドライバのハングアップ検出時間を延長することで、誤検出を回避できる場合があります。
ハングアップ検出時間の延長は、以下の手順に従って設定してください。
設定ファイルを編集し、検出時間を設定します。
/etc/opt/FJSVhanet/config/mond.conf
drv_resp 120 ←パラメタを追加して、値を設定 |
drv_resp:仮想ドライバハングアップ検出時間(秒)
指定可能範囲は1~3600です。
追加の行が設定されていない場合は、デフォルト値として60が設定されます。
仮想ドライバハングアップ検出を無効にすることはできません。
システムをリブートします。
# /usr/sbin/shutdown -y -g0 -i6 |
以下のエラーメッセージがsyslogに出力され、NICが切り替わる。
ERROR: 93100: hangup of ping command has been detected. (target=HUB監視先IPアドレス) |
HUB監視機能のping監視でpingコマンドを実行した際、pingコマンドが30秒以内に完了しなかった場合に発生します。
NICの故障、またはOSの一時的な高負荷状態が原因と考えられます。
OSの高負荷が原因の場合、以下のファイルを編集し、pingコマンドのハングアップ検出時間を延長してください。
ファイル:/etc/opt/FJSVhanet/config/ctld.param
# # HA-Net Configuration File # # Each entry is of the form: # # <param> <value or string> # observ_msg 0 # suppress observe message transition_mode 0 # resource status transition mode logicalif_takeover_type 1 # takeover Zone and RAC interface ping_hang_detect_time 90 ←パラメタを追加して、値を設定 |
ping_hang_detect_time:pingコマンドのハングアップ検出時間(秒)
指定可能範囲は5~300です。
pingハング検出機能を無効にしたい場合は0を設定します。
追加の行が設定されていない場合は、デフォルト値として30が設定されます。