ページの先頭行へ戻る
PRIMECLUSTER Global Link Services 説明書 4.7 (伝送路二重化機能編)

H.3.2 待機パトロールのエラーメッセージ(875番)が出力される

現象

以下のようなメッセージがシステムログに出力される。

hanet: WARNING: 87500: standby interface failed. (sha1)

原因と対策

NIC切替方式の待機パトロールは、待機NIC(eth1)から隣接HUBを経由し、運用NIC(eth0)に対して監視フレームを送受信することにより行っています(プライマリNICを現用NICとして通信に使用している場合)。メッセージは監視フレームの送受信が途絶した場合に出力されますが、主な出力パターンとしては以下の4つがあります。

パターン1:

システム起動時に毎回、待機パトロールで異常を検出した旨のメッセージが出力され、dsphanetコマンドで出力される待機パトロールの状態がFAILとなった。

hanet: WARNING: 87500: standby interface failed. (sha1)
# /opt/FJSVhanet/usr/sbin/dsphanet
[IPv4,Patrol / Virtual NIC]
 Name       Status   Mode CL  Device
+----------+--------+----+----+------------------------------------------------+
 sha0       Active    d   OFF  eth0(ON),eth1(OFF)
 sha1       Active    p   OFF  sha0(FAIL)

パターン1の場合、HUBの設定誤りやケーブルの接続誤りになどにより待機パトロールの監視フレームがプライマリNIC(eth0)に到達していない可能性があります。

パターン2:

システム起動時に待機パトロールが正常に動作していることを示すメッセージが出力されたが、運用中に待機パトロールの異常を示すメッセージが出力され、dsphanetコマンドで出力される待機パトロールの状態がFAILとなった。

hanet: INFO: 89600: path to standby interface is established. (sha1)
        ・
        ・
hanet: WARNING: 87500: standby interface failed. (sha1)
# /opt/FJSVhanet/usr/sbin/dsphanet
[IPv4,Patrol / Virtual NIC]
 Name       Status   Mode CL  Device
+----------+--------+----+----+------------------------------------------------+
 sha0       Active    d   OFF  eth0(ON),eth1(OFF)
 sha1       Active    p   OFF  sha0(FAIL)

パターン2の場合、ネットワーク障害が発生した可能性があります。

パターン3:

運用中に待機パトロールの異常を示すメッセージが出力されたが、しばらくすると復旧を示すメッセージが出力された、または、異常を示すメッセージと復旧を示すメッセージが交互に出力される。

hanet: INFO: 89600: path to standby interface is established. (sha1)
        ・
        ・
hanet: WARNING: 87500: standby interface failed. (sha1)
hanet: INFO: 88500: standby interface recovered. (sha1)
        ・
        ・
hanet: WARNING: 87500: standby interface failed. (sha1)
hanet: INFO: 88500: standby interface recovered. (sha1)

パターン3の場合、HUBやGLSの設定誤り、ネットワーク負荷の増大などにより、一時的な監視フレームのロストが発生している可能性があります。

パターン4:

システム起動時に毎回、待機パトロールで異常を検出した旨のメッセージが出力され、その後、即座に復旧を示すメッセージが出力される。また、運用中は待機パトロールの状態はONとなっている。

hanet: WARNING: 87500: standby interface failed. (sha1)
hanet: INFO: 88500: standby interface recovered. (sha1)
# /opt/FJSVhanet/usr/sbin/dsphanet
[IPv4,Patrol / Virtual NIC]
 Name       Status   Mode CL  Device
+----------+--------+----+----+------------------------------------------------+
 sha0       Active    d   OFF  eth0(ON),eth1(OFF)
 sha1       Active    p   OFF  sha0(ON)

パターン4の場合、運用上の問題はありません。HUBにおいてSTP(スパニングツリープロトコル)が有効となっている場合、STPの転送遅延タイマのためインタフェースがリンクアップしても約30秒間は監視フレームの送受信ができません。このため、待機パトロールで一時的にエラーを検出しますが、転送遅延タイマが満了すれば正常に通信ができるようになります。また、設定の変更によりメッセージの出力を抑止することが可能です。

メッセージ出力パターンに応じて、以下の項目の確認を行ってください。

メッセージ出力パターン

確認項目

パターン1

HUBの設定

イーサフレームタイプ
VLAN ID

自ノードおよびネットワークの状態

HUBの状態
システムログ

ケーブル

接続確認
種別

パターン2

自ノードおよびネットワークの状態

HUBの状態
システムログ

ケーブル

接続確認
種別

パターン3

HUBの設定

通信モード

自ノードおよびネットワークの状態

保守作業
HUBの状態
システムログ
通信負荷

パターン4

HUBの設定

STPの設定

各確認項目の詳細は以下のとおりです。

確認項目

内容

ケーブル

接続確認

1) プライマリNIC、セカンダリNICが接続されているHUBのポートに誤りがないか確認してください。プライマリNIC、セカンダリNICが異なるHUBに接続されている場合は、HUB-HUB間でカスケード接続が行われていることを確認してください。また、NICおよびHUBのLEDによりケーブルの断線等が発生していないことを確認してください。
2) ブレードサーバやPRIMEQUESTの場合、筐体内のサーバ設置場所やネットワークポートの設定により、内部結線が変わってきます。結線状態が正しいかを確認してください。

種別

1) 使用しているケーブルの種類(ストレートケーブル、クロスケーブル)が正しいことを確認してください。なお、ケーブルの種別を自動認識する機能(Auto-MDIX)は、通信モードをオートネゴシエーションに設定しないと有効にならない場合があります。詳細は、HUBのマニュアルを確認してください。
2) 使用しているケーブルのカテゴリ(カテゴリ5、カテゴリ5e等)が、通信速度とケーブル長に合ったものになっていることを確認してください。

HUBの設定

イーサフレームタイプ

待機パトロールは監視フレームを送受信することにより監視を行っています。多くのHUBでは監視フレームでの通信が可能ですが、まれに、デフォルトの設定では監視フレームの通信を遮断するHUBが存在します。その場合は、任意のイーサフレームが通過可能となるようにHUBの設定を見直してください。

通信モード

自ノードで使用しているインタフェースとHUBのポートに設定されている通信モードに不整合がないか確認してください。HUBと自ノードのNICで通信モードの設定が異なる場合、コリジョンによるパケットロストが多発する場合があります。(例:自ノード側をオートネゴシエーション、HUB側を全二重固定に設定した場合など)。

STPの設定

STP(スパニングツリープロトコル)を有効にしている場合、待機パトロールの起動後の約30秒間は、監視フレームの送受信ができません。システム起動時に待機パトロールの異常を検出し、その後、即座に復旧を検出する場合は、以下の方法で対処を行ってください。
・HUBの設定変更が可能な場合
接続しているHUBのポートのSTPを無効にしてください。
・HUBの設定変更が不可能な場合
hanetparamコマンドにより待機パトロールの異常検出時間を延長してください。

VLAN ID

ポートVLANをサポートするHUBを使用している場合は、プライマリNICが接続されているポートとセカンダリNICが接続されているポートのVLAN IDが同一であることを確認してください。VLAN IDが異なる場合、監視フレームが待機NICから現用NICに到達しません。

自ノードおよびネットワークの状態

保守作業

待機パトロールで異常を検出した時間帯に監視先に設定しているHUBの再起動や交換等の保守作業を行っていないことを確認してください。HUBの交換を行う場合は待機パトロールを停止する必要があります。

HUBの状態

HUBが故障した場合は、監視フレームが間欠的にロストすることがあります。HUBのログに異常メッセージが出力されていないことを確認してください。

システムログ

1) 待機パトロール監視を行っていたNICがリンクダウンした可能性があります。異常が検出された時間帯でシステムログにリンクダウンメッセージが出力されているか確認してください。
2) ハード(NICやPCIバス、CPUやメモリ等)故障の可能性があります。ハード障害の発生を示すようなメッセージが出力されている可能性がありますのでシステムログを確認してください。

通信負荷

ネットワークのトラフィックが増加し高負荷状態となった場合、監視フレームの遅延やロストが発生する場合があります。HUBの統計情報やログから、コリジョンやパケットロストの有無を確認してください。Linuxの場合は、sarコマンドなどで、切替えが発生した時間帯の送受信パケット数等を確認してください。なお、異なる速度のネットワークが混在している環境では、高速なネットワークで帯域に余裕があっても、低速なネットワークに中継するHUBでパケットロストが発生する場合があります。トラフィックの見積もりが正しく行われているかを確認してください。