ページの先頭行へ戻る
PRIMECLUSTER Global Link Services 説明書 4.6 (伝送路二重化機能編)
FUJITSU Software

H.3.1 HUB監視のエラーメッセージ(870番)が出力される

現象

以下のようなメッセージ(*1)がシステムログに出力されてNICの切替えが発生する。

hanet: ERROR: 87000: polling status changed: Primary polling failed. (eth0,target=192.168.70.100)
# /opt/FJSVhanet/usr/sbin/dsppoll

 Polling Status    =  ON
 interval(idle)    =   5( 60)
 times             =   5
 link detection    = YES
 FAILOVER Status   = YES

 Status  Name  Mode Primary Target/Secondary Target             HUB-HUB
+------+------+----+-------------------------------------------+-------+
   ON   sha0    d   192.168.70.100(FAIL)/192.168.70.101(ON)      OFF

*1) セカンダリNICを運用NICとして使用している時は、“Primary polling”ではなく、“Secondary polling”と出力されます。

原因と対策

NIC切替方式では、指定された監視先にpingを実行し伝送路監視を行っています。pingの疎通ができなくなったことを検出したため、本メッセージが出力され、NICの切替えが行われました。以下の項目について確認を行ってください。

各確認項目の詳細は以下のとおりです。

確認項目

内容

ケーブル

接続確認

1) ケーブルが抜けている可能性があります。
ケーブルが自ノードおよびHUBに接続されているか確認してください。
2) ケーブルが破損している可能性があります。
HUBにおいてケーブルが接続されているポートのLEDが点灯しているか確認してください。点灯していない場合はケーブルを交換してください。
3) ケーブルが正しく接続されていることを確認してください。
4) ブレードサーバやPRIMEQUESTの場合、筐体内のサーバ設置場所やネットワークポートの設定により、内部結線が変わってきます。結線状態が正しいかを確認してください。
5) NIC切替方式の場合、一般的にプライマリに設定したNICは、プライマリに設定した監視先IPアドレスをもつHUBに接続されている必要があります。

種別

1) 使用しているケーブルの種類(ストレートケーブル、クロスケーブル)が正しいことを確認してください。なお、ケーブルの種別を自動認識する機能(Auto-MDIX)は、通信モードをオートネゴシエーションに設定しないと有効にならない場合があります。詳細は、HUBのマニュアルを確認してください。
2) 使用しているケーブルのカテゴリ(カテゴリ5、カテゴリ5e等)が、通信速度とケーブル長に合ったものになっていることを確認してください。

GLSの設定

監視先の設定

監視先のHUBのIPアドレスと監視先として定義したIPアドレスが異なる場合、監視に失敗し切替えが発生します。監視先のHUBのIPアドレスと監視先として定義したIPアドレスが一致していることをhanetpollコマンドで確認してください。

監視パラメタの設定

デフォルトではpingによる監視は、5秒間隔で5回連続失敗した場合に伝送路異常と判断するよう設定されています。このパラメタを短く設定した場合、誤切替え(伝送路が正常にも関わらず、誤って切替えを行ってしまうこと)が発生する可能性があります。誤切替えが頻繁に発生する場合は伝送路異常の検出時間の設定値を長くしてください。

ネットマスクの設定

ネットマスクの設定が誤っている場合、通信に失敗する可能性があります。ipコマンドでネットマスクの設定を確認してください。また、hanetmaskコマンドで行った設定を確認してください。

HUBの設定

通信モード

自ノードで使用しているインタフェースとHUBのポートに設定されている通信モードに不整合がないか確認してください。HUBと自ノードで通信モードが異なる場合、コリジョンが発生しパケットロストが多発する場合があります。(例:自ノード側をオートネゴシエーション、HUB側を全二重固定に設定した場合)。

STPの設定

STP(スパニングツリープロトコル)を有効にしている場合、GLSで使用しているインタフェースの活性化直後や切替え直後、30秒程度通信ができなくなります。この間GLSは、HUB監視の失敗によりNICの切替えを行わないよう抑止しています。抑止を行う時間は“リンクアップ遅延時間”というパラメタとしてhanetpollコマンドで設定されています(デフォルトで60秒)。このパラメタ値が小さいと、NICの誤切替えが発生する場合があります。以下の方法で対処を行ってください。
1) 誤切替えが発生しないようにパラメタの設定を変更してください。
2) パケットがループしないネットワーク構成になっている場合は、使用しているHUBのポートのSTPを無効にしてください。

VLAN-ID

VLAN-IDの設定に誤りがある可能性があります。以下のVLAN-IDが一致しているか確認してください。
1) プライマリNIC側のケーブルが接続されているポートのVLAN-ID
2) セカンダリNIC側のケーブルが接続されているポートのVLAN-ID
3) 監視先として使用するHUBの管理IPアドレスが設定されているVLAN-ID

QoS

HUBのQoS(Quality of Service)設定で、pingに対する処理の優先度を低く設定した場合、ネットワーク高負荷時に、HUBからのping応答が遅延する場合があります。この場合、伝送路が正常にも関わらず、NICの切替えが発生することがあります。QoSの設定を見直してください。

ネットワーク状態

保守作業

切替えが発生した時間帯で、監視先に設定しているHUBの再起動や交換等の保守作業を行っていないことを確認してください。なお、監視先としているHUBの交換を行う場合は、必ず、HUB監視を停止した後にHUBの交換を行ってください。

通信負荷

切替えが発生した時間帯で、一時的にネットワークのトラフィックが高かったためにpingの遅延やパケットロストが発生した可能性があります。HUBの統計情報やログから、コリジョンやパケットロストの有無を確認してください。Linuxの場合は、sarコマンドなどで、切替えが発生した時間帯の送受信パケット数等を確認してください。なお、異なる速度のネットワークが混在している環境では、高速なネットワークで帯域に余裕があっても、低速なネットワークに中継するHUBでパケットロストが発生する場合があります。トラフィックの見積もりが正しく行われているかを確認してください。

HUBの状態

HUBの故障および電源が切れた可能性があります。システムログにリンクダウンメッセージが出力されていないか確認してください。HUB故障の際はパケットがループしている場合がありますので、ssコマンドなどでコリジョンが発生していないか確認してください。また、隣接HUB以外をHUB監視機能の監視先に設定している場合は、HUBと監視先の間のケーブルが抜けている可能性があります。

システムログ

1) HUB監視を行っていたNICがリンクダウンした可能性があります。切替えが発生した時間帯でシステムログにリンクダウンメッセージが出力されているか確認してください。
2) ハード(NICやPCIバス、CPUやメモリ等)故障の可能性があります。ハード障害の発生を示すようなメッセージが出力されている可能性がありますのでシステムログを確認してください。

自ノードの設定

IPフィルタリング

GLSが使用しているインタフェースに対して、IPパケットのフィルタリングが行われている場合があります。IPフィルタリングを行っている場合は、ファイアウォールの設定を確認してください。ファイアウォールにおいて、pingのパケットが通過するよう設定してください。

ネットワークアドレスの設定

ip routeコマンドなどを実行し、GLSの仮想IPアドレスと同一ネットワークの伝送路がないことを確認してください。ネットワークが重複している場合、正しい経路でpingの送信(HUB監視)ができないため、GLSが使用している伝送路で異常が発生した際に、NICの切り替えが行われなかったり、逆に、GLSの使用していない伝送路で異常が発生した際に、切り替えが発生したりします。IPアドレス、ネットマスクの設定を見直してください。また、ネットワーク構成が、同一サブネットに3枚以上のNICを接続している構成(1つのサブネットに対して、仮想インタフェースが束ねるNICの組み合わせが2種類以上ある構成)になっていないことを確認してください。ある場合は、構成を見直してください。

IPアドレス

自ノードで設定したIPアドレスが、他のノードで使用しているIPアドレスと重複していないことを確認してください。重複している場合、通信相手からのpingの応答が、pingの送信元ノードと異なるノードあてに送信され、通信できなくなる場合があります。この場合、HUB監視が失敗します。

GLS : Global Link Services