PRIMECLUSTER 活用ガイド <トラブルシューティング編> (Solaris(TM)オペレーティングシステム/Linux版) |
目次
索引
![]() ![]() |
第1部 事象別トラブル | > 第3章 運用時のトラブル |
クラスタシステムを運用する上で、基本的な設定が行われていないことが原因で発生するトラブルについて説明します。
No. |
現象 |
Solaris |
Linux |
---|---|---|---|
運用ノードで異常が発生したが、フェイルオーバが行われなかった |
○ |
○ |
|
RMS 構成が正しく設定されているにもかかわらず、フェイルオーバが行われない |
○ |
○ |
|
リソース作成後、RMS が起動できない。エラーメッセージ「FATAL ERROR:RMS HAS FAILED TO START」が表示される |
○ |
○ |
|
運用中にパニックが発生し、その後、パニックしたノードが自動的に再起動される |
○ |
− |
|
引継ぎネットワークリソースを MAC アドレス引継ぎ設定ありで設定している NIC の物理インタフェースが ifconfig -a から見えなくなる場合がある |
○ |
− |
|
OS 設定で local-mac-address を true から false にしたところ、クラスタから切り離されて再起動を繰り返す |
○ |
− |
|
クラスタインタコネクトが二本ある環境で、片方の LAN ケーブルだけを抜くと、ノードの強制停止が発生する |
○ |
○ |
|
Cmdline リソースが起動スクリプトでタイムアウトとなり、リソース故障が発生した。Cmdline リソースの起動スクリプトのタイムアウト値を変更する方法を知りたい |
○ |
○ |
|
クラスタインタコネクトの CIP を活性化すると、運用ノードの業務LANの通信が不安定になる |
○ |
○ |
|
PRIMECLUSTER へ Systemwalker Operation Manager を登録後、リソース異常が発生する |
○ |
○ |
|
ifconfig -a を実行して CIP ネットワークインタフェースの状態を表示すると、CF 構築時に設定したネットマスクと異なる値が表示される |
○ |
− |
待機ノードで、RMS が起動されていない可能性があります。
または、userApplicationのAutoSwitchOver 属性が設定されていない可能性があります。
待機ノードで、RMS が起動されているかを確認してください。
または、userApplicationのAutoSwitchOver 属性で "HostFailure"、"ResourceFailure"、"ShutDown" を指定してください。
待機ノードで、RMS が起動されていない可能性があります。
または、userApplicationのAutoSwitchOver 属性が設定されていない可能性があります。
待機ノードで RMS が起動されているかを確認してください。
または、userApplicationのAutoSwitchOver 属性で "HostFailure"、"ResourceFailure"、"ShutDown" を指定してください。
クラスタアプリケーションが作成されていないために、RMS が起動できません。
クラスタアプリケーションを作成してください。
/etc/syetem に以下の設定を行い、再起動してください。
set halt_on_panic=1
本設定により、パニック発生後、ノードは OBP モードで停止します。
MAC アドレス引継ぎを設定しているにも関わらず、引継ぎ IP アドレスのインタフェース属性において、BASE フラグの設定を "virtual" にしているためです。
設定値を "virtual" から "base" に変更してください。
OS 起動時に、クラスタインタコネクトが使用する NIC が、half-duplex で起動することが原因です。
Switching Hub の Port の設定または、ノードの NIC の negotiation の設定を見直してください。
クラスタインタコネクトで使用しているインタフェースに IP アドレスが設定されているため、クラスタインタコネクトとして使用できていないと考えられます。
両ノードの /etc/inet/hosts(Solaris)または /etc/hosts(Linux)ファイルの設定を変更し、IPアドレスを設定しないようにしてください。
RMS 環境変数 "SCRIPTS_TIME_OUT" をデフォルト 300 秒から、ユーザ環境に合わせた値に変更してください。
系間パスの LAN と業務 LAN が混同している可能性があります。
系間パスの LAN と業務 LAN の結線を見直してください。
"Systemwalker Operation Manager11.0 クラスタ適用ガイド PRIMECLUSTER 編" にある、"2.2.3 デーモンの自動起動・停止設定の解除" および "2.2.4 クラスタ情報の登録" を実施せずに、PRIMECLUSTER への登録を行っている可能性があります。
Systemwalker Operation Manager の手順書に従って、PRIMECLUSTER への登録処理を行ってください。
CIP に設定されたネットマスクが、CF 構築時に設定したネットマスクと異なってます。
Interstage Security Director がインストールされている場合、CIP のネットマスクが変更される場合があります。
本現象が発生した場合、/etc/inet/netmasks に CIP のネットワークアドレス、ネットマスクを追記してください。ネットワークアドレス、ネットマスクを追記した後、クラスタノードを再起動してください。
なお CIP のネットワークアドレス、ネットマスクは以下の手順で確認することができます。
下記の例のように記載されている場合、以下のようになります。
node0 node0RMS:netmask:255.255.255.0
下記の例のように記載されている場合、以下のようになります。
192.168.1.1 node0RMS
上記からネットワークアドレスは、以下のようになります。
上記手順で取得したネットマスクとネットワークアドレスを /etc/inet/netmasks に追記します。
目次
索引
![]() ![]() |