PRIMECLUSTER 活用ガイド <トラブルシューティング編> (Solaris(TM)オペレーティングシステム/Linux版)
目次 索引 前ページ次ページ

第1部 事象別トラブル> 第3章 運用時のトラブル

3.1 基本的な設定に関するトラブル

クラスタシステムを運用する上で、基本的な設定が行われていないことが原因で発生するトラブルについて説明します。

■トラブル一覧

No.

現象

Solaris

Linux

Q3-1-1

運用ノードで異常が発生したが、フェイルオーバが行われなかった

Q3-1-2

RMS 構成が正しく設定されているにもかかわらず、フェイルオーバが行われない

Q3-1-3

リソース作成後、RMS が起動できない。エラーメッセージ「FATAL ERROR:RMS HAS FAILED TO START」が表示される

Q3-1-4

運用中にパニックが発生し、その後、パニックしたノードが自動的に再起動される

Q3-1-5

引継ぎネットワークリソースを MAC アドレス引継ぎ設定ありで設定している NIC の物理インタフェースが ifconfig -a から見えなくなる場合がある

Q3-1-6

OS 設定で local-mac-address を true から false にしたところ、クラスタから切り離されて再起動を繰り返す

Q3-1-7

クラスタインタコネクトが二本ある環境で、片方の LAN ケーブルだけを抜くと、ノードの強制停止が発生する

Q3-1-8

Cmdline リソースが起動スクリプトでタイムアウトとなり、リソース故障が発生した。Cmdline リソースの起動スクリプトのタイムアウト値を変更する方法を知りたい

Q3-1-9

クラスタインタコネクトの CIP を活性化すると、運用ノードの業務LANの通信が不安定になる

Q3-1-10

PRIMECLUSTER へ Systemwalker Operation Manager を登録後、リソース異常が発生する

Q3-1-11

ifconfig -a を実行して CIP ネットワークインタフェースの状態を表示すると、CF 構築時に設定したネットマスクと異なる値が表示される


 

Q3-1-1 運用ノードで異常が発生したが、フェイルオーが行われなかった

原因

待機ノードで、RMS が起動されていない可能性があります。

または、userApplicationのAutoSwitchOver 属性が設定されていない可能性があります。

対処

待機ノードで、RMS が起動されているかを確認してください。

または、userApplicationのAutoSwitchOver 属性で "HostFailure"、"ResourceFailure"、"ShutDown" を指定してください。


 

Q3-1-2 RMS 構成が正しく設定されているにもかかわらず、フェイルオーが行われない

原因

待機ノードで、RMS が起動されていない可能性があります。

または、userApplicationのAutoSwitchOver 属性が設定されていない可能性があります。

対処

待機ノードで RMS が起動されているかを確認してください。

または、userApplicationのAutoSwitchOver 属性で "HostFailure"、"ResourceFailure"、"ShutDown" を指定してください。


 

Q3-1-3 リソース作成後、RMS が起動できない。エラーメッセージ「FATAL ERROR:RMS HAS FAILED TO START」が表示される

原因

クラスタアプリケーションが作成されていないために、RMS が起動できません。

対処

クラスタアプリケーションを作成してください。


 

Q3-1-4 運用中にパニッが発生し、その後、パニックしたノードが自動的に再起動される

対処

/etc/syetem に以下の設定を行い、再起動してください。

set halt_on_panic=1

本設定により、パニック発生後、ノードは OBP モードで停止します。


 

Q3-1-5 引継ぎネットワークリソースを MAC アドレス引継設定ありで設定している NIC 物理インタフェースが ifconfig -a から見えなくなる場合がある

原因

MAC アドレス引継ぎを設定しているにも関わらず、引継ぎ IP アドレスのインタフェース属性において、BASE フラグの設定を "virtual" にしているためです。

対処

設定値を "virtual" から "base" に変更してください。


 

Q3-1-6 OS 設定で local-mac-address を true から false にしたところ、クラスタから切り離されて再起動を繰り返す

原因

OS 起動時に、クラスタインタコネクトが使用する NIC が、half-duplex で起動することが原因です。

対処

Switching Hub の Port の設定または、ノードの NIC の negotiation の設定を見直してください。


 

Q3-1-7 クラスタインタコネクが二本ある環境で、片方の LAN ケーブルだけを抜くと、ノードの強制停が発生する

原因

クラスタインタコネクトで使用しているインタフェースに IP アドレスが設定されているため、クラスタインタコネクトとして使用できていないと考えられます。

対処

両ノードの /etc/inet/hosts(Solaris)または /etc/hosts(Linux)ファイルの設定を変更し、IPアドレスを設定しないようにしてください。


 

Q3-1-8 Cmdline リソーが起動スクリプトでタイムアウトとなり、リソース故障が発生した。Cmdline リソースの起動スクリプのタイムアウトを変更する方法を知りたい

対処

RMS 環境変数 "SCRIPTS_TIME_OUT" をデフォルト 300 秒から、ユーザ環境に合わせた値に変更してください。


 

Q3-1-9 クラスタインタコネクの CIP を活性化すると、運用ノードの業務 LAN の通信が不安定になる

原因

系間パスの LAN と業務 LAN が混同している可能性があります。

対処

系間パスの LAN と業務 LAN の結線を見直してください。


 

Q3-1-10 PRIMECLUSTER へ Systemwalker Operation Manager を登録後、リソース異常が発生する

原因

"Systemwalker Operation Manager11.0 クラスタ適用ガイド PRIMECLUSTER 編" にある、"2.2.3 デーモンの自動起動・停止設定の解除" および "2.2.4 クラスタ情報の登録" を実施せずに、PRIMECLUSTER への登録を行っている可能性があります。

対処

Systemwalker Operation Manager の手順書に従って、PRIMECLUSTER への登録処理を行ってください。


 

Q3-1-11 ifconfig -a を実行して CIP ネットワークインタフェースの状態を表示すると、CF 構築時に設定したネットマスと異なる値が表示される

原因

CIP に設定されたネットマスクが、CF 構築時に設定したネットマスクと異なってます。

対処

Interstage Security Director がインストールされている場合、CIP のネットマスクが変更される場合があります。

本現象が発生した場合、/etc/inet/netmasks に CIP のネットワークアドレス、ネットマスクを追記してください。ネットワークアドレス、ネットマスクを追記した後、クラスタノードを再起動してください。

なお CIP のネットワークアドレス、ネットマスクは以下の手順で確認することができます。

  1. /etc/cip.cf から、CIP ノード名とネットマスクを取得します。

    下記の例のように記載されている場合、以下のようになります。

    node0 node0RMS:netmask:255.255.255.0
  2. /etc/inet/hosts ファイルから、手順 1.で取得した CIP ノード名の IP アドレを取得します。

    下記の例のように記載されている場合、以下のようになります。

    192.168.1.1     node0RMS
  3. 手順 1.で取得したネットマスクと、手順 2. で取得した IP アドレスからネットワークアドレスを取得します。例の場合、以下のようになります。

    上記からネットワークアドレスは、以下のようになります。

上記手順で取得したネットマスクとネットワークアドレスを /etc/inet/netmasks に追記します。


目次 索引 前ページ次ページ

All Rights Reserved, Copyright(C) 富士通株式会社 2009