この章では、switchlog ファイルに現れる致命的な (fatal) RMS エラーメッセージについて詳しく説明しま
す。
表示されたメッセージのコンポーネント名を確認し、以下の表で参照先を決定します。メッセージ番号順に説明されています。
コンポーネント名 | 参照先 |
---|---|
ADC | |
ADM | |
BM | |
CML | |
CMM | |
CRT | |
DET | |
INI | |
MIS | |
QUE | |
SCR | |
SYS | |
UAP | |
US | |
WRP |
内容
RMS が正しく機能するには、すべてのグローバル環境変数 RELIANT_LOG_LIFE、RELIANT_SHUT_MIN_WAIT、HV_CHECKSUM_INTERVAL、HV_LOG_ACTION_THRESHOLD、HV_LOG_WARNING_THRESHOLD、HV_WAIT_CONFIG、および HV_RCSTART を hvenv で設定する必要があります。未設定のグローバル環境変数があると、RMS が終了コード 1 で終了します。
対処
すべての環境変数の値を hvenv で設定してください。
内容
一部のローカル環境変数を hvenv ファイルで設定してない場合に、このメッセージが出力されて、RMS が終了コード 1 で終了します。
対処
/opt/SMAW/SMAWRrms/bin/hvenv.local ファイルで、すべてのローカル環境変数を適切な値に設定してあることを確認してください。
内容
RMSの処理で内部異常が発生しました。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
RMS 環境変数<hvenv> の値が、許容される範囲を超えています。BM は終了します。
対処
RMS 環境変数に有効な値を指定して、RMS を再起動してください。
内容
RMS はプロセス間通信で UNIX メッセージキューを使用します。admin キューは hvutil やhvswitch のようなユーティリティ間の通信に使われるキューの 1つです。このキューを開くときに問題が発生すると、このメッセージが出力されて、RMS が終了コード 3 で終了します。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
RMS は起動時に、動的変更を実行します。このフェーズで、RMS 構成定義ファイルにエラーが見つかると、RMS は終了コード 23 で終了します。
対処
switchlog に上記のメッセージの前に出力されたエラーメッセージに基づいて、RMS 構成定義ファイルにエラーがないことを確認してください。
内容
引数の抜けまたは不適切な使用が理由で、RMS が正しく起動しないと、このメッセージが引数とともに switchlog に書き込まれます。RMS は終了コード 3 で終了します。
対処
適切な引数を指定して RMS を起動してください。
内容
動的再構成の実行中に、RMS は /usr/bin/sum を使用して構成チェックサムを計算します。この計算が失敗すると、このメッセージが出力されて、RMS が終了コード 52 で終了します。
対処
/usr/bin/sum が使用可能かどうかチェックしてください。
内容
CF の設定中に、dlopen または dlsym のルーチン routine に問題があると、RMS は終了コード 95 または 94 で終了します。error_reason はエラーの理由を示します。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
メモリ不足のため RMS の機能が停止する前に switchlog に書き込まれる一般的なメッセージです。
対処
以下のいずれかが考えられます。
メモリ資源が不足している
カーネルパラメタの設定に誤りがある
システム全体で必要となるメモリ資源の見積りを見直してください。PRIMECLUSTER の動作に必要なメモリ容量については、各製品に添付されているPRIMECLUSTERのインストールガイドを参照してください。
上記で解決しない場合は、PRIMECLUSTER 4.4以降は PRIMECLUSTERデザインシートの "セットアップ(初期構成)"、PRIMECLUSTER 4.3以前は "PRIMECLUSTER 導入運用手引書" の "カーネルパラメタ・ワークシート" の説明を参照して、カーネルパラメタの設定が正しいことを確認してください。設定に誤りがあった場合は、設定変更後、システムを再起動します。
上記対処によってこのエラーを解決できない場合は、このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
動的変更が終了すると、現在の RMS 構成がファイル /var/tmp/config.us にダンプされます。ダンプに失敗すると、RMS は構成のチェックサムを再計算できないためにシャットダウンします。
対処
RMS 構成定義ファイルの書込みに失敗した原因が switchlog に出力されている前のメッセージに記述されています。この説明に従ってノード環境を修正するか、当社技術員(SE)に連絡してください。
内容
システム定義のメッセージキューパラメタの値が小さすぎるため、RMS が正常に動作できません。RMS は終了コード 28 で終了します。
対処
OS のメッセージキューパラメタを変更し、OS を起動しなおしてから RMS を再起動してください。
内容
SysNode 名の長さが上限値を超えています。
対処
SysNode 名の長さが maxlength より小さくなるようにしてください。
内容
CFの起動が完了する前にRMSが起動されました。
対処
CFの起動が完了した後に、RMSを再度起動してください。
内容
RMSの処理で内部異常が発生しました。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
CFの起動が完了する前にRMSが起動されました。
対処
CFの起動が完了した後に、RMSを再度起動してください。
内容
RMS 用に指定した RMS 構成定義ファイルが存在しないと、RMS が終了コード 1 で終了します。
または、クラスタアプリケーションに登録されてないリソースが残っている可能性があります。
あるいは、クラスタアプリケーションを作成していない可能性があります。
対処
RMS 用に有効な RMS 構成定義ファイルを指定してください。
または、必要に応じて、該当するリソースをクラスタアプリケーションに登録するか、リソースを削除してください。
あるいは、クラスタアプリケーションを作成してください。クラスタアプリケーションの概要と作成方法については、"PRIMECLUSTER 導入運用手引書" を参照してください。
内容
アウトバウンドネットワーク通信の作成時にエラーが発生すると、このメッセージが出力されて、RMS が終了コード 12 で終了します。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
インバウンドネットワーク通信の作成時にエラーが発生すると、このメッセージが出力されて、RMS が終了コード 12 で終了します。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
RMS 内でシステムエラーが発生しました。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
RMS がディテクタと RMS 自身の通信に使用する UNIX メッセージキュー DET_REP_Q を作成できない場合に、このメッセージが出力されて、RMS が終了コード 12 で終了します。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
hvlogclean の実行中に、ディテクタ要求キュー queue を使用して BM からディテクタに情報を送信します。この通信で問題が発生すると、このメッセージが出力されて、RMS が終了コード 12 で終了します。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
各汎用ディテクタは、BM との通信に使用するメッセージキューを持っています。ディテクタ用にkind という種類のキューを作成するときに問題が発生すると、このメッセージが出力されて、RMS が終了コード 12 で終了します。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
RMS がディテクタと RMS 自身の通信に使用する UNIX メッセージキュー DET_REP_Q を作成できない場合に、このメッセージが出力されて、RMS が終了コード 12 で終了します。このファイルを読取るときにエラーが発生すると、上記のメッセージがエラーの理由 errorreason とともに出力されます。RMS は終了コード 26 で終了します。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
InitScript は存在しますが、実行できません。
対処
InitScript を実行可能にしてください。
内容
ローカル SysNode sysnode が RMS 構成定義ファイルの一部でない場合に、このメッセージが出力されて、RMS が終了コード 23 で終了します。
対処
ローカル Sysnode sysnode が RMS 構成定義ファイルの一部であることを確認してください。
内容
InitScript が、割当てられた実行時間の終了時に実行中でした。タイムアウト時間は、hvenv ファイルの環境変数 SCRIPTS_TIME_OUT に定義された値と 300 のいずれか小さいほうの値です。
対処
タイムアウト値を大きくするか、スクリプトの実行中にタイムアウトが発生する条件を修正してください。
内容
InitScript の起動中にエラーが発生しました。errno コード <errno> および理由 <reason> が、メッセージに表示されます。
対処
起動が可能なように InitScript のノード条件を修正してください。
内容
InitScript が、0 以外の終了コード <exitcode> で完了しました 。
対処
終了コード 0 を返すように InitScript のノード条件を修正するか、InitScript そのものを修正してください。
内容
InitScript が停止しました。
対処
実行中に停止しないように InitScript のノード条件を修正するか、InitScript そのものを修正してください。
内容
InitScript 異常終了しました。
対処
実行中に停止しないように InitScript のノード条件を修正するか、InitScript そのものを修正してください。
内容
RMSの処理で内部異常が発生しました。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
RMSの処理で内部異常が発生しました。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
RMSの処理で内部異常が発生しました。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
RMSの処理で内部異常が発生しました。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
RMSの処理で内部異常が発生しました。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
hvdisp、hvswitch、hvdump などのさまざまな RMS コマンドは、ディレクトリ directory のロックファイルをシグナル処理のために使用します。これらのファイルは、これらのコマンドの終了後に削除されます。ロックディレクトリのファイルは、RMS の起動時にも削除されます。
これらのファイルが何らかの理由で削除されないと、このメッセージが出力されます。RMS は終了コード 99 で終了します。call は、クリーンアップがどの段階で失敗したかを示し、errornumber は OS のエラー番号の値で、errortext は OS によるエラー番号の説明です。
対処
ロックディレクトリ <directory> が存在するかどうか確認し、存在する場合は削除してください。
内容
RMSの処理で内部異常が発生しました。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
さまざまなユーティリティが ADMIN_Q を使用して BM と通信します。このキューに問題があると、このメッセージが出力されて、RMS が終了コード 3 で終了します。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
RMS BM が、ユーティリティと RMS の通信に使われる ADMIN_Q のメッセージを抽出できない場合に、このメッセージが出力されます。RMS は終了コード 3 で終了します。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
ネットワーク上のメッセージ読取りが失敗すると、このメッセージが出力されて、RMS が終了コード 3 で終了します。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
メッセージ送信中にネットワークの問題が発生すると、このメッセージが出力されます。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
すべてのディテクタは DET_REP_Q キューを使用して RMS BM と通信します。このキューのメッセージを読取るときに問題が発生すると、このメッセージが出力されて、RMS が終了コード 15 で終了します。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
さまざまなディテクタが状態を報告するのに使用する DET_REP_Q キューの問題を RMS BM が検出すると、このメッセージが出力されます。RMS は終了コード 15 で終了します。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
メッセージキューの使用方法に誤りがあります。 エラー番号<errornumber>の<errortext>のテキストにエラーの種類が表示されています。 メッセージキューはBM との通信に使用されます。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
ディテクタ detector_name のディテクタ要求キューを作成できない場合に、このメッセージが出力されて、RMS が終了コード 12 で終了します。重大な内部エラーです。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
ディテクタ detector を再起動できない場合に、このメッセージが出力されて、RMS が終了コード 14 で終了します。再起動は以下のいずれかの理由で失敗します。
ディテクタを 1 分間以内に 3 回以上再起動する必要があった。
RMS 内でメモリ割当てに問題があった。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
RMS は最初に InitScript を実行します。InitScript の値は hvenv の環境変数 RELIANT_INITSCRIPT の値です。この InitScript が何らかの理由で失敗すると(0 以外のコードで終了する、シグナルを取得するなど)、このメッセージが出力されて、RMS が終了コード 56 でシャットダウンします。
対処
InitScript を設定している場合は、設定した InitScript に問題がないか調査してください。InitScript を設定していない場合は、このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
スクリプトはディテクタのレポートに基づいて実行されるため、Online、Offline、Faulted、Standby、NoReport 以外の無効な状態がディテクタから通知されると、このメッセージが出力されて、RMS が終了コード 8 で終了します。
対処
ディテクタが、有効な Online、Offline、Faulted、Standby、NoReport のいずれかの状態だけを通知するようにしてください。
内容
RMS が特定のオブジェクト <objectname> に対してスクリプト <script> を実行できない場合に、このエラーメッセージが出力されます。errno errno は、このスクリプトの実行が失敗した詳しい理由を示します。RMS は終了コード 8 で終了します。
対処
本マニュアルの "付録B Solaris/Linux ERRNO テーブル" で、errno errno を調べて、失敗の理由を判別してください。理由がわからない場合は、当社技術員(SE)に連絡してください。
内容
ファイル /etc/hosts を検索してノード hostname に関する情報を取得する検索関数 gethostbyname で有効なエントリが見つからない場合に、このメッセージが出力されて、RMS が終了コード 114 で終了します。
対処
ファイル /etc/hosts にノード hostname の有効なエントリがあることを確認して、RMS を再起動してください。
内容
NODE_REQ_Q の作成時に問題が発生すると、このメッセージが出力されて、RMS が終了コード 12 で終了します。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
オブジェクト object に対する HaltFlag 属性を設定するときに二重故障が発生すると、そのノード上で RMS が終了コード 96 で終了します。
対処
リソースに障害が発生した原因を調査し、適切な対処を実行してください。
内容
RMS の起動時に RMS 構成定義ファイルにエラーが発生し、起動に失敗しました。このエラーは通常、RMS 構成定義ファイルを手動で編集し送付した場合に発生します。
対処
RMS 構成定義ファイルのエラーを修正してください。
内容
RMS の状態変更中に状態変更エラーが発生しました。 エラーの詳細がメッセージの後に出力されます。
対処
エラーの内容に応じて、対処を行なってください。対処が不明な場合は、調査情報を採取し、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
インタコネクト名の長さが上限値を超えています。
対処
インタコネクト名の長さが上限値 maxlength を超えないようにしてください。
インタコネクト名の長さを上限値 maxlength 以下の長さにしてクラスタシステムを再構築してください。
内容
RMSの処理で内部異常が発生しました。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
RMSの処理で内部異常が発生しました。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
これは、ルーチン <routine> の実行が <errorreason> の理由で失敗し、RMS とCF 間の整合性が失われたことを示す一般的なメッセージです。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
RMSの処理で内部異常が発生しました。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
RMSの処理で内部異常が発生しました。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
ELM ハートビート方式は、CF モードクラスタ以外では使用できません。
対処
CF をインストールするか、HV_USE_ELM=0 に設定して ELM モードを無効にしてください。
内容
HV_USE_ELM の設定が無効です。
対処
HV_USE_ELM を 0 または1 に設定してください。
内容
重大な内部エラーが発生しました。
対処
重大なエラーが発生しました。このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
RMSの処理で内部異常が発生しました。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
RMSの処理で内部異常が発生しました。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。