PRIMECLUSTER 活用ガイド <メッセージ集> (Solaris(TM)オペレーティングシステム/Linux版) |
目次
索引
![]() ![]() |
第6章 RMS に関するメッセージ | > 6.1 RMSメッセージ |
time は、環境変数 HV_CHECKSUM_INTERVAL の値でデフォルト値は、120 秒です。このメッセージが出力されるのは、ローカルノードとリモートノードの RMS 構成定義ファイルのチェックサムが異なり、かつ経過時間が time 秒以内であり、かつ以下のいずれかの条件が満たされる場合です。
ローカルノードおよびリモートノードが別々の RMS 構成定義ファイルで実行されています。両方のノードが同じ RMS 構成定義ファイルで実行するようにしてください。
ローカルノードとリモートノードの RMS 構成定義ファイルのチェックサムが異なり、経過時間が HV_CHECKSUM_INTERVAL に指定された秒数以内であり、Offline または Faulted でないアプリケーションが存在します。RMS は Online 状態を維持しますが、ディテクタ detector がOffline または Faulted を報告するまでは、このノード上で自動切替および手動切替のいずれもできません。
ローカルノードとリモートノードの両方が同じ RMS 構成定義ファイルで稼動するようにしてください。
リモートノード <hostname> が報告する RMS 構成定義ファイルのチェックサムが、ローカルノード上の RMS 構成定義ファイルのチェックサムと異なる場合に、このメッセージが出力されます。
ローカルノードとリモートノードが異なる RMS 構成定義ファイルで実行されています。ローカルノードとリモートノードが同じ RMS 構成定義ファイルで実行するようにしてください。
このメッセージが出力される原因は次のとおりです。リモートノードが報告するチェックサムがローカルノードのチェックサムと異なり、ローカルノードの RMS 構成定義ファイルにリモートノード名が含まれていないにもかかわらず、リモートノードhostname の RMS 構成定義ファイルにローカルノードが含まれています。
ローカルノードとリモートノードが同じ RMS 構成定義ファイルで稼動するようにしてください。
ローカルノードとリモートノードの RMS 構成定義ファイルのチェックサムが異なり、このノードがオンラインになってから time 秒以上が経過した場合に(環境変数HV_CHECKSUM_INTERVAL が設定されている場合、time はその値です。HV_CHECKSUM_INTERVAL が設定されていない場合、time は 120 秒です)、RMS が上記のメッセージを出力します。
クラスタ内のすべてのノードが同じ RMS 構成定義ファイルで実行するようにしてください。
このメッセージは、グローバル環境変数 <envattribute> が hvenv に設定されていないことが原因で RMS がこの変数の設定に失敗した場合に出力されます。envattribute は次のいずれかです:
RELIANT_LOG_LIFE、RELIANT_SHUT_MIN_WAIT、HV_CHECKSUM_INTERVAL、HV_LOG_ACTION_THRESHOLD、HV_LOG_WARNING_THRESHOLD、 HV_WAIT_CONFIG、HV_RCSTART。これにより RMS は終了コード 1 で終了します。
環境変数に適切な値を設定してください。
RMS が正しく機能するには、すべてのグローバル環境変数 RELIANT_LOG_LIFE、RELIANT_SHUT_MIN_WAIT、HV_CHECKSUM_INTERVAL、HV_LOG_ACTION_THRESHOLD、HV_LOG_WARNING_THRESHOLD、HV_WAIT_CONFIG、および HV_RCSTART を hvenv で設定する必要があります。未設定のグローバル環境変数があると、RMS が終了コード 1 で終了します。
すべての環境変数の値を hvenv で設定してください。
hvutil -u をノード上で呼び出したが、SysNode が Wait 状態ではありませんでした(内部オプション)。
hvutil -u コマンドを発行するのが早すぎた場合は、ノードが Wait 状態になってから再発行してください。
このメッセージは、ローカル環境変数 <envattribute> が hvenv に設定されていないことが原因で RMS がこの変数の設定に失敗した場合に出力されます。envattribute は次のいずれかです:
SCRIPTS_TIME_OUT、RELIANT_INITSCRIPT、RELIANT_STARTUP_PATH、HV_CONNECT_TIMEOUT、HV_MAXPROC、HV_SYSLOG_USE。これにより RMS は終了コード 1 で終了します。
/opt/SMAW/SMAWRrms/bin/hvenv.local ファイルのローカル環境変数に適切な値を設定してください。
hvutil -o をノード上で呼び出したが、SysNode が Wait 状態ではありませんでした。(内部オプション)。
hvutil -o コマンドを発行するのが早すぎた場合は、ノードが Wait 状態になってから再発行してください。
一部のローカル環境変数を hvenv ファイルで設定してない場合に、このメッセージが出力されて、RMS が終了コード 1 で終了します。
/opt/SMAW/SMAWRrms/bin/hvenv.local ファイルで、すべてのローカル環境変数を適切な値に設定してあることを確認してください。
リモートノードに送信するためのファイルを開くことができません。
<errortext> や、その他のWARNING/ERROR メッセージを確認してください。
リモートノードに送信するためのファイルを読み取ることができません。
メッセージ (ADC, 23) も出力されます。(ADC, 23) の<errortext> や、その他のWARNING/ERRORメッセージを確認してください。
hvmod が -l オプションの指定なしで起動され、アプリケーションが他の処理を実行中の場合にこのメッセージが表示されます。
クラスタアプリケーションが現在の切替要求を完了した時点で、hvmod コマンドを再発行してください。
動的変更が失敗しました。障害の原因は先行するメッセージに表示されています。
switchlog でこのメッセージの前に出力されたエラーメッセージを調べるか、または失敗の正確な原因を突き止めてください。
環境変数 HV_WAIT_CONFIG の値が 0 となっています。値が設定されていない場合は、代わりにデフォルト値の 120 が使用されます。
/opt/SMAW/SMAWRrms/bin/hvenv で HV_WAIT_CONFIG の値を設定してください。
RMS はコントラクト情報の送信に NET_SEND_Q キューを使用します。このキューに問題がある場合、処理は中止されます。この処理には、hvrcp または hvcopy のいずれかを使用します。
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
ネットワーク上でファイル <filename> を転送中にエラーが発生しました。
ネットワークに問題がないかどうかを確認してください。
動的変更の所要時間がタイムアウト値を超えました。環境変数 MODIFYTIMEOUTLIMIT の値が 0 より大きい場合、タイムアウトはその値になります。環境変数の値が 0 以下の場合、タイムアウトは 0 です。環境変数自体が定義されていない場合、タイムアウト値はデフォルトで 120 秒です。
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
bm 起動中に動的変更の所要時間が環境変数 MODIFYTIMEOUTLIMIT に指定されるタイムアウト値を超えると、このエラーメッセージが出力されます。値が 0 より大きい場合、タイムアウトはその値になります。環境変数の値が 0 以下の場合、タイムアウトは 0 です。環境変数自体が定義されていない場合、タイムアウト値はデフォルトで 120 秒です。RMS は終了コード 63 で終了します。
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
重大な内部エラーが発生しました。
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
クラスタアプリケーション <userapplication> が Online のときに、動的変更によりリソース<resource> を MonitorOnly にしようとすると、変更したいリソース <resource> が Online ではなくても、このメッセージが生成されて、動的変更が中止されます。
クラスタアプリケーションを Offline に切替えてからリソースの重要度を上げてください。
動的変更の実行中に、クラスタアプリケーション <userapplication> が子を持たないことがわかると、このメッセージが switchlog に書き込まれ、動的変更が異常終了します。
動的変更の実行中に、クラスタアプリケーションに有効な子があることを確認してください。
RMS ウィザードは動的変更 HVMOD_HOST の実行中に環境変数 HVMOD_HOST を使用します。この変数には、hvmod を呼び出したノードの名前が含まれています。この変数を関数 putenv() で設定できない場合に、このメッセージと理由 failurereason が switchlog に書き込まれます。
switchlog で理由 failurereason を調べて、この操作が失敗した理由を判別し、修正措置をとってください。
ウィザードは hvmod の実行中にアクションファイルを使用します。終了コールでプロセスが終了する際、このアクションファイル (command) の実行が失敗すると、このメッセージと失敗の理由が switchlog に書き込まれます。
switchlog を調べて失敗の理由を検出し、問題を解決してから hvmod コマンドを再発行してください。
動的変更の実行中に、変更情報を記録したファイルのクラスタのノード間での転送に失敗しました。
ノードとクラスタが command を正常に実行できる状態になっていることを確認してください。
ノードはクラスタに参入すると、RMS 構成定義ファイルを受信します。ファイル転送が失敗すると、動的変更は中止されます。
ノードとクラスタが command を正常に実行できる状態になっていることを確認してください。
動的変更の実行中に、変更情報を記録したファイルのクラスタのノード間での転送に失敗しました。ファイル転送が失敗すると、動的変更は中止されます。このエラーの具体的な理由を調べるには、OS エラーコード ERRNO および ERRORREASON の説明を参照してください。本マニュアルの "付録 B Solaris/Linux ERRNO テーブル" にも一覧があります。
ノードとクラスタが command を正常に実行できる状態になっていることを確認してください。
動的変更の実行中に、変更情報を記録したファイルのクラスタのノード間での転送に失敗しました。
ノード、クラスタ、およびネットワークが command を正常に実行できる状態になっていることを確認してください。
ローカルノードからリモートノードにコピーするファイル <filename> を開いて読込むことができない場合、このメッセージが出力されます。
ファイル <filename> を読込めることを確認してください。
ノード間のファイル転送中に OS エラーコード ERRNO で示される問題が発生しました。
ノード、クラスタ、およびネットワークがファイル転送を正常に実行できる状態になっていることを確認してください。
RMS BM(ベースモニタ)は、構成データを hvdisp プロセスに転送するために使用する一時ファイルの整合性とサイズを定期的に確認します。このファイルを確認できないときは hvdisp プロセスを自動的に再起動しますが、このとき一部のファイルが失われて表示されない場合があります。発生したエラーの OS エラーコードは ERRNO に表示されます。
ノードが一時ファイルを確認できる状態になっていることを確認してください。場合によっては hvdisp プロセスを手動で再起動する必要があります。
リモートノードはクラスタに参入するときに固有の RMS 構成定義ファイルをコピーし、リモートノードに転送しようとします。RMS 構成定義ファイルを保存できない場合、hvjoin の処理は中止されます。
RMS 構成定義ファイルの保存中に発生したエラーに関する詳しい説明が以前のメッセージの 1つに記述されています。この説明に従ってノード環境を修正するか、当社技術員(SE)に連絡してください。
リモートノードはクラスタに参入するときに固有の RMS 構成定義ファイルを準備し、リモートノードに転送しようとします。そのためにコマンド <command> を使用します。<command> が失敗した場合、hvjoin の処理は中止されます。
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
ノードはクラスタに参入するときにリモートの RMS 構成定義ファイルを保存し、動的変更を実行しようとします。そのためにコマンド<command> を使用します。<command> が失敗した場合、hvjoin の処理は中止されます。
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
ファイル転送は動的変更や hvjoin などの RMS 機能の一部です。ファイル <file> をリモートノードに転送する前にコマンド <command> で圧縮する必要があります。<command> が失敗すると、ファイル転送を伴う処理は中止されます。
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
クラスタ内のすべてのノードで RMS をシャットダウンしようとしましたが、ノード <host> の RMS のシャットダウンに失敗しました。
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
クラスタ内のすべてのノードで RMS をシャットダウンしようとしましたが、このノードの RMS のシャットダウンに失敗しました。シャットダウンは自動的に再試行されます。
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
ファイル <file> の読込み中にエラー <errno> が発生しました。理由は <reason> に示されます。ファイル読込みエラーは動的変更または hvjoin の処理中に発生する場合があります。
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
シャットダウン機構により重みの割当てを設定したことを示します。
情報のメッセージのため、対処不要です。
ファイル <file> を開こうとした際に、<reason> が理由で、エラー <errno> が発生しました。ファイルのオープンエラーは、動的変更の間に発生する可能性があります。
ファイルの存在を確認してから動的変更要求を再度発行してください。
先行するエラーが動的起動に必要なファイルのオープンエラーだったため、BM は終了します。
ファイルの存在を確認してから、動的起動要求を再度行ってください。
重大な内部エラーが発生しました。
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
目次
索引
![]() ![]() |