この章では、switchlog ファイルに現れる致命的でない (non-fatal) RMS エラーメッセージについて詳しく
説明します。
表示されたメッセージのコンポーネント名を確認し、以下の表で参照先を決定します。メッセージ番号順に説明されています。
コンポーネント名 | 参照先 |
---|---|
ADC | |
ADM | |
BAS | |
BM | |
CML | |
CRT | |
CTL | |
CUP | |
DET | |
GEN | |
INI | |
MIS | |
QUE | |
SCR | |
SWT | |
SYS | |
UAP | |
US | |
WLT | |
WRP |
内容
time は、環境変数 HV_CHECKSUM_INTERVAL の値でデフォルト値は、120 秒です。このメッセージが出力されるのは、ローカルノードとリモートノードの RMS 構成定義ファイルのチェックサムが異なり、かつ経過時間が time 秒以内であり、かつ以下のいずれかの条件が満たされる場合です。
リモートノードがクラスタに参入し、ローカルノード上のすべてのアプリケーションがOffline または Faulted の状態である。RMS が終了コード 60 で終了する。
リモートノードの構成にローカルノードが含まれているが、ローカルノードの構成にリモートノードが含まれていない。ローカルノード hostname が終了コード 60 で終了する。
対処
ローカルノードおよびリモートノードが別々の RMS 構成定義ファイルで実行されています。両方のノードが同じ RMS 構成定義ファイルで実行されるようにしてください。
内容
ローカルノードとリモートノードの RMS 構成定義ファイルのチェックサムが異なり、経過時間が HV_CHECKSUM_INTERVAL に指定された秒数以内であり、Offline または Faulted でないアプリケーションが存在します。RMS は Online 状態を維持しますが、ディテクタ detector がOffline または Faulted を報告するまでは、このノード上で自動切替および手動切替のいずれもできません。
対処
ローカルノードとリモートノードの両方が同じ RMS 構成定義ファイルで稼動するようにしてください。
内容
このメッセージは、以下の状況で出力されます。
リモートノード <hostname> が報告する RMS 構成定義ファイルのチェックサムと、ローカルノード上の RMS 構成定義ファイルのチェックサムが異なる場合
RMS グローバル環境変数の設定がノード間で異なる場合
対処
状況に応じて、以下の対処を行ってください。
リモートノード <hostname> が報告する RMS 構成定義ファイルのチェックサムと、ローカルノード上の RMS 構成定義ファイルのチェックサムが異なる場合
ローカルノードとリモートノードが異なる RMS 構成定義ファイルで実行されています。ローカルノードとリモートノードが同じ RMS 構成定義ファイルで実行されるようにしてください。
RMS グローバル環境変数の設定がノード間で異なる場合
すべてのノードの hvenv.local を修正した後、RMS を再起動してください。
内容
リモートノード <hostname> が報告する RMS 構成定義ファイルと ローカルノード上の RMS 構成定義ファイルが異なる場合、または、RMS グローバル環境変数の設定がノード間で異なる場合、このメッセージが出力されます。
対処
ローカルノードとリモートノードが異なる RMS 構成定義ファイルで実行されています。ローカルノードとリモートノードが同じ RMS 構成定義ファイルで実行されるようにしてください。RMS グローバル環境変数の設定がノード間で異なる場合は、すべてのノードで hvenv.local を同一の設定値に修正後、RMS を再起動してください。
内容
ローカルノードとリモートノードの RMS 構成定義ファイルのチェックサムが異なり、このノードがオンラインになってから time 秒以上が経過した場合に(環境変数HV_CHECKSUM_INTERVAL が設定されている場合、time はその値です。HV_CHECKSUM_INTERVAL が設定されていない場合、time は 120 秒です)、RMS が上記のメッセージを出力します。
対処
クラスタ内のすべてのノードが同じ RMS 構成定義ファイルで実行されるようにしてください。
内容
このメッセージは、グローバル環境変数 <envattribute> が hvenv に設定されていないことが原因で RMS がこの変数の設定に失敗した場合に出力されます。envattribute は次のいずれかです:
RELIANT_LOG_LIFE、RELIANT_SHUT_MIN_WAIT、HV_CHECKSUM_INTERVAL、HV_LOG_ACTION_THRESHOLD、HV_LOG_WARNING_THRESHOLD、 HV_WAIT_CONFIG、HV_RCSTART。これにより RMS は終了コード 1 で終了します。
対処
環境変数に適切な値を設定してください。
内容
hvutil -u をノード上で呼び出したが、SysNode が Wait 状態ではありませんでした。
対処
SysNode が Wait 状態であることを確認後、再度実行してください。
内容
このメッセージは、ローカル環境変数 <envattribute> が hvenv に設定されていないことが原因で RMS がこの変数の設定に失敗した場合に出力されます。envattribute は次のいずれかです:
SCRIPTS_TIME_OUT、RELIANT_INITSCRIPT、RELIANT_STARTUP_PATH、HV_CONNECT_TIMEOUT、HV_MAXPROC、HV_SYSLOG_USE。これにより RMS は終了コード 1 で終了します。
対処
/opt/SMAW/SMAWRrms/bin/hvenv.local ファイルのローカル環境変数に適切な値を設定してください。
内容
hvutil -o をノード上で呼び出したが、SysNode が Wait 状態ではありませんでした。
対処
SysNode が Wait 状態であることを確認後、再度実行してください。
内容
hvmod が -l オプションの指定なしで起動され、アプリケーションが他の処理を実行中の場合にこのメッセージが表示されます。
対処
クラスタアプリケーションが現在の切替要求を完了した時点で、hvmod コマンドを再発行してください。
内容
動的変更が失敗しました。障害の原因は先行するメッセージに表示されています。
対処
switchlog でこのメッセージの前に出力されたエラーメッセージを調べるか、または失敗の正確な原因を突き止めてください。
内容
環境変数 HV_WAIT_CONFIG の値が 0 となっています。値が設定されていない場合は、代わりにデフォルト値の 120 が使用されます。
対処
/opt/SMAW/SMAWRrms/bin/hvenv で HV_WAIT_CONFIG の値を設定してください。
内容
RMS はコントラクト情報の送信に NET_SEND_Q キューを使用します。このキューに問題がある場合、処理は中止されます。この処理には、hvrcp または hvcopy のいずれかを使用します。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
ネットワーク上でファイル <filename> を転送中にエラーが発生しました。
対処
ネットワークに問題がないかどうかを確認してください。
内容
動的変更の所要時間がタイムアウト値を超えました。環境変数 MODIFYTIMEOUTLIMIT の値が 0 より大きい場合、タイムアウトはその値になります。環境変数の値が 0 以下の場合、タイムアウトは 0 です。環境変数自体が定義されていない場合、タイムアウト値はデフォルトで 120 秒です。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
bm 起動中に動的変更の所要時間が環境変数 MODIFYTIMEOUTLIMIT に指定されるタイムアウト値を超えると、このエラーメッセージが出力されます。値が 0 より大きい場合、タイムアウトはその値になります。環境変数の値が 0 以下の場合、タイムアウトは 0 です。環境変数自体が定義されていない場合、タイムアウト値はデフォルトで 120 秒です。RMS は終了コード 63 で終了します。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
重大な内部エラーが発生しました。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
クラスタアプリケーション <userapplication> が Online のときに、動的変更によりリソース<resource> を MonitorOnly にしようとすると、変更したいリソース <resource> が Online ではなくても、このメッセージが生成されて、動的変更が中止されます。
対処
クラスタアプリケーションを Offline に切り替えてからリソースの重要度を上げてください。
内容
動的変更の実行中に、クラスタアプリケーション <userapplication> が子を持たないことがわかると、このメッセージが switchlog に書き込まれ、動的変更が異常終了します。
対処
動的変更の実行中に、クラスタアプリケーションに有効な子があることを確認してください。
内容
RMS ウィザードは動的変更 HVMOD_HOST の実行中に環境変数 HVMOD_HOST を使用します。この変数には、hvmod を呼び出したノードの名前が含まれています。この変数を関数 putenv() で設定できない場合に、このメッセージと理由 failurereason が switchlog に書き込まれます。
対処
switchlog で理由 failurereason を調べて、この操作が失敗した理由を判別し、修正措置をとってください。
内容
ウィザードは hvmod の実行中にアクションファイルを使用します。終了コールでプロセスが終了する際、このアクションファイル (command) の実行が失敗すると、このメッセージと失敗の理由が switchlog に書き込まれます。
対処
switchlog を調べて失敗の理由を検出し、問題を解決してから hvmod コマンドを再発行してください。
内容
動的変更の実行中に、変更情報を記録したファイルのクラスタのノード間での転送に失敗しました。
対処
ノードとクラスタが command を正常に実行できる状態になっていることを確認してください。
内容
ノードはクラスタに参入すると、RMS 構成定義ファイルを受信します。ファイル転送が失敗すると、動的変更は中止されます。
対処
ノードとクラスタが command を正常に実行できる状態になっていることを確認してください。
内容
動的変更の実行中に、変更情報を記録したファイルのクラスタのノード間での転送に失敗しました。ファイル転送が失敗すると、動的変更は中止されます。このエラーの具体的な理由を調べるには、OS エラーコード ERRNO および ERRORREASON の説明を参照してください。本マニュアルの "付録B Solaris/Linux ERRNO テーブル" にも一覧があります。
対処
ノードとクラスタが command を正常に実行できる状態になっていることを確認してください。
内容
動的変更の実行中に、変更情報を記録したファイルのクラスタのノード間での転送に失敗しました。
対処
ノード、クラスタ、およびネットワークが command を正常に実行できる状態になっていることを確認してください。
内容
ローカルノードからリモートノードにコピーするファイル <filename> を開いて読込むことができない場合、このメッセージが出力されます。
対処
ファイル <filename> を読込めることを確認してください。
内容
ノード間のファイル転送中に OS エラーコード ERRNO で示される問題が発生しました。
対処
ノード、クラスタ、およびネットワークがファイル転送を正常に実行できる状態になっていることを確認してください。
内容
RMS BM(ベースモニタ)は、構成データを hvdisp プロセスに転送するために使用する一時ファイルの整合性とサイズを定期的に確認します。このファイルを確認できないときは hvdisp プロセスを自動的に再起動しますが、このとき一部のファイルが失われて表示されない場合があります。発生したエラーの OS エラーコードは ERRNO に表示されます。
対処
ノードが一時ファイルを確認できる状態になっていることを確認してください。場合によっては hvdisp プロセスを手動で再起動する必要があります。
内容
リモートノードはクラスタに参入するときに固有の RMS 構成定義ファイルをコピーし、リモートノードに転送しようとします。RMS 構成定義ファイルを保存できない場合、hvjoin の処理は中止されます。
対処
RMS 構成定義ファイルの保存中に発生したエラーに関する詳しい説明が以前のメッセージの 1つに記述されています。この説明に従ってノード環境を修正するか、当社技術員(SE)に連絡してください。
内容
リモートノードはクラスタに参入するときに固有の RMS 構成定義ファイルを準備し、リモートノードに転送しようとします。そのためにコマンド <command> を使用します。<command> が失敗した場合、hvjoin の処理は中止されます。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
ノードはクラスタに参入するときにリモートの RMS 構成定義ファイルを保存し、動的変更を実行しようとします。そのためにコマンド<command> を使用します。<command> が失敗した場合、hvjoin の処理は中止されます。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
ファイル転送は動的変更や hvjoin などの RMS 機能の一部です。ファイル <file> をリモートノードに転送する前にコマンド <command> で圧縮する必要があります。<command> が失敗すると、ファイル転送を伴う処理は中止されます。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
クラスタ内のすべてのノードで RMS をシャットダウンしようとしましたが、ノード <host> の RMS のシャットダウンに失敗しました。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
クラスタ内のすべてのノードで RMS をシャットダウンしようとしましたが、このノードの RMS のシャットダウンに失敗しました。シャットダウンは自動的に再試行されます。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
ファイル <file> の読込み中にエラー <errno> が発生しました。理由は <reason> に示されます。ファイル読込みエラーは動的変更または hvjoin の処理中に発生する場合があります。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
RMSの処理で内部異常が発生しました。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
重大な内部エラーが発生しました。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
動的変更の実行中に、新しいリソースを親オブジェクトに追加して、リソースを Offline にできないときに、このメッセージが出力されます。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
Online スクリプトを実行して、新規リソースを Online 状態の親オブジェクトに追加する場合、そのリソースを Online にできないと、動的変更は中止されます。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
動的変更の実行中に、親を持たない(したがって、すべてのクラスタアプリケーションにリンクされていない)オブジェクト <object> を追加しようとすると、このメッセージが出力されて、動的変更が中止されます。
対処
動的変更の実行中に追加するすべてのオブジェクトがクラスタアプリケーションにリンクされていることを確認してください。
内容
既存のリソースと同じ名前の新規リソース <resource> を追加しようとすると、このメッセージが switchlog に書き込まれて、動的変更が中止されます。
対処
新規リソースを追加するときに、その名前が他の既存のリソースと同じでないことを確認してください。
内容
既存のリソースと同じ名前の新規リソース <resource> を追加しようとすると、このメッセージが出力されて、動的変更が中止されます。
対処
新規リソースを追加するときに、その名前が他の既存のリソースと同じでないことを確認してください。
内容
RMS リソースのグラフ全体で、親 - 子リンクのチェーンに循環部分があってはいけません。循環部分があると、動的変更が失敗し、上記のメッセージが switchlog に書き込まれます。
対処
循環部分を削除してください。
内容
リソースを削除すると、そのリソースの子で他の親を持たない子もすべて削除されます。したがって、リソースを削除して、削除したリソースの属性、またはそのリソースの子で他の親を持たない子の属性を変更すると、動的変更が中止され、上記のメッセージが switchlog に書き込まれます。
対処
リソースの動的変更を実行するときに、変更するリソースが削除されていないことを確認してください。
内容
子オブジェクトを削除しようとしたときに、その親オブジェクトが削除されていると、上記のメッセージが switchlog に書き込まれて、動的変更が中止されます。
対処
オブジェクトを明示的に削除するときに、その親が削除されていないことを確認してください。親が削除されていると、その子も削除されていることになるからです。
内容
リソース <resource> を削除しようとしたときに、その子が削除されていると、上記のメッセージが switchlog に書き込まれて、動的変更が中止されます。
対処
リソースを明示的に削除するときに、その子が削除されていないことを確認してください。
内容
すべてのリソースは、stateOnline、stateOffline、stateFaulted、stateUnknown、stateStandby のいずれかの状態である必要があります。リソース <resource> がこれらの状態のいずれでもない場合は、上記のメッセージが書込まれて、動的変更が中止されます。理論的に、このようなことはあり得ません。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
リソースの親がクラスタアプリケーションの場合、その親に子をリンクしたり、その親の子をリンク解除することはできません。これらの操作を実行しようとすると、上記のメッセージがswitchlog に書き込まれて、動的変更が中止されます。
対処
クラスタアプリケーションにリソースをリンクしたり、クラスタアプリケーションからリソースをリンク解除してはいけません。
内容
動的変更の実行中に、既存のリソースをリンクしようとしたときに、子オブジェクトのリンク先である親オブジェクト <parentobject> がリソースでない場合、動的変更が失敗して、このメッセージが出力されます。
対処
2つのオブジェクトをリンクするときに、子オブジェクトの親がリソースであることを確認してください。
内容
動的変更の実行中に、既存のリソースをリンクしようとしたときに、親オブジェクトにリンクされる子オブジェクト <childobject> がリソースでない場合、動的変更が失敗して、このメッセージが出力されます。
対処
2つのオブジェクトをリンクするときに、親オブジェクトの子がリソースであることを確認してください。
内容
すでにリンクされている親 <parentobject> と子 <childobject> をリンクしようとすると、このメッセージが出力されます。動的変更が中止されます。
対処
動的変更を実行するときに、リンクしようとする親と子がリンク済みでないことを確認してください。
内容
動的変更の実行中に、2つの既存オブジェクト間で新しいリンクを作成するときに、障害のある子 <childobject> を、障害のない親 <parentobject> にリンクすることはできません。最初に、子を親と同じ状態にする必要があります。この操作を実行できない場合は、上記のメッセージが switchlog に書き込まれます。動的変更が中止されます。
対処
障害の発生している子を親と同じ状態にしてから、子と親をリンクしてください。
内容
動的変更の実行中に、2つの既存オブジェクトをリンクするときに、Online の親と Online でない子をリンクすることはできません。これらの親と子をリンクしようとすると、動的変更が中止されて、メッセージが switchlog に書き込まれます。
対処
最初に、子 <childobject> を Online にしてから、オンラインの親 <parentobject> にリンクしてください。
内容
2つの既存オブジェクトをリンクしようとしたときに、子の状態が Offline または Standby ではなく、親の状態が Offline または Standby の場合、これらのオブジェクトをリンクすることはできず、上記のメッセージが switchlog に書き込まれます。動的変更が中止されます。
対処
まず、子を Offline または Standby にしてから、Offline または Standby の親にリンクしてください。
内容
リンクされていないオブジェクト <parentobject> とオブジェクト <childobject> をリンク解除しようとすると、このメッセージが出力されて、動的変更が中止されます。
対処
2つのノードをリンク解除する場合に、2つのオブジェクトが親子関係であることを確認してください。
内容
どのクラスタアプリケーションとのリンクも残らないように子オブジェクト <childobject> をリンク解除することはできません。
対処
子がまだクラスタアプリケーションとリンクされていることを確認してください。
内容
動的変更では、いくつかの整合性チェックが行われます。整合性チェックで、以下のすべての条件が満たされていることを確認します。
userApplication オブジェクトの子だけに、HostName 属性が存在すること。
クラスタアプリケーションの子が別の親を持たないこと。
各オブジェクトが 1つのクラスタアプリケーションだけに属していること。
リーフオブジェクトがディテクタを持っていること。
DeviceName 属性を持つリーフオブジェクトの属性値が有効であること。
リーフオブジェクトの rName 属性の長さが最大値より小さいこと。
hvgdstartup ファイルに重複行が存在しないこと。
ディテクタの kind 引数が hvgdstartup で指定されていること。
ディテクタがロード可能であること。
rKind 属性の有効値が指定されていること。
ScriptTimeout の値がディテクタの通知間隔より大きいこと。
同時に and および or になっているオブジェクトがないこと。
ClusterExclusive と LieOffline が相互排他的で、いっしょに使用されていないこと。
これらの整合性チェックが失敗すると、このメッセージが出力されて、動的変更が中止されます。
FATAL メッセージと整合性チェックが失敗した詳しい理由も、switchlog に書き込まれます。
対処
上記の整合性チェックが成功するようにしてください。
内容
オブジェクト <object> を RMS リソースグラフから削除して、そのオブジェクトを親オブジェクトから(または親オブジェクトをそのオブジェクトから)リンク解除しようとすると、動的変更が中止され、上記のメッセージが switchlog に書き込まれます。
対処
削除とリンク解除を同時にオブジェクトに対して実行しないようにしてください。
内容
新規オブジェクトを既存の RMS 構成定義ファイルに追加するときは、既存のオブジェクト<parentobject> が新規オブジェクトの親である必要があります。そうでないと、動的変更が中止され、上記のメッセージが switchlog に書き込まれます。
対処
追加する新規オブジェクトに対して指定した親が存在することを確認してください。
内容
新規オブジェクトを既存の RMS 構成定義ファイルに追加するときに、指定した親オブジェクト <parentobject> がリソースでないと、動的変更が中止され、上記のメッセージが書き込まれます。動的変更が中止されます。
対処
新規オブジェクトに対して指定した親オブジェクトがリソースであることを確認してください。
内容
存在しない子オブジェクト <childobject> にリンクしようとすると、このメッセージが出力され、動的変更が中止されます。
対処
リンク先の子オブジェクトが存在することを確認してください。
内容
既存の RMS 構成定義ファイルに追加する新規オブジェクト <childobject> がリソースでないと、このメッセージが出力されます。動的変更が中止されます。
対処
指定した子オブジェクトがリソースであることを確認してください。
対処
重大なエラーです。このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
動的変更の実行中に、リソースではない新規オブジェクトを親オブジェクト <parentobject> として追加しようとすると、このメッセージが出力されます。動的変更が中止されます。
対処
親オブジェクトとして追加するオブジェクトがリソースであることを確認してください。
内容
動的変更の実行中に、指定した子オブジェクト <childobject> が存在しないと、このメッセージが出力されます。動的変更が中止されます。
対処
指定した子オブジェクトが存在することを確認してください。
内容
新規オブジェクトを RMS リソースグラフに追加するときに、この新規オブジェクトの子 <childobject> がリソースでないと、このメッセージが出力され、動的変更が中止されます。
対処
新規オブジェクトを追加するときに、その子がリソースであることを確認してください。
内容
存在しないまたはリソースではないオブジェクト <object> を削除しようとすると、このメッセージが出力されます。動的変更が中止されます。
対処
存在しないオブジェクトを削除しないようにしてください。
内容
動的再構成の間にリソースタイプのオブジェクト、userApplication、SysNode オブジェクトは削除できません。動的再構成の間に削除が許されるのは、リソース、アプリケーション、ノード(SysNode オブジェクト)のみです。
対処
オブジェクトを削除する場合は、これ以外のオブジェクトを削除してください。
内容
リソース <object> を既存の RMS リソースグラフに追加し、そのリソースが 2つの親オブジェクトの子としてリンクされ、一方の親が Online で、もう一方の親が Offline または Standby の場合に、このメッセージが出力されます。子オブジェクトを親と同じ状態にする必要があります。
対処
追加するリソースの両方の親が同じ状態であることを確認してから、リソースを追加してください。
内容
動的変更の実行中に、親リソース <parentobject> の状態 <state> が、stateOnline、stateOffline、stateFaulted、または stateUnknown でない場合は、動的変更が中止されます。
対処
親リソースの状態が上記のいずれかであることを確認してください。
内容
新規オブジェクト object をクラスタアプリケーション <userapplication> の子として追加し、その HostName 属性値がクラスタアプリケーション <userapplication> の既存の子の HostName 属性値と同じ場合に、このメッセージが出力されます。動的変更が中止されます。
対処
クラスタアプリケーションに追加するオブジェクトの HostName 属性が一意な値であることを確認してください。
内容
動的変更の実行中に、新しい子オブジェクト <childobject> をアプリケーション <userapplication> に追加するときに、このオブジェクトの HostName 属性が指定されていないとこのメッセージが出力されます。動的変更が中止されます。
対処
クラスタアプリケーションの下の第 1 レベルオブジェクトに対して HostName 属性が指定されていることを確認してください。
内容
親 <parentobject> と子 <childobject> の両方にディテクタが関連付けられていて、子の状態は Online ではないが、Online になる予定の親に子をリンクしようとした場合に、このメッセージが生成され、動的変更が中止されます。
対処
親と子が同じ状態であることを確認してください。
内容
Online の子 <childobject> を、Offline になる予定の親オブジェクトにリンクすることはできません。動的変更が中止されます。
対処
親と子が同じ状態であることを確認してください。
内容
異なるクラスタアプリケーション <userApplication1> および <userApplication2> に属する親リソースと子リソースを持つ新しい子オブジェクト <childobject> を追加しようとすると、このメッセージが出力されます。動的変更が中止されます。
対処
新規リソースを追加するときに、その親リソースと子リソースが異なるクラスタアプリケーションに属していないことを確認してください。
内容
既存の親を持たないオブジェクト <object> を作成しようとすると、このメッセージが出力されます。動的変更が中止されます。
対処
オブジェクト <object> が既存のオブジェクトを親として持つことを確認してください。
内容
オブジェクト <object> の HostName 属性の値が無効な場合に、このメッセージが出力されて、動的変更が中止されます。HostName 属性がない場合は、(ADM, 40) のメッセージが出力されます。
対処
リソース<object> の HostName 属性を有効な SysNode の名前に設定してください。
内容
異なるクラスタアプリケーション <userapplication1> および <userapplication2> に属する親オブジェクトに、新しい子オブジェクト <object> をリンクして追加しようとすると、このメッセージが生成されます。動的変更が中止されます。
対処
新しい子リソースを追加するときに、その親リソースが異なるクラスタアプリケーションに属していないことを確認してください。
内容
<parentobject> を親として持つノードを新規追加する場合、その <parentobject> が削除済みオブジェクトの子であるときは、新規オブジェクトを追加できません。オブジェクトを削除すると、その子が他の親を持たない場合は、子も自動的に削除されます。これにより動的変更が失敗します。
対処
新規オブジェクトを追加するときに、その親が削除されていないことを確認してください。
内容
削除済みのクラスタアプリケーションに属するオブジェクト <childobject> を削除しようとすると、このメッセージが出力されます。これは、クラスタアプリケーションを削除すると、その子もすべて自動的に削除されるからです。
対処
削除済みのクラスタアプリケーションに属するオブジェクトを削除しないようにしてください。
内容
削除済みのクラスタアプリケーションに属するオブジェクト <objectname> を削除しようとすると、このメッセージが出力されます。これは、クラスタアプリケーションを削除すると、その子もすべて(<objectname> を含む)削除されるためです。
対処
オブジェクトを削除する前に、そのオブジェクトが削除中のクラスタアプリケーションに属していないことを確認してください。
内容
新規オブジェクトの子孫であるオブジェクト <object> を削除しようとすると、このメッセージが出力されます。動的変更が中止されます。
対処
オブジェクトを削除するときに、それが新規オブジェクトの子孫でないことを確認してください。
内容
削除する予定の子 <childobject> にリンクしようとすると、このメッセージが出力され、動的変更が中止されます。
対処
削除する予定の子オブジェクトにリンクしないようにしてください。
内容
オブジェクト <object> を削除して、その子孫(親を削除したときに削除される)を、RMS リソースグラフに追加する新規リソースの親として使用すると、このメッセージが出力され、動的変更が中止されます。
対処
削除したオブジェクトの子孫を新規リソースの親として使用しないようにしてください。
内容
存在しないオブジェクト <object> の属性を変更しようとすると、このエラーが発生します。動的変更が中止されます。
対処
既存のオブジェクトの属性を変更してください。
内容
属性 <attribute> の値を無効なノード <object> に変更しようとすると、このメッセージが出力され、動的変更が中止されます。
対処
属性 <attribute> の有効値を指定してください。
内容
RMS はプロセス間通信用に Unix キューを内部で使用します。Admin キューは、RMS と他のユーティリティ(hvutil、hvmod、hvshut、hvswitch、hvdisp など)の通信に使われるキューの 1 つです。RMS がこのキューを作成できない場合は、RMS が終了コード 50 で終了します。
対処
RMS を再起動してください。
内容
-m オプションを指定して hvdisp を呼び出したときに、RMS が/opt/SMAW/SMAWRrms/locks/.rms.<pid> ファイルを書込み用に開くことができないと、このメッセージが出力されます。
対処
ディレクトリ /opt/SMAW/SMAWRrms/locks/.rms. が存在していること、およびファイルが作成できること(適切な権限、ファイルシステムの空き領域、空き i ノード)を確認してください。これらの問題が 1つでも存在する場合は、必要な管理操作によって問題を解決してください。これらの問題が存在しないにもかかわらず、エラーが発生する場合は、当社技術員(SE)に連絡してください。
内容
hvdisp コマンドの実行中に、ファイル file(/opt/SMAW/SMAWRrms/locks/.rms.<pid>) を書込み用に開くことができないと、その理由 errormsg の書込みが行われます。
対処
ディレクトリ /opt/SMAW/SMAWRrms/ が存在していること、およびファイルが作成できること(適切な権限、ファイルシステムの空き領域、空き i ノード)を確認してください。これらの問題が 1つでも存在する場合は、必要な管理操作によって問題を解決してください。これらの問題が存在しないにもかかわらず、エラーが発生する場合は、当社技術員(SE)に連絡してください。
内容
hvswitch、hvshut などのコマンドはローカルでない hvmod コマンドと並列に実行できないため、このメッセージが switchlog に書き込まれます。
対処
hvswitch を実行する前に、userapplication で hvmod が実行中でないことを確認してください。
内容
切替えを実行するときは、hvswitch コマンドの引数としてクラスタアプリケーションを指定する必要があります。リソース <resource> がクラスタアプリケーションでない場合に、このメッセージが出力されます。
対処
"PRIMECLUSTER 活用ガイド<コマンドリファレンス編>" で、hvswitch の正しい使用方法を確認してください。
内容
ShutdownScript 属性は SysNode の非表示属性です。この値は RMS BM が自動定義します。
ユーザが変更することはできません。
対処
ShutdownScript 属性に定義済みの値を変更しないようにしてください。
内容
このメッセージは、以下に示す状況で出力されます。
hvswitch で指定した SysNode の名前が RMS 構成定義ファイルの一部でない (hvswitch [-f] userApplication [sysnode])。
hvshut -s sysnode で指定した SysNode の名前(例: sysnode など)が有効でない、つまり現在の RMS 構成定義ファイルの一部でない。
hvutil -{ou} で指定した SysNode の名前が不明である(隠れたオプション)。
対処
現在の RMS 構成定義ファイル(例: configname.us など)の中で使用している SysNode 名を指定してください。
内容
hvshut -a を呼び出したときに、一部のノードが応答しないと、このメッセージが出力されます。
対処
リモートノードにログインします。RMS がまだ稼動している場合は、hvutil -f <userapplication> を実行して、クラスタアプリケーションを停止します。この操作により正しく終了しない場合は、switchlog と<userapplication> ログを参照して、問題の原因を調べてください。すべてのクラスタアプリケーションが正しく停止したら、強制シャットダウン hvshut -f で RMS 自体をシャットダウンします。その後で RMS のサポートに問題を報告してください。
内容
hvshut -a を呼び出したノード上でアプリケーションがビジー状態であるため、そのノードをまだシャットダウンできません。
対処
実行中のアクション(切替え、動的再構成など)が終了するのを待ってください。
内容
RMS 内部の整合性チェック機能で、RMS 構成定義ファイルに関する重大な問題が見つかると、このメッセージが出力されます。RMS 設定ウィザードで RMS 構成定義ファイルを設定した場合は、このメッセージが出力されません。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
属性 <attribute> は定数で、RMS 構成定義ファイルでのみ設定可能です。
対処
<object> 内で <attribute> を変更しないようにしてください。
内容
アサートしているオブジェクトに対して動的変更を実行すると、このメッセージが switchlog に書き込まれます。
対処
アサートが終了してから変更を行ってください。
内容
<userapplication> の PriorityList に、アプリケーションの子の HostName 属性のノード名がすべて含まれるように設定します。
対処
PriorityList 内でノード名が重複しないようにしてください。
内容
親 PriorityList の属性に含まれていないノード名が、1つ以上の子の HostName 属性で指定されています。
対処
アプリケーション <userapplication> の PriorityList に、アプリケーションの子の HostName 属性に記載されたノード名がすべて含まれるように設定します。PriorityList 内でノード名が重複しないようにしてください。
内容
<userapplication> が、属性 MaxControllers (<maxcontroller>) で指定されている数より多くの親コントローラを使用すると、このメッセージが出力されて、動的変更が中止されます。
対処
アプリケーションが使用する親コントローラの数を、MaxControllers 属性で指定されている数より少なくするか、MaxControllers を大きな値に変更してください。
内容
SysNode の状態が、Unknown、Offline、Wait、または Faulted の場合に、この SysNodeを実行中の RMS 構成から削除しようとすると、このメッセージが switchlog に書込まれます。
対処
そのノード上で RMS をシャットダウンして、削除を実行してください。
内容
動的変更の実行中に、ローカル SysNode <sysnode> を削除しようとしました。
対処
動的変更に 'delete SysNode;' (SysNode はローカルSysNode) が含まれないようにしてください。
内容
動的変更の一部で指定した名前 <sysnode> が、既知のノード名として有効でない場合に、このメッセージが switchlog に書き込まれます。
対処
ネットワークアドレスに有効なノード名を指定してください。
内容
動的変更の実行時間が長すぎると、このメッセージが出力されます。
対処
ノード間のネットワーク接続が機能していることを確認してください。また、新規追加リソースのスクリプトの実行時間が長すぎないこと、または動的変更で追加する新規ノードが多すぎないこと、または変更ファイルが大きすぎたり複雑すぎたりしないことを確認してください。
内容
制御されるアプリケーション <userapplication> のコントローラ <controller> の Resource 属性にアプリケーションの名前が残っている間は、そのアプリケーションを削除できません。
対処
削除したアプリケーションの名前をコントローラの Resource 属性から削除するか、同じ名前の新規アプリケーションを追加するか、制御されるアプリケーションとともにコントローラを削除するか、コントローラの NullDetector 属性 を1 に変更してください。
内容
このメッセージが出力されるのは、ローカル変更ではローカル属性の変更だけが認められているからです。
対処
ローカルでない変更を行うか、別の属性を変更してください。
内容
特定のオブジェクトの属性は同じ変更ファイル内で 1 回しか変更できません。オブジェクト<%object> の属性 <attribute> を 2 回以上変更すると、このメッセージが出力される場合があります。
対処
各オブジェクトの属性を 1 回だけ変更してください。
内容
既存のノード <sysnode> を他のノード <othersysnode> に改名しようとした場合に、以下の条件のいずれかに当てはまるとこのメッセージが出力されます。
<othersysnode> は有効なノード名でない
<othersysnode> はすでにクラスタ内の他のノード名として使用されている
<othersysnode> はリソースでない
<othersysnode> は制御されるアプリケーションである
対処
別の有効なノード名を選択してください。
内容
コントローラオブジェクトによってコントロールされ、削除される予定のリソース名を変更しようとすると、このメッセージが表示されます。
対処
削除されるアプリケーションがコントローラによって制御されていないことを確認してください。
内容
ユーザがコントローラ <controller> でリソース <resource> をコントロールしようとしたが、そのリソースと関連するユーザアプリケーションが削除される予定の場合に、このメッセージが出力されます。
対処
コントローラの Resource 属性が、削除されるアプリケーションと関連していないことを確認してください。
内容
'-a' オプションで RMS を起動して、内部エラーのためリモートノード上で RMS を起動できない場合に、このメッセージが出力されます。重大な内部エラーです。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。当面の回避策としては、再度操作を行うか、各ノードの RMS を手動で起動してください。
内容
コマンド <startupcommand> が失敗したので、RMS をリモートノード上で起動できないときに、このメッセージが出力されます。
対処
一部のノードにアクセスできないとき、またはネットワークがダウンしているときに、このエラーが発生します。
ネットワーク、リモート先のノードに問題が無いか確認し、原因を回避してから再度操作を行ってください。
内容
コントローラノードがコントロールするアプリケーションが見つからず、そのアプリケーションがノード上で稼動しているときに、このメッセージが出力されます。
対処
変更ファイルを訂正して、コントローラが既存のアプリケーションだけをコントロールするようにしてください。
内容
コントローラオブジェクト <controller> の Resource 属性を <oldresource> から <newresource> に変更しようとして、<newresource> にリストされている 1つ以上のアプリケーションが既存のアプリケーションでない場合、またはアプリケーションの状態がコントローラの状態と矛盾する場合、またはリスト内の要素が重複している場合に、このメッセージが出力されます。
対処
リソース <newresource> にリストされているアプリケーションが、2 回以上書かれていないことまたは無効であることを確認してください。
内容
アプリケーションをコントローラでコントロールする必要があり、コントローラの AutoRecover 属性が 1 に設定されている場合は、アプリケーションの属性 PreserveState および AutoSwitchOver をそれぞれ 1 と No に設定する必要があります。
対処
アプリケーションの属性 PreserveState および AutoSwitchOver を確認してください。
内容
クラスタ内の SysNode オブジェクト数の合計が、上限値を超えています。
対処
クラスタ内の SysNode オブジェクト数の合計が maxhost を超えないように設定してください。
内容
クラスタアプリケーション <userapplication> の RMS 構成定義ファイルに指定された SysNode 名の長さの累計が、上限値を超えています。
対処
SysNode 名の長さが、制限値以下になるように設定してください。
内容
エントリ attr は一意でなければなりません。
対処
エントリ attr が一意であることを確認してください。
内容
RMSの処理で内部異常が発生しました。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
切替えを実行するときは、hvswitch コマンドの引数としてクラスタアプリケーションまたはリソースを指定する必要があります。
<resource>がクラスタアプリケーションまたはリソースでない場合に、このメッセージが出力されます。
対処
"PRIMECLUSTER 活用ガイド<コマンドリファレンス編>" で、hvswitch の正しい使用方法を確認してください。
内容
RMS が hvgdstartup で行の重複を検出すると、このメッセージが表示されます。この後、RMS はコード 23 で終了します。
対処
hvgdstartup では、行は一意である必要があります。重複した行はすべて削除してください。
内容
hvgdstartup ファイルで、ディテクタのエントリが g<n> -t<n>' -k<n> の形式でない場合、または、-k<n>& オプションが脱落しています。この場合は RMS が起動できないため、コード 23 で終了します。
対処
ディテクタの種類(-k<n> オプション)が、正しく指定されるようにエントリを修正してください。
内容
動的変更の間に DetectorStartScript の種類を再定義しようとすると、このメッセージが出力されます。
対処
ディテクタの実行中は DetectorStartScript の再定義をしないようにしてください。
内容
以下のいずれか 1つのメッセージが表示されます。
Check for SanityCheckErrorPrint
Object <object> cannot have its HostName attribute set since it is not a child of any userApplication. Only the direct descendants of userApplication can have the HostName attribute set.
In basic.C:parentsCount(...)
The node <node> belongs to more than one userApplication, app1 and app2. Nodes must be children of one and only one userApplication node.
The node <node> is a leaf node and this type <type> does not have a detector. Leaf nodes must have detectors.
The node <node> has an empty DeviceName attribute. This node uses a detector and therefore it needs a valid DeviceName attribute.
The rName is <rname>, its length length is larger than max length maxlength.
The DuplicateLineInHvgdstartup is <number>, so the hvgdstartup file has a duplicate line.
The NoKindSpecifiedForGdet is <number>, so no kind specified in hvgdstartup.
Failed to load a detector of kind <kind>.
The node <node> has an invalid rKind attribute. Nodes of type gResource must have a valid rKind attribute.
The node <node> has a ScriptTimeout value that is less than its detector report time. This will cause a script timeout error to be reported before the detector can report the state of the resource. Increase the ScriptTimeout value for objectname (currently value seconds) to be greater than the detector cycle time (currently value seconds).
Node <node> has no detector while all its children's "MonitorOnly" attributes are set to 1.
The node <node> has both attributes "LieOffline" and "ClusterExclusive" set. These attributes are incompatible; only one of them may be used.
The type of object <object> cannot be or and and at the same time.
Object <object> is of type and, its state is online, but not all children are online.
対処
上記の説明を参照して構成を修正してください。
内容
1つのオブジェクトが複数のユーザアプリケーションの一部であることが判明しました。
RMS アプリケーションは、共通オブジェクトを持つことができません。
対処
複数のアプリケーションが共通のオブジェクトを持つことがないよう RMS 構成定義ファイルを見直してください。
内容
子オブジェクトを持たないオブジェクト(リーフオブジェクト)のタイプは、type です。このタイプは、RMS のディテクタを持っていません。RMS 構成定義ファイルにおいては、すべてのリーフオブジェクトがディテクタを持つ必要があります。
対処
すべてのリーフオブジェクトがディテクタを持つように RMS 構成定義ファイルを変更してください。
内容
重大な内部エラーです。switchlog にこのメッセージが出力された場合は、BM に重大な障害が発生していることを示しています。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
rName 属性の値の長さが、上限値 maxlength を超えています。
対処
上限値 maxlength を超えないよう rName を指定してください。
内容
このメッセージには、hvgdstartup ファイルの重複行の行番号が表示されます。
対処
ファイル hvgdstartup に重複行がないようにしてください。
内容
hvgdstartup で汎用ディテクタの種類が指定されていません。
対処
hvgdstartup の汎用ディテクタの種類を指定してください。
内容
オブジェクト object に DetectorStartScript が定義されていません。
対処
オブジェクト object に DetectorStartScript が定義されていることを確認してください。
内容
オブジェクト object に無効な rKind 属性が指定されています。
対処
オブジェクト object に有効な rKind 属性を指定してください。
内容
ScriptTimeout の値がディテクタ通知間隔より小さいと、このメッセージが表示されます。この場合、リソースを Online または Offline に変更しようとすると、その移行処理中はリソースに障害が発生しているように見えます。
対処
ScriptTimeout の値がディテクタ通知期間より大きくなるように変更してください。
内容
RMS オブジェクトは or または and のいずれかのタイプである必要がありますが、同時に両方のタイプであることはできません。switchlog にこのメッセージが出力された場合は、RMS の実行可能プログラムに重大な損傷が発生しています。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
このメッセージは、動的変更の実行中、変更の適用前に既存の RMS 構成定義ファイルを検証した際に表示されます。このメッセージが表示されると、動的構成はそれ以上実行されません。
対処
タイプが and の Online オブジェクトすべてに、Online 状態の子オブジェクトが存在するように修正した後、動的変更を実行してください。
内容
クラスタアプリケーションの子オブジェクトでないオブジェクトに、HostName 属性が設定されています。HostName 属性を設定できるのは、クラスタアプリケーションの子オブジェクトだけです。
対処
オブジェクトの定義から HostName 属性を削除するか、このオブジェクトを他の非 userApplication オブジェクトの子オブジェクトにすることにより、userApplication オブジェクトをこのオブジェクトから切り離してください。
内容
1つの RMS オブジェクトに 2つの属性 LieOffline と ClusterExclusive が同時に設定されています。1つのオブジェクトには、どちらか一方しか指定できません。
対処
RMS オブジェクト object から、いずれか一方または両方の属性を削除してください。
内容
RMS BM によりディテクタが起動できませんでした。
対処
ディテクタの実行可能ファイルが正しい場所に存在していること、および実行権限があることを確認してください。
内容
ディテクタを持たないオブジェクトの、すべての子オブジェクトの MonitorOnly 属性 が 1 に設定されています。ディテクタを持たないオブジェクトには、MonitorOnly が 0 に設定された子オブジェクトが最低 1つ必要です。
対処
ディテクタを持たないオブジェクトには、MonitorOnly が 0 に設定された子オブジェクトが最低 1つ存在するように RMS 構成定義ファイルを変更してください。
内容
1つの RMS オブジェクトに 2つの属性 MonitorOnly と ClusterExclusive が同時に設定されています。 1つのオブジェクトには、どちらか一方しか指定できません。
対処
RMS オブジェクト object から、いずれか一方または両方の属性を削除してください。
内容
RMSの処理で内部異常が発生しました。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
RMS 内部エラー。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
RMS 内部エラー。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
RMS 内部エラー。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
RMS 内部エラー。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
動的変更の実行中に、タイプが不明のオブジェクトを追加しました。
対処
RMS 構成定義ファイルでは、タイプが既知のオブジェクトだけを使用してください。
内容
存在しないオブジェクトの属性を変更することはできません。
対処
存在するオブジェクトの属性だけを変更してください。
内容
属性変更の対象として、無効な属性を指定しました。
対処
有効な属性だけを変更してください。
内容
動的変更の実行中に、システムタイプ <symbol> のオブジェクト <object> を指定しました。
対処
新規オブジェクトを構成に追加するときは、有効なリソースタイプだけを使用してください。
内容
システムタイプ <symbol> のオブジェクト <object> を、削除の対象として指定しました。
対処
有効なリソースタイプのオブジェクトだけを削除してください。
内容
制御されるアプリケーション <controlleduserApplication> の PriorityList が、コントローラ <controller> が属しているアプリケーション <userApplication> の PriorityList と異なる場合に、このメッセージが出力されます。
対処
コントローラと制御されるアプリケーションの PriorityList が同じであることを確認してください。
内容
動的変更の実行中に、Standby 状態のリソースに追加する新規リソースを Standby にできない場合、このメッセージが出力されます。
対処
RMS 構成定義ファイルを分析して、スタンバイ対応リソースを Standby 状態にできるかどうか確認してください。
内容
アプリケーション <userapplication> をコントローラ <controller> でコントロールするには、アプリケーション <userapplication> がノード <sysnode> 上で 1つ以上のスタンバイ対応リソースを持っている必要があります。
対処
制御されるアプリケーションが 1つ以上のスタンバイ対応コントローラを持っていること、またはコントローラがスタンバイ対応でないことを確認してください。
内容
コントローラの属性 StandbyCapable と IgnoreStandbyRequest の両方を 1 に設定すると、このメッセージが出力されます。
対処
一方の属性だけを 1 に設定し、もう一方を 0 に設定してください。
内容
コントローラノード <controller> の Follow 属性を 1 に設定するには、属性 OnlineTimeout または StandbyTimeout の一方を null にする必要があります。
対処
属性を正しく設定して、再実行してください。
内容
アプリケーション <userapplication> をコントローラでコントロールする必要がある場合に、アプリケーションの属性 ControlledSwitch と ControlledShutdown の一方または両方が 1 に設定されていると、このメッセージが出力されます。
対処
属性を正しく設定して、再実行してください。
内容
DetectorStartScript、NullDetector、または NonCritical などのグローバル属性 <attribute> を、ノード <hostname> 上でローカルに変更することはできません。
対処
attribute をグローバルに変更するか、別の属性をローカルに変更してください。
内容
CIP 構成定義ファイルに、エントリの抜けがあります。
対処
クラスタ内で稼動するすべての RMS ノードのエントリが CIP 構成定義ファイルに含まれていることを確認してください。
内容
BM は、動的再構成の間に自らの RMS 構成を.dob ファイルから読込みを行います。このファイルが読込めない場合、このメッセージが switchlog に出力されます。この OS エラーは、errno および errorreason に表示されます。
対処
ノードが .dob ファイルをエラーが表示されることなく読込める状態にあることを確認してください。
内容
メッセージキューパラメタの取得時に sysdef から BM にパラメタを送信できなくなりました。
errno および reason の値はエラーの種類を示します。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
コントローラ属性 Follow が設定されている場合、他の属性 IndependentSwitchOver、AutoSwitchOver、ControlledSwitch および ControlledShutdown の値は、それぞれ 0、No、1、および 1 に設定されている必要があります。 しかし、現在の RMS 構成定義ファイルはこのように設定されていません。
対処
コントローラとそれにより制御されるユーザアプリケーションに対し、正しい組合せで属性を設定してください。
内容
コントローラの Follow が 1 に指定された場合は、すべての制御されるアプリケーションは、属性 <PersistentFault> について、コントローラが属するアプリケーションと同じ値を持つ必要があります。
対処
RMS 構成定義ファイルを確認後、修正してください。
内容
これは、ルーチン <routine> が <errorreason> の理由で失敗し、RMS-CF の整合性が失われたことを示すメッセージです。
対処
複数のノードで同時にRMSを停止した際に出力された場合、対処は不要です。それ以外の場合は、このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
DetectorStartScript 属性と hvgdstartup ファイルは排他関係にあります。
対処
新しい RMS 構成定義ファイルの設定には必ず DetectorStartScript を使用してください。
hvgdstartup は、将来のリリースではサポートされない可能性があります。
内容
コントローラ属性の組合せが正しくありません。IgnoreOfflineRequest と IgnoreOnlineRequest の両方が 1 に設定されていると、制御されるアプリケーションに要求がいっさい伝播されないため、要求は分割されません。
対処
コントローラ属性を正しい組合せで指定してください。
内容
制御するアプリケーションの AutoSwitchOver 属性にオプション Shutdown が指定されている場合、このアプリケーションのコントローラにより制御されるすべてのアプリケーションにも、同様に AutoSwitchOver 属性にオプション Shutdown が指定されている必要があります。
対処
AutoSwitchOver 属性を正しく設定してください。
内容
NullDetector や MonitorOnly などのローカルなコントローラ属性の変更は、グローバルな変更の間にのみ可能です。
対処
ローカルでない変更を行うか、別の属性を変更してください。
内容
オブジェクト名の長さが上限値を超えています。
対処
オブジェクト名の長さが上限値を超えないようにしてください。
内容
スケーラブルコントローラ以外のコントローラでは、Apllication Sequence 属性は設定できません。
対処
ApplicationSequence 属性と Scalable 属性を正しく設定してください。
内容
スケーラブルコントローラの ApplicationSequence 属性に、制御されるアプリケーションのリストにないアプリケーション名が含まれています。
対処
コントローラの ApplicationSequence 属性と Resource 属性を正しく設定してください。
内容
スケーラブルコントローラでは、属性 Follow を 0 に、IndependentSwitch を 1 に設定する必要があります。
対処
Follow、IndependentSwitch、Scalable の各属性を正しく設定してください。
内容
スケーラブルコントローラの ApplicationSequence 属性で指定できるのは既存のアプリケーションのみです。
対処
ApplicationSequence 属性を正しく設定してください。
内容
1つのアプリケーションを制御できるのは、1つのスケーラブルコントローラのみです。
対処
RMS 設定を修正してください。
内容
制御されるアプリケーションと制御するアプリケーションで、ノード名が一致していません。制御するアプリケーションは、制御されるアプリケーションが実行されているすべてのノードで実行されていなければなりません。
対処
RMS 設定を修正してください。
内容
制御されるアプリケーションと制御するアプリケーションで、ノード名が一致していません。制御するアプリケーションは、制御されるアプリケーションが実行されているすべてのノードで実行されていなければなりません。
対処
RMS 設定を修正してください。
内容
コントローラに Follow 属性が設定され、制御されるアプリケーションが StandbyCapable リソースを持つ場合、コントローラには StandbyCapable を設定し、IgnoreStandbyRequest を無効にしてください。無効になっていない場合、制御されるアプリケーションに Standby 要求が正しく伝播されません。
対処
コントローラとそれにより制御されるユーザアプリケーションに対し、正しい組合せで属性を
設定してください。
内容
ディテクタの起動スクリプト内の -k フラグに指定された値が正しくありません。
対処
RMS 設定を修正してください。
内容
rKind 属性の値とディテクタ起動行の -k フラグの値が一致していません。
対処
RMS 設定を修正してください。
内容
同一オブジェクト内で rKind の異なる値が検出されました。
対処
RMS 設定を修正してください。
内容
コントローラ属性 Scalable と SplitRequest は同時に指定できません。
対処
RMS 設定を修正してください。
内容
排他リソースは、PartialCluster 属性が 1 に設定されたアプリケーションに属することはできません。また、排他リソースを PartialCluster 属性が 1 に設定されたアプリケーションから Follow コントローラによって直接または間接的に制御することもできません。
対処
RMS 設定を修正してください。
内容
スケーラブルコントローラにより制御されたアプリケーションでは、AutoSwitchOver にオプション <ShutDown> が指定されている場合は、ControlledShutdown を 1 に設定することはできません。
対処
RMS 構成定義ファイルを修正してください。
内容
RMS 構成定義ファイル内の 1 行の大きさが制限を越えています。
対処
各行が 2000 バイト未満になるように、RMS 構成定義ファイルを修正してください。
内容
<Sysnode> の RMS が予期せず終了しました。
対処
RMS が予期せず終了した原因を調査し、適切な対処を実行してください。RMSが予期せず終了した場合、予期せず終了したノードを強制停止する旨の(US, 12)のメッセージが続けて出力されます。
<Sysnode> が停止している状態で、RMS を起動した場合に、本メッセージが出力されることがありますが、この場合は対処不要です。
内容
getaddrinfo が異常終了したため、rmshb のポートの割り当てに失敗しました。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
hvcm のオプションには、引数を必要とするものがあります。引数を指定しないで hvcm を呼び出すと、このメッセージと hvcm の使用方法が表示され、RMS が終了コード 3 で終了します。
対処
"PRIMECLUSTER 活用ガイド<コマンドリファレンス編>" で、hvcm の正しい使用方法を確認してください。
内容
無効なオプションを指定しました。
対処
"PRIMECLUSTER 活用ガイド<コマンドリファレンス編>" で、hvcm の正しい使用方法を確認してください。
内容
-l オプションで、不適切な数字を指定しました。範囲を確認してください。
対処
"PRIMECLUSTER 活用ガイド<コマンドリファレンス編>" で、hvcm の -l オプションの範囲引数を確認してください。
内容
hvcm または hvutil の -l オプションで指定したログレベル loglevel が最大ログレベルmaxloglevel より大きい場合に、このメッセージが出力されます。
対処
hvcm または hvutil の -l オプションで、1..maxloglevel の範囲のログレベルを指定してください。
内容
hvcm または hvutil の -l オプションでログレベルの範囲を指定し、上限 high の値が low の値より小さいと、このメッセージが出力されます。
対処
上限を下限より大きい値で指定してください。
内容
以下のいずれかの場合に本メッセージが出力されます。
hvutil の -l オプションで指定したログレベルが数値、off または display でない場合
hvcm の -l オプションで指定したログレベルが数値または off でない場合
対処
"PRIMECLUSTER 活用ガイド<コマンドリファレンス編>"で、hvutil/hvcmの正しい使用方法を確認してください。
内容
hvcm または hvutil の -l オプションでログレベルの範囲を指定し、範囲外の場合、このメッセージが出力されます。
対処
hvcm または hvutil の -l オプションに有効なログレベルを指定してください。有効範囲は1..maxloglevel です。
内容
RMS BM はすべてのクラスタノードの優先順位リストを管理します。通常、ローカルノードは必ずリスト内に存在します。そうでない場合に、このメッセージが出力されます。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
RMS は内部キューを使用して、同じノード上のプロセス間または異なるノード上のプロセス間でコントラクトを送信します(コントラクトはクラスタのノード間で送信され、特定の操作に関して異なるノードの同期がとられていることを確認するためのメッセージです)。これらのコントラクトを RMS クラスタのノード間で送信するために使用する NET_SEND_Q キューに問題があると、このメッセージが switchlog に書き込まれます。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
RMS がクラスタ内で別のノードにメッセージを送信しようとしたときに、NET_SEND_Q キューによるこのメッセージ配信が失敗すると、このメッセージが出力されます。原因として、メッセージ送信先のノードがダウンしているか、クラスタインタコネクトの問題が考えられます。
対処
クラスタ内で他のすべてのノードが稼動していること、およびすべてのノードでネットワークの問題が発生していないことを確認してください。
内容
あるノード上の RMS が NET_SEND_Q キューを使用して、別のノードまたはそのノード自身に(クラスタにノードが 1つしか存在しない場合)コントラクトを送信するときは、内部で決められた特定の回数だけこのコントラクト送信を試みます。この回数が試行されてもメッセージを送信できない場合は、このメッセージが switchlog に書き込まれて、このコントラクトが破棄されます
(UAP コントラクトは破棄されません)。
対処
クラスタインタコネクトに問題がないことと、クラスタの整合性がとれていること(つまり、複数のノード上でクラスタアプリケーションが Online でないこと、SysNode が保留 Wait 状態でないことなど)を確認してください。
確認した結果問題がある場合は、このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
ローカルノード crthost は、Online であるべきコントラクトノードの発信元の状態が、state であることを検出しました。
対処
ノード間通信チャネルが正しく動作中であること、およびノードが互いに Online であることを認識していることを確認してください。
内容
コントローラによって制御されるリソースが RMS 構成定義ファイルに存在せず、コントローラの NullDetector 属性が off に設定されている場合に、このメッセージが出力されます。
対処
コントローラが正しく機能するには、制御されるリソースが RMS 構成定義ファイル内に存在する必要があります。
リソースを正しく構成してください。
内容
1つ以上のノードで、コントローラ <controller> に制御されるアプリケーションが 2つ以上 Online になると、コントローラに障害が発生します。
対処
コントローラに制御されるアプリケーションが、複数個 Online にならないようにしてください。
内容
どのノードがクラスタアプリケーションを制御するかについてクラスタノード間で合意に達しない場合にこのメッセージが出力されます。最も可能性の高い原因として、hvswitch 要求の強制実行などのシステム管理者の操作ミスにより、複数ノードでクラスタアプリケーションが同時に Online になった場合が考えられます。
対処
クラスタの不整合を分析して適切な解決策を実行してください。例えば、複数ノードでクラスタアプリケーションが Online になった場合は、1 台のノードを除くすべてのクラスタアプリケーションを hvutil -f コマンドでシャットダウンしてください。
内容
重大な内部エラーが発生しました。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
ノードが認識不能なコントラクトをアプリケーションから受け取りました。重大な内部エラーです。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
ユーザアプリケーションがローカルノード上で Online で、他のノード上でも Online です。
対処
ユーザアプリケーションは 1つのノードでのみ Online になることができます。1つを除くすべてのノードでアプリケーションが Offline であることを確認してください。アプリケーションが複数のノードで Online になっている場合は、hvutil -f を使用して余分なノード上のクラスタアプリケーションを Offline 状態にしてください。
内容
クラスタアプリケーションを制御するノードがどのノードなのかの認識がクラスタノード間で異なっている場合にこのメッセージが出力されます。最も可能性の高い原因として、hvswitch 要求の強制実行などのシステム管理者の操作ミスにより、複数ノードでクラスタアプリケーションが同時に Online になった場合が考えられます。
このメッセージは (CUP, 2) と同じです。(CUP, 8) がコントラクトの発信元ノードに出力されるのに対し、(CUP, 2) は発信元以外のノードに出力されます。
対処
クラスタの不整合を分析して適切な解決策を実行してください。例えば、複数ノードでクラスタアプリケーションが Online になった場合は、1台のノードを除くすべてのクラスタアプリケーションを hvutil -f コマンドでシャットダウンしてください。
内容
このメッセージは、依存するリソース(RMS グラフで下位にあるリソース)に発生した障害が理由で、<resource> に示されるリソースに障害が発生したとき表示されます。
対処
子リソースに障害が発生した原因を調べ、必要な修正を行ってください。
内容
ディテクタから予期しない Faulted 状態が通知されたときにこのメッセージが出力されます。
対処
リソースに障害が発生した原因を調査し、適切な対処を実行してください。
内容
このメッセージは、ディテクタがリソースのスクリプトの実行に失敗したときに表示されます。
対処
スクリプトに誤りがないか確認し、さらにリソースにも問題がないか確認してください。
内容
リソースに障害が発生したため FaultScript を実行しましたが、<resource> に示されるリソースの FaultScript の実行に失敗しました。
対処
FaultScript を実行するきっかけとなった故障リソースに対し、故障原因を調査してください。また、FaultScript の実行に失敗した <resource> に示されるリソースに対し、FaultScript の実行が失敗したことによるシステムへの影響を調査してください。リソースに障害が発生した原因、および、FaultScript の実行に失敗したことによるシステムへの影響が判明しない場合は、調査用の情報を採取し、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
Offline スクリプトを実行すると、リソースは Offline になります。ScriptTimeout 属性に指定された時間(秒)内に状態が変更されない場合、または Offline 以外の状態に変更された場合、リソースは Faulted の状態であると判断されます。
対処
Offline スクリプトを実行後にリソースが Offline 状態に変更されることを確認してください。
内容
Online スクリプトを実行すると、リソースは Online になります。ScriptTimeout 属性に指定された時間(秒)内に状態が変更されない場合、または Online 以外の状態に変更された場合、リソースは Faulted の状態であると判断されます。
対処
Online スクリプトを実行後にリソースが Online 状態に変更されることを確認してください。
内容
このメッセージはリソースが不意に Offline になったときに表示されます。ディテクタが BM への応答を停止すると、リソースに障害が発生したと判断されます。
対処
<resource> に示されるリソースが不意に Offline 状態になった原因を調査してください。リソースが不意に Offline 状態になった原因が判明しない場合は、調査用の情報を採取し、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
このメッセージは、コマンド行に何も指定されていない場合、または無効な値が指定されている場合に表示されます。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
ディテクタ detector がerrorreason が理由で起動しない場合、このメッセージが出力されます。理由 errorreason は次のいずれかです。
ディテクタ detector が存在しない。
ディテクタ detector に実行権限がない。
ディテクタのプロセスを出力できない。
BM が同時に出力するプロセス数が 128 より多い。
対処
エラーの原因に応じて適切な対処を行ってください。
内容
ディテクタスクリプトが不良であるか、フォーマットが誤っています。
対処
ディテクタ起動スクリプトをチェックしてください。
内容
スタンバイ要求中に Online スクリプトを実行すると、リソースは Standby になります。
ScriptTimeout 属性に指定された時間(秒)内に状態が変更されない場合、または Standby か Online 以外の状態に変更された場合、リソースは Faulted の状態であると判断されます。
対処
スタンバイ要求中に Online スクリプトを実行後、リソースが Standby または Online 状態に変更されることを確認してください。
内容
このメッセージは、リソースを Faulted 状態にする可能性のある Online スクリプトを実行した後、リソースが Online になれなかった場合に表示されます。
対処
リソース resource が Online 状態になれなかった原因を調べてください。
内容
状態エンジンの中で要求を処理しているときに、要求トークンまたは応答トークンがオブジェクトに配信されましたが、そのオブジェクトがローカルノードに定義されていません。重大な内部エラーです。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
ディテクタに異常があり所定回数以上、ディテクタを再起動しました。ディテクタの異常が考えられます。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
RMS ディテクタが停止しないようにするため、各ディテクタは BM に対し定期的にハートビートメッセージを送信します。ハートビートが一定期間途絶えると、switchlog に本メッセージが出力されます。BM は失速したプロセスにアラームシグナルを送信して、ディテクタがメインループを適切に処理します。メッセージには、BM がディテクタのハートビートを前回受信してからの経過時間が記載されています。この時間が 300 秒を超えていると BM は実行できません。BM は現在リアルタイムプロセスですが、メモリにはロックされません。このメッセージは bm プロセスがスワップアウトされ再度起動されることがなかった場合に出力されます。
対処
truss(1) や strace(1) 等のシステムツールを使用して、BM とディテクタが稼動しているかを確認してください。ハートビートの中断期間がタイムアウト時間の 300 秒を大きく超える場合は、システムスワップが必要であるかメインメモリが不足している可能性があります。
内容
<command> の使用法が誤っています。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
ログの記録に使用するファイル <command> ログのオープンに失敗しました。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
hvdisp、hvswitch、hvutil などのさまざまな RMS コマンドは、ディレクトリ directory のロックファイルをシグナル処理のために使用します。これらのファイルは、これらのコマンドの終了後に削除されます。ロックディレクトリのファイルは、RMS の起動時にも削除されます。これらのファイルが何らかの理由で削除されないと、このメッセージが出力されます。RMS は終了コード 99 で終了します。
対処
ロックディレクトリ <directory> が存在するかどうか確認し、存在する場合は削除してください。
内容
汎用ディテクタ <command> は、ベースモニタの情報を取得することができませんでした。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
汎用ディテクタ <command> は、仮想メモリページを物理メモリにロックできませんでした。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
このメッセージは、エラーコード <errno>、<explanation> が原因でファイル <dumpfile> のオープンに失敗したときに表示されます。
対処
<explanation> に従って問題を修正してください。
内容
このメッセージは、エラーコード <errno>、<explanation> が原因でファイル <dumpfile> のクローズに失敗したときに表示されます。
対処
<explanation> に従って問題を修正してください。
内容
内部エラーです。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
ファイル名 filename のファイルをコピーしようとしたときに別のコピーが処理中である場合にこのメッセージが出力されます。
対処
同じファイルのコピーを同時に複数作成しないように注意してください。
内容
クラスタノード間のファイル転送中に問題が発生しました。
対処
errno に基づいて適切な措置をとってください。
内容
コントローラスクリプトが不適切または無効です。
対処
コントローラスクリプトをチェックしてください。
内容
<script> に PreCheckScript が設定されている場合、排他設定が行われている複数のクラスタアプリケーションを同一ノード上で起動しようとしている可能性があります。
作成したスクリプトが誤っている可能性があります。
対処
<script> が PreOnlineScript、かつ、<resource> に SControllerOf_ScalableCtr_* が出力されている場合、スケーラブル運用のアプリケーションに制御されているStandby状態のクラスタアプリケーションが起動できない状態です。
クラスタを構成する一部のノードを起動した状態で本メッセージが出力された場合は、Standby状態のクラスタアプリケーションを起動するか、すべてのノードのRMSを起動してください。
すべてのノードでRMSを起動した直後に RMSの停止操作を実施し、本メッセージが出力された場合、RMS が停止していれば対処は不要です。
複数のクラスタアプリケーションの間で排他設定が行われており、かつ、優先度が同じか、より高いクラスタアプリケーションがすでに運用中である場合、排他関係にある他のクラスタアプリケーションの起動処理は抑止され、本メッセージが出力されます。複数のクラスタアプリケーションの間で排他設定を行っている場合は対処不要です。
errorreason を確認し、作成したスクリプトを見直してください。
上記対処によってこのエラーを解決できない場合は、このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。
調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
以下のいずれかの理由でクラスタノードを停止できない場合に、このメッセージが出力されます。
スクリプトが 0 以外の状態で終了した
補足したシグナルのため、スクリプトが終了した
その他の不明な失敗
対処
ノードの状態を確認し、スクリプトに対して必要な修正措置をとり、可能な場合は、ノードの状態を手動で修正し、必要に応じて適切な hvutil -{o, u} を発行してください。
内容
script が実行できない場合に、errorreason とともに出力されるメッセージです。
対処
errorreason に基づいて適切な措置をとってください。
内容
動的変更の後、現在の RMS 構成定義ファイルが変更されたことが、sdtool によってシャットダウン機構に通知されます。sdtool が異常終了した場合は、BM を終了する必要があります。
対処
sdtool およびシャットダウン機構が正常に動作しているかを確認してください。
Red Hat Enterprise Linux 5 (for Intel64) xenカーネル環境の場合は対処する必要はありません。
内容
オブジェクト object がローカルノードと onlinenode の両方で Online 状態になっている場合にこのメッセージが出力されます。
オブジェクト object で共用ディスクの制御を行っている場合、データ破壊が発生するおそれがあります。
対処
オブジェクト object をクラスタ内の 1 ノードでのみ Online 状態にしてください。
内容
ノードがクラスタを離脱しているのに、内部優先順位リストから該当のエントリを削除できません。プログラムスタックおよびメモリ管理内部の問題です。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
切替要求の処理中にノードが動作しなくなりました。クラスタアプリケーションを制御するノードが途中まで進んでいた切替え処理を続けようとしましたが、他のノードが同意しません。これはクラスタの重大な不整合が起こっていることを意味しますが、本来発生すべきでないエラーです。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
停止中のノード <hostname> が、新規ノードにとって不明なロックをかけている場合に、このメッセージが出力されます。
対処
クラスタがクリーンアップするのを待ってください。
内容
アプリケーションがビジーであるために hvshut 要求が中止されました。
対処
アプリケーションがビジーな場合は RMS をシャットダウンしないようにしてください。アプリケーションが処理を終了してから RMS をシャットダウンしてください。
内容
動的変更の実行中であるために hvshut 要求が中止されました。
対処
動的変更の実行中は RMS を停止しないでください。RMS を停止するには、動的変更が終了するまでお待ちください。
内容
アプリケーションが Inconsistent 状態です。Inconsistent 状態がクリアされていないと、アプリケーションの切替えができないため、切替え要求は取り消されます。
対処
Inconsistent 状態をクリアしてください。
内容
クラスタノードが停止した場合、停止を要求したノードは稼動中のノードに成功メッセージを送信する必要があります。成功メッセージの送信が失敗すると、switchlog にこのメッセージが出力されます。
対処
クラスタおよびネットワークがメッセージを送信できる状態になっていることを確認してください。
内容
RMS がシャットダウン機構(SF)に停止要求を送信して、強制停止の応答を受け取らないと、このメッセージが出力されます。
対処
CF の状態が LEFTCLUSTER 状態の場合、LEFTCLUSTER 状態を回復してください。LEFTCLUSTER 状態については、"PRIMECLUSTER Cluster Foundation 導入運用手引書" を参照してください。
CF の状態が LEFTCLUSTER 状態でない場合、SysNode の状態を確認してください。
SysNode が Wait 状態の場合は、Wait 状態をクリアしてください。Wait 状態のクリアについては、"PRIMECLUSTER RMS 導入運用手引書" を参照してください。
内容
このノードのチェックサムがクラスタ内のノードのチェックサムと異なる場合に、このメッセージが出力されます(これは考えられる理由の 1つ)。
対処
すべてのクラスタノードで RMS 構成定義ファイルをチェックし、すべてのノードで同じ RMS 構成定義ファイルが稼動していることを確認してください。
内容
あるノードが Offline で他のノードが Online のクラスタで、異なる RMS 構成定義ファイルが稼動しているときに、このメッセージが出力されます。
対処
1つのクラスタ内で同じ構成を実行するか、異なるクラスタに共通のホストが存在しないようにしてください。
内容
uname() システムコールで 0 以外の値が戻ると、このメッセージが出力されます。
対処
SysNode 名が有効なことを確認し、必要に応じて RMS を再起動してください。
内容
RMS の命名規則 sysnodename_ = `uname -n`RMS では、RMS コマンドで SysNode を指定する必要があるときに、後ろの RMS が付く CF 名と付かない cf-name を使用できます。この規則では、ある SysNode の名前が xxxRMS で、別の SysNode の名前が xxx の場合、command xxx がxxxRMS および xxx の両方を指すという曖昧さが発生します。
対処
RMS 命名規則に従った名前を使用してください。
内容
リモートノード <hostname> とローカルノードで異なる RMS 構成定義ファイルが稼動している場合、またはこれらのノードに異なる RMS パッケージがインストールされている場合に、このメッセージが出力されます。
対処
すべてのノードで同じ RMS 構成定義ファイルが稼動していること、およびその RMS 構成定義ファイルがすべてのノードに配布されていることを確認してください。すべてのノードに同じRMS パッケージ(同じリリース)がインストールされていることを確認してください。
内容
このノードのチェックサムがクラスタ内のノードのチェックサムと異なる場合に、このメッセージが出力されます(これは考えられる理由の 1つ)。
対処
すべてのクラスタノードで RMS 構成定義ファイルをチェックし、すべてのノードで同じ RMS 構成定義ファイルが稼動していることを確認してください。
内容
このノードのチェックサムがクラスタ内のノードのチェックサムと異なる場合に、このメッセージが出力されます(これは考えられる理由の 1つ)。
対処
すべてのクラスタノードで RMS 構成定義ファイルをチェックし、すべてのノードで同じ RMS 構成定義ファイルが稼動していることを確認してください。
内容
hvshut -a コマンドがタイムアウトしました。いずれかのノードで RMS が異常終了し、クラスタアプリケーションに含まれるリソースの一部が停止に失敗した可能性があります。
対処
RMS が正常終了したノード以外の全ノードの OS をシャットダウンするか、ノードを強制停止してください。
hvshut コマンドをタイムアウトさせないようにするためには、使用している環境にあわせてRMS グローバル環境変数 RELIANT_SHUT_MIN_WAIT を大きい値に変更してください。
参照
RELIANT_SHUT_MIN_WAIT の詳細については、以下のマニュアルの“RMS グローバル環境変数”の“RELIANT_SHUT_MIN_WAIT”を参照してください。
PRIMECLUSTER 4.3A30 以降 :“PRIMECLUSTER RMS 導入運用手引書”
PRIMECLUSTER 4.3A20 以前 :“PRIMECLUSTER 活用ガイド<クラスタ構築・運用時の留意点>”
RMS 環境変数の参照/変更方法については、“PRIMECLUSTER RMS 導入運用手引書”を参照してください。
内容
システムエラー。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
'hvutil' コマンド(hvutil -o または -u)を発行したときに、クラスタノード <nodename> が Wait 状態でないと、このメッセージが出力されます。
対処
ノードが Wait 状態のときだけ hvutil -{o, u} を再発行するか、このコマンドを発行しないようにしてください。
内容
コマンド (hvutil -o SysNode) を発行して SysNode の Wait 状態をクリアしても、SysNode が Wait 状態の場合に、このメッセージが出力されます。この原因は、クラスタノード <hostname> に対する最後のディテクタレポートが Online でないことです。つまり、SysNode の状態が Online からではなく他の状態から Wait 状態に変化した可能性があります。
対処
ノードが Online 状態から Wait 状態になったときだけ、hvutil -o を発行してください。
内容
新しいノードが Online になると、クラスタ内の他のノードは新しいノードが -C オプションで起動されているかどうかを確認します。Online になったノードは NET_SEND_Q キューにより必要な情報を他のノードに送信します。ノードが NET_SEND_Q キューにアクセスできない場合にこのメッセージが出力されます。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
新しいノードが Online になると、クラスタ内の他のノードは新しいノードが -C オプションで起動されているかどうかを確認します。Online になったノードは NET_SEND_Q キューにより必要な情報を他のノードに送信します。ノードが他のノードに必要な情報を送信できない場合にこのメッセージが出力されます。
対処
ネットワークに問題がないかどうかを確認してください。
内容
値 attr が、有効なネットワークアドレスへの名前解決に失敗しました。
対処
attr に有効なインタフェースが指定されているかを確認してください。
内容
ローカルノードの RMS は cfsh、rsh、および ssh のいずれを使用してもリモートノード <SysNode> の RMS を起動することができませんでした。
対処
cfsh を使用できるようにしてください。rsh/sshは未サポートです。
また、このメッセージは、複数のノードで hvcm -a コマンドを実行した場合に出力されることがあります。その場合は、hvcm -a コマンドをクラスタを構成する任意の1ノードだけで実行してください。
内容
アプリケーション <userapplication> を Online にする要求が発行されたにもかかわらず、ノード<sysnode> が異なる RMS 構成定義ファイルを稼動している場合に、このメッセージが出力されます。
対処
同じ RMS 構成定義ファイルで稼動していることを確認してください。
内容
このメッセージは、優先順位リスト list に無効なエントリがある場合に出力されます。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
重大な内部エラーが発生しました。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
重大な内部エラーが発生しました。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
PriorityList が空または壊れている場合に、このメッセージが出力されます。重大な内部エラーが発生しました。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
内部リストにあるはずのコントラクトが存在しない場合にこのメッセージが出力されます。クラスタの状態が不整合である可能性があります。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
1つのアプリケーション <sysnode> だけが Online で、サポートされていないコントラクトを処理する必要がある場合に、このメッセージが出力されます。重大な内部エラーが発生しました。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
アプリケーション <userApplication> のコントラクトに対するロックを持たないローカルノードがコントラクトを処理すると、このメッセージが出力されます。重大な内部エラーが発生しました。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
LOCK コントラクトをネットワーク上で送信できない場合に、このメッセージが出力されます。
対処
ネットワークがダウンしている可能性があります。
ネットワークに問題がないかを確認してください。
内容
UNLOCK コントラクトをネットワーク上で送信できない場合に、このメッセージが出力されます。
対処
ネットワークがダウンしている可能性があります。
ネットワークに問題がないかを確認してください。
内容
ローカルノードが UNLOCK コントラクトを受信したが、コントラクトでコミットされたフォローアップ処理を実行できない場合に、このメッセージが出力されます。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
ネットワークまたはメモリの問題などが原因で、ノードが受信した UNLOCK コントラクトを伝播できない場合に、このメッセージが出力されます。
対処
このメッセージが出力されるときは、問題の原因を示す追加の ERROR メッセージも必ず出力されます。適切な ERROR メッセージを参照してください。
内容
ローカルコントラクトオブジェクトがコントラクトを完了して、ローカルノードに送信したにもかかわらず、ローカルオブジェクトがそのコントラクトを見つけられない場合に、このメッセージが出力されます。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
リモートノード上のクラスタアプリケーションが DeAct 状態であるにもかかわらず、ローカルクラスタアプリケーションが DeAct 状態ではありません。発生すべきでないエラーです。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
ローカルノードは、特定の処理に関する制限解除のコントラクトを受信したときに停止状態のノードがあることがわかると、優先順位リストを更新してその情報を反映させます。このとき更新処理が失敗すると、このメッセージが出力されます。プログラムスタックおよびメモリ管理内部の問題です。重大な内部エラーです。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
アプリケーションがコントラクトのデータ部分を読取ることができない場合に、このメッセージが出力されます。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
アプリケーションがコントラクト要求の種類をコードで判別できないため、コントラクトの制限を解除できない場合に、このメッセージが出力されます。重大な内部エラーが発生しました。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
userApplication オブジェクトが未解決コントラクトのリスト内でタスクを検出したにもかかわらず、このメッセージが出力されます。発生すべきでないエラーです。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
アプリケーションの状態が Offline または Standby で、一部のリソースが Online または Faulted の場合に、このメッセージが出力されます。
対処
適切なコマンド(通常は hvutil -c)で、この不整合を解決してください。
内容
ファイルオープンエラー。
対処
環境変数 RELIANT_PATH を確認してください。
内容
status_info ファイルに不適切なエントリがある場合に、このメッセージが出力されます。
status_info ファイルを手動で編集しない限り、発生すべきでないエラーです。
対処
status info ファイルに手動で編集した不適切なエントリがないか確認してください。不適切なエントリがない場合は、このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
重大な内部エラーが発生しました。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
重大な内部エラーが発生しました。
対処
調査情報を採取し、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
重大な内部エラーが発生しました。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
エラーコード <errornumber> の<errortext> で説明された理由により、RMS は、ファイル <filename> のファイルディスクリプタフラグ <flags> に対する fcntl() システムコールを実行できません。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
あるクラスタノードが他のクラスタノード hostname にアクセスできない場合、つまり、このクラスタノードが他のノード hostname を障害ノードとして認識すると、このメッセージが出力されます。原因として、他のノード hostname がダウンしているか、クラスタインタコネクトの問題が考えられます。
対処
ノード hostname が本当に停止しているかどうかを確認してください。停止していない場合は、ネットワークに問題がないかどうか確認してください。
内容
ローカルノード上のディテクタは、ノード hostname の状態が Online から Offline に変化したことを検出すると、このメッセージを switchlog に書き込み、ノード hostname を停止しようとします。
対処
ノード hostname の syslog を調べて、ノードが停止した理由を確認してください。
内容
ディテクタから予期しない Faulted 状態が通知されたときにこのメッセージが出力されます。
対処
リソースに障害が発生した原因を調査し、適切な対処を実行してください。
内容
リソースのディテクタスクリプトが ScriptTimeout を超過しました。
対処
リソースが故障していないか確認してください。リソースが故障している場合は、適切な対処を実行してください。
リソースが故障していない場合は、リソースの ScriptTimeout 属性に指定された値が、Online/Offline スクリプトの実行時間よりも長くなるように属性値を変更してください。
内容
ノード hostname を停止するシャットダウン機構がまだ終了していません。オペレータの介入が必要です。スクリプトが自動的に終了するか、Unix 'kill' コマンドでスクリプトを終了するまで、このメッセージが定期的(ノードの ScriptTimeout 値と同じ間隔で)に出力されます。スクリプトを kill コマンドで終了すると、ノードが停止しないとみなされます。
対処
スクリプトが終了するのを待ちます。スクリプトが自動的に終了しない場合は、'kill' コマンドでスクリプトを終了してください。
内容
コントローラは、制御されるアプリケーションに対し要求を伝播する際に、制御されるアプリケーションが要求を処理するのに十分な時間待機します。この時間内に要求が完了しなかった場合、コントローラは Fault 状態になります。
対処
コントローラや制御されるアプリケーションのスクリプトを修正するか、制御されるアプリケーションのリソースを修正してください。ユーザ定義のコントローラスクリプトについては、ScriptTimeout 値を増やしてください。
内容
動的変更の後、現在の RMS 構成定義ファイルが変更されたことが、sdtool によってシャットダウン機構に通知されます。この通知が、ローカル SysNode の ScriptTimeout 値で指定した時間内に完了しなかった場合は、BM を終了する必要があります。
対処
sdtool およびシャットダウン機構が正常に動作しているかを確認してください。必要に応じてScriptTimeout の値を大きくしてください。
内容
スクリプトをタイムシェアリングプロセスに設定することができませんでした。
対処
理由に基づいて適切な措置をとってください。
内容
重大な内部エラーが発生しました。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
このメッセージは次の場合に出力されます。
RMS が command コマンドでディテクタプロセスを実行できないので、ディテクタを起動できない場合。
hvcm -a がすでに呼び出されていて、各クラスタノード上で RMS BM を command コマンドで起動できない場合。
RMS が command コマンドでスクリプトプロセスを実行できないので、スクリプトを開始できない場合。
RMS はこのメッセージが表示されたノードで停止し、エラー番号 errno を返します。エラー番号はオペレーティングシステムにより返される値です。
対処
本マニュアルの "付録B Solaris/Linux ERRNO テーブル" を参照し、エラー番号 errno から問題の原因がわかるかどうかを確認してください。原因がわからない場合は、当社技術員(SE)に連絡してください。
内容
このメッセージは次の場合に出力されます。
RMS が command コマンドを実行するためのディテクタプロセスを作成できないので、ディテクタを起動できない場合。
hvcm -a がすでに呼び出されていて、command コマンドで各クラスタノード上の RMS BM を起動できない場合。
RMS が command コマンドでスクリプトプロセスを作成できないので、スクリプトを開始できない場合。
RMS はこのメッセージが表示されたノードで停止し、エラー番号 errno を返します。エラー番号はオペレーティングシステムにより返される値です。
対処
本マニュアルの "付録B Solaris/Linux ERRNO テーブル" を参照し、エラー番号 errno から問題の原因がわかるかどうかを確認してください。原因がわからない場合は、当社技術員(SE)に連絡してください。
内容
シグナル signal に関連するシグナルハンドラが登録されていません。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
重大な内部エラーが発生しました。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
重大な内部エラーが発生しました。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
重大な内部エラーが発生しました。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
このメッセージは、RMS が通信用のデータグラムエンドポイントを作成できない場合に出力されます。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
このエラーは、RMS が通信用のエンドポイントをバインドできない場合に発生します。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
RMSの処理で内部異常が発生しました。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
RMS の BM を起動すると、クラスタ内のすべてのノードに対する内部データ構造にスロットが作成されます。hvdet_node の起動時に、RMS は SysNode オブジェクトを送信します。これらの SysNode は、内部データ構造内で別々のスロットに挿入されます。SysNode 名を挿入するスロット (16) の数が足りないと、このメッセージが出力されます。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
SysNode として指定したノード名 hostname のエントリが /etc/hosts にないと、このメッセージが switchlog に出力されます。
対処
ノード名 hostname を /etc/hosts 内のエントリに正しく記述してください。
内容
クラスタインタフェース (64) 用のスロットが不足すると、このメッセージがノード名 hostnameとともに出力されます。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
重大な内部エラーが発生しました。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
重大な内部エラーが発生しました。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
プロセスID<pid> の子プロセス<cmd> が reason の理由で停止できませんでした。
対処
理由 reason に基づいて適切な措置をとってください。
内容
killChild ルーチンは、KILL_CHILD または DONTKILL_CHILD のいずれかのフラグを受け付けます。これ以外のオプションが指定されると、このメッセージが表示されます。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
プロセスID<pid> の子プロセス<cmd> のタイムアウト時間が経過しました。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
ローカルノード上の RMS がローカルノードで認識できないアドレスを持つノードからのメッセージを受信しました。
対処
RMS 構成定義ファイルの誤りをチェックして、ローカルノードがリモートノードのアドレスを認識できるようにしてください。
内容
ローカルノード上の RMS がローカルノードで認識できないアドレスを持つノード host からのメッセージを受信しました。
対処
RMS 構成定義ファイルの誤りをチェックして、ローカルノードがリモートノード host のアドレスを認識できるようにしてください。
内容
ローカルノードが、IP アドレス receivedip を持つノードからのメッセージを受信しましたが、このアドレスがローカルで計算したこのノードの IP アドレスと異なっています。
対処
RMS 構成定義ファイルの誤りがないか、/etc/hosts を確認してください。
内容
ローカルノードが、IP アドレス receivedip を持つノード host からのメッセージを受信しましたが、このアドレスがローカルで計算したこのノードの IP アドレスと異なっています。 このメッセージは、受信メッセージの数が 500 未満の場合は、switchlog に 25 ごとに表示されます。 そうでない場合、このメッセージは、250 ごとに表示されます。
対処
RMS 構成定義ファイルの誤りがないか、/etc/hosts を確認してください。
内容
メッセージキューの作成で、OS の状態に異常が発生しました。
対処
スワップ領域およびパラメータ msgmax、msgmnb、msgmni、msgtql の値など、メッセージキューのメモリ割当てに影響を与える OS の状態を確認してください。 メッセージキューの最大数が割り当て済みでないかを確認します。
内容
ノード上の時刻がローカルノードの時刻と同期していません。
対処
ノードの時刻とローカルノードの時刻を同期させます。
また、NTP サーバとネットワーク接続されているか、NTP の設定が正しく行われているかを確認してください。
内容
クラスタノード上の時刻がローカルノードの時刻と大きく(25 秒超)異なっています。
対処
時刻を同期させてください。
また、NTP サーバとネットワーク接続されているか、NTP の設定が正しく行われているかを確認してください。
内容
func の実行がエラーコード errorcode で失敗しました。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
ELMハートビート断が発生しました。
対処
通常、ELMハートビート断によりノードが強制停止されるため、対処は不要です。
内容
RMSの処理で内部異常が発生しました。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
RMSの処理で内部異常が発生しました。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
内容
<SysNode> に対し、IPv4 アドレスとIPv6 アドレスの両方がホストネームデータベースファイル(/etc/hosts, /etc/inet/ipnodes) に記述されています。
対処
<SysNode> に対するIP アドレスの記述が、IPv4 またはIPv6 のいずれか1 つのみとなるように、ホストネームデータベースファイルを修正してください。