PRIMECLUSTER 導入運用手引書 4.1 (Solaris(TM) オペレーティングシステム版) |
目次 索引 |
付録D メッセージ |
エラーメッセージが出力された場合、/var/adm/messages ファイルからメッセージが出力された時間帯のログ解析を行い、それ以前に他のエラーメッセージが出力されているかを確認してください。もし出力されている場合は、対処方法に従って、まずそちらの対処を行う必要があります。
対処法
メッセージ番号に対応するメッセージのテキスト本文がありません。本メッセージを控え、当社技術員(SE) に連絡してください。
内容
プログラムに内部異常が発生しました。function, code1, code2, code3, code4は調査のための情報を示します。
対処法
本メッセージを控え、調査情報を採取し、当社技術員(SE) に連絡してください。調査情報の収集の詳細については、"トラブルシューティング"を参照してください。
対処法
以下のいずれかが考えられます。
このメッセージを記録してから、問題調査に必要な情報を収集します。調査情報の収集の詳細については、"トラブルシューティング"を参照してください。
システム全体で必要となるメモリ資源の見積りを見直してください。クラスタ制御が必要とするメモリ容量については、各製品に添付されている"PRIMECLUSTER インストールガイド" を参照してください。
上記で解決しない場合は、"CF 構成の場合" を参照して、カーネルパラメタの設定が正しいことを確認してください。設定に誤りがあった場合は、設定変更後、システムを再起動します。
上記対処によってこのエラーを解決できない場合は、当社技術員(SE) に連絡してください。
code1、code2 は、エラー調査に必要な情報を示します。
対処法
以下のいずれかが考えられます。
このメッセージを記録してから、問題調査に必要な情報を収集します。調査情報の収集の詳細については、"トラブルシューティング"を参照してください。
PRIMECLUSTER の動作に必要なディスクの空き容量があることを確認し、不要なファイルを削除して領域を確保し、システムを再起動します。PRIMECLUSTER の動作に必要なディスク容量は、各製品に添付されている"PRIMECLUSTER インストールガイド" を参照してください。
上記で解決しない場合は、"CF 構成の場合"のカーネルパラメータ・ワークシートを参照して、カーネルパラメタの設定が正しいことを確認してください。設定に誤りがあった場合は、設定変更後、システムを再起動します。
上記対処によってこのエラーを解決できない場合は、当社技術員(SE) に連絡してください。
code1、code2 は、エラー調査に必要な情報を示します。
対処法
オプションを正しく指定し、再度実行してください。
optionはオプションを示します。
対処法
システム管理者権限で、プロセスを再度実行してください。
内容
option に示された必須オプションを指定してください。
対処法
オプションを正しく指定し、再度実行してください。
内容
option に示された必須オプションのいずれかを指定してください。
対処法
オプションを正しく指定し、再度実行してください。
内容
オプションoption1 指定時はオプションoption2 は必須です。
対処法
オプションを正しく指定し、再度実行してください。
内容
コマンドに指定された2 つのオプションが矛盾しています。
対処法
どちらか一方のオプションを指定してコマンドを再実行してください。
内容
オプションoption1 のいずれかの指定時はオプションoption2 は指定できません。
対処法
オプションを正しく指定し、再度実行してください。
対処法
このメッセージをコピーしてデバッグ情報を収集し、当社技術員 (SE) に連絡してください。デバッグ情報の収集については、"トラブルシューティング" を参照してください。
target はコマンド名を示します。
内容
指定されたリソースは存在しません。code1, code2 は調査のための情報を示します。
対処法
リソースを正しく指定し、再度実行してください。
対処法
このメッセージを表示しているノードを再起動してリソースデータベースを再びアクティブにしてください。メッセージが再び表示される場合は、このメッセージをコピーしてデバッグ情報を収集し、当社技術員 (SE) に連絡してください。デバッグ情報の収集については、"トラブルシューティング" を参照してください。
code1 、code2 は当社技術員 (SE) に必要な情報を示します。
対処法
このメッセージをコピーしてデバッグ情報を収集し、当社技術員 (SE) に連絡してください。デバッグ情報の収集については、"トラブルシューティング" を参照してください。
code1 、code2 は当社技術員 (SE) に必要な情報を示します。
対処法
状態遷移プロシジャファイルを正しく指定し、再度実行してください。
本対処で解決できない場合は、調査用の情報を収集します。それから当社技術員(SE)に連絡してください。調査情報の収集の詳細については、"トラブルシューティング"を参照してください。
対処法
状態遷移プロシジャファイルを上書きする場合は、-oオプションを指定し、再度実行してください。
対処法
リソースクラスを正しく指定し、再度実行してください。指定できるリソースクラスは、/etc/opt/FJSVcluster/classes配下のファイル名です。
リソースクラスとして指定した文字列に誤りがないか確認してください。
対処法
状態遷移プロシジャの取出し先のディスク資源またはファイルシステムのノード資源が不足している可能性があります。df(1M)等で資源を確認し、資源が不足している場合には、資源不足を解消させた後、再度実行するか、状態遷移プロシジャの取出し先を変更してください。
クラスタシステムをインストールしたディスク資源またはファイルシステムのノード資源が不足している可能性があります。df(1M)等で資源を確認し、資源が不足している場合は、資源不足を解消させた後、再度実行してください。
本対処で解決できない場合は、調査用の情報を収集します。それから当社技術員(SE)に連絡してください。調査情報の収集の詳細については、"トラブルシューティング"を参照してください。
code1 は調査のための情報、code2 はエラー番号を示します。
対処法
削除できる状態遷移プロシジャファイルは、利用者が定義した状態遷移プロシジャファイルのみです。
利用者が定義していない状態遷移プロシジャファイルの削除方法は、該当する状態遷移プロシジャファイルの提供元に確認してください。
対処法
クラスタアプリケーションに登録されているプロシジャリソースが、リソースデータベースに存在しません。userApplication Configuration Wizard(GUI)およびhvw(1M)でプロシジャリソースを選択する手順でクラスタアプリケーションを登録した場合、本メッセージが出力されることはありません。userApplication Configuration Wizard(GUI)およびhvw(1M)でプロシジャリソースを選択する手順でクラスタアプリケーションを登録したにも関わらず、本メッセージが出力された場合は、このメッセージを記録して、調査用の情報を収集します。その後、当社技術員(SE)に連絡してください。調査情報の収集の詳細については、"トラブルシューティング"を参照してください。
hvw(1M)でFREECHOICEによりプロシジャリソースをクラスタアプリケーションに登録した場合は、メッセージ本文に表示されたプロシジャリソースがリソースデータベースに登録されていないことをclgettree(1)コマンドで確認してください。clgettree(1)コマンドの詳細については、clgettree(1M)のマニュアルページを参照してください。
リソースデータベースに登録されていない場合は、リソースデータベースにメッセージ本文に表示されたプロシジャリソースを登録してください。プロシジャリソースの登録方法は、"PRIMECLUSTER対応製品編"内の対象製品の章を参照し、製品に応じた設定方法に従ってください。
リソースデータベースに登録されている場合は、このメッセージを記録して、調査用の情報を収集します。その後、当社技術員(SE)に連絡してください。調査情報の収集の詳細については、"トラブルシューティング"を参照してください。
Resourceはリソースデータベースに登録されていないリソース名、ridはリソースデータベースに登録されていないリソースのリソースIDを示します。
内容
このメッセージはブラウザを起動しているクライアントシステムには表示されません。このメッセージは、CLI コマンド ( clreply ) でオペレータ介入メッセージに応答したときに標準出力に表示されます。入力にyes またはno 以外の文字列を指定した場合にこのメッセージが表示されます。
対処法
オプションを正しく指定して、再実行してください。
内容
オプションoption は絶対パスで指定してください。
対処法
オプションを正しく指定し、再度実行してください。
内容
指定されたリソースは監視されていません。code は調査のための情報を示します。
対処法
対処は不要です。
内容
指定されたプロセスは存在しません。pid は指定されたプロセスのプロセスID を示します。
対処法
プロセスID を正しく指定し、再度実行してください。
内容
指定されたコマンドは存在しません。command は指定されたコマンドを示します。
対処法
コマンドをフルパスで指定し、再度実行してください。
内容
プロセスの終了待ち合わせ時間内にプロセスが終了しませんでした。
code1, code2 は調査のための情報を示します。
対処法
本コマンドで指定したプロセスが、プロセスの終了待ち合わせ時間内に終了しない原因を調査してください。調査については、そのプロセスの作成者に連絡してください。
対処法
存在するディレクトリを指定し、再度実行してください。
対処法
パトロール診断対象に登録されていないuserApplication または資源が指定されました。
"パトロール診断の設定" を参照し、パトロール診断の構成を見直してください。
resource には、指定されたuserApplication または資源が出力されます。
対処法
以下の状態のuserApplication を指定し、再度実行してください。
Standby 、Offline 、Faulted 、Deact
status には、userApplication の状態が出力されます。
対処法
パトロール診断を行うノードの電源が入っていることを確認してください。パトロール診断を行うノードの電源が入っていない場合は、ノードの電源を投入し、再度実行してください。
RMS が起動していることを確認してください。
RMS が起動されていない場合は、Cluster Admin またはhvcm (1M) コマンドで、RMS を起した後、再度実行してください。
対処法
故障を修正して、RMS 起動後に表示されるオペレータ介入メッセージに応答を行うか、RMSメインウィンドウまたはhvdisp(1M) コマンドで、修正したリソースが登録されているuserApplication の状態を確認してください。userApplication がFault 状態の場合は、RMS メインウィンドウまたはhvutil(1M) コマンドの-c オプションで、Fault のクリア操作を行ってください。
SysNode はリソース障害が発生したSysNode の名前を示します。userApplication は障害が発生したリソースが属するuserApplication の名前を示します。resource は障害が発生したリソースの名前を示します。
対処法
ノード起動後に表示されるオペレータ介入メッセージに応答を行うか、RMS メインウィンドウまたはhvdisp(1M) コマンドで、故障が発生したノードのuserApplication の状態を確認してください。userApplication がFault 状態の場合は、RMS メインウィンドウまたはhvutil(1M) コマンドの-c オプションで、Fault のクリア操作を行ってください。
SysNode は故障の発生したSysNode を示します。
RMS コマンド ( hvdisp ) で故障リソースの履歴機能またはオペレーション介入機能を実行して失敗すると、エラーメッセージが表示されます。このエラーメッセージを調査し、適切な修正を行ってから要求を再試行してください。
対処法
メッセージの内容および必要な対処法を確認して、再実行してください。
内容
RMS コマンドが異常終了したため、メッセージのオペレータ介入機能が失敗しました。
対処法
このエラーメッセージを調査し、適切な修正を行ってから要求を再試行してください。
number は処理に失敗したオペレータ介入メッセージを示します。action はオペレータからのメッセージに対する最初の応答状態をyes またはno で示します。command は異常終了したRMSコマンドを示します。Error message from RMS command はRMS コマンドが標準エラーに送信するエラーメッセージを示します。
対処法
このメッセージは以下の状況で生成されます。
number はオペレータ介入メッセージの件数を示します。
内容
SysNode で示されるノードが停止したため、オペレータ介入メッセージへの応答が失敗しました。
対処法
ノードを再起動してRMS が動作しているかどうかを確認してください。
SysNode は停止しているノードのSysNode の名前を示します。number は応答に失敗したオペレータ介入メッセージの番号を示します。action はオペレータの応答をyes またはno で示します。
内容
clmonproc コマンドがプロセス監視機能に対して監視開始、監視停止などの要求をすることに失敗しました。
対処法
プロセス監視機能のデーモンプロセスが動作していない可能性があります。ps コマンドにより、prmd プロセスが存在するか確認してください。prmdプロセスが存在しない場合、/etc/init.d/clprmd start を実行し、復旧してください。prmd プロセスが存在している場合は、/etc/init.d/clprmd stopと/etc/init.d/clprmd start を順に実行し、復旧してください。
内容
clmonproc コマンドに-g オプションを指定して監視するプロセスは、「子孫プロセスを生成後直ぐに終了するもの」という条件を満たす必要があります。しかし、プロセスが起動されてから特定時間( デフォルト10 秒) を過ぎても親プロセスが終了しませんでした。このようなプロセスを監視しつづけるとシステムへの負荷が高くなってしまうため、プロセス監視機能の監視対象から除外しました。
appliは、監視対象プロセスの絶対パス名を示します。
対処法
以下のいずれかの見直しを行ってください。
内容
clmonproc コマンドの-a オプションで指定した、コマンドが実行できませんでした。
appliは、起動に失敗したプロセスの絶対パス名を示します。errorは、詳細コードを示します。
対処法
clmonproc コマンドの-a オプションで指定したコマンドが実行可能かどうか確認してください。また、コマンド単体で実行させてエラーが発生していないかどうか確認してください。コマンドが実行可能である場合でも、再びこのメッセージが出力されるときは当社技術員(SE) に連絡してください。
詳細コードとして、errno を出力しているので当社技術員(SE) は、このメッセージの情報から原因を調査してください。たとえば、errno が13(EACCES)の場合、clmonproc コマンドの-a オプションに指定したコマンドパスに実行権がないことが主な原因だと考えられます。
内容
ディスク装置の電源が投入されていないか、配線が接続されていない可能性があります。このままuserApplication を起動すると、正常にuserApplication が起動できない可能性があります。
配線の接続状態により、本メッセージと6836 番のメッセージの2 つが表示されることがあります。
対処法
共用ディスク装置の電源が投入されていること、共用ディスク装置の接続が誤っていないことを確認してください。共用ディスク装置の電源が投入されていない場合は、ノードを停止して、共用ディスク装置の電源を投入し、ノードを起動してください。共用ディスク装置の接続が誤っている場合は、ノードを停止して、正しく接続を行い、ノードを起動してください。
NodeID はディスク装置が接続されていたノードのノード識別番号、disk は検出できなかった共用ディスク装置を示します。
対処法
以下の原因が考えられます。
終了コード0 :状態遷移処理が正常と判断します
終了コード0以外 :状態遷移処理が異常と判断します
このメッセージを記録して、調査用の情報を収集します。調査情報の収集の詳細については、"トラブルシューティング"を参照してください。
以下の対処を行ってください。
#!/bin/sh
状態遷移プロシジャの取出しはclgetproc(1M)コマンド、状態遷移プロシジャの登録はclsetproc(1M)コマンドで行います。各コマンドの詳細については、マニュアルページを参照してください。
上記本対処法で解決できない場合は、当社技術員(SE)に連絡してください。
procedureは異常となった状態遷移プロシジャを示します。procedureに示される状態遷移プロシジャを作成した場合は、以降の情報を参考にし、状態遷移プロシジャを修正してください。
code1、code2、code3、code4、code5、code6 は異常となった状態遷移指示を示します。code7 は調査のための情報を示します。
code1: 第1引数(状態遷移指示種別)
code2: 第2引数(クラスタサービスインスタンス種別)
code3: 第3引数(状態遷移指示タイミング)
code4: 第4引数(リソースID)
code5: 第5引数(状態遷移事象種別)
code6: 第6引数(状態遷移事象詳細)
errorはエラー原因を示します。エラー原因には、以下があります。
・procedure file exit error
内容
共用ディスク装置の配線が誤っている可能性があります。このままuserApplication を起動すると、正常にuserApplication が起動できない可能性があります。
配線の接続状態により、本メッセージと6807 番のメッセージの2 つが表示されることがあります。
対処法
共用ディスク装置の接続が誤っていないことを確認してください。接続が誤っている場合は、ノードを停止して、接続を正しく行い、ノードを起動してください。
NodeID は共用ディスク装置が接続されているノード識別番号、disk は異常を検出した共用ディスク装置を示します。
対処法
"パトロール診断で異常を検出した場合の対処方法" を参照し、対処してください。
altname は故障と診断されたLAN デバイスのインタフェース名が出力されます。node 、rid 、code は調査のための情報を示します。
対処法
このメッセージを記録して、調査用の情報を収集してください。その後当社技術員 (SE) に連絡してください。調査情報の収集の詳細については、"トラブルシューティング" を参照してください。
altname は故障と診断されたLAN デバイス名が出力されます。node 、rid 、code は調査のための情報を示します。
対処法
"パトロール診断で異常を検出した場合の対処方法" を参照し、対処してください。
altname は故障と診断されたデバイス名が出力されます。node 、rid 、code は調査のための情報を示します。
対処法
このメッセージを記録して、調査用の情報を収集してください。その後当社技術員 (SE) に連絡してください。調査情報の収集の詳細については、"トラブルシューティング" を参照してください。
altname は故障と診断された共用装置名が出力されます。node 、rid 、code は調査のための情報を示します。
対処法
パトロール診断を行うハードウェアに、存在するハードウェアを指定してください。指定方法は、"パトロール診断の設定" を参照してください。
altname は見つからなかったデバイス名が出力されます。node 、rid 、code は調査のための情報を示します。
対処法
パトロール診断を行うハードウェアに、存在するハードウェアを指定してください。指定方法は、"パトロール診断の設定" を参照してください。
altname は見つからなかったLAN デバイスのインタフェース名が出力されます。node 、rid 、code は調査のための情報を示します。
対処法
LAN デバイスの活性化時のフラグが、UP ではない、BROADCAST ではないなどの使用するのに不適当な状態になっています。システム構成を確認の上、正しく活性化してください。LANデバイスの活性化時のフラグはifconfig (1M) コマンドで確認してください。確認する点は以下の5 つです。
altname は不適当な状態になっているネットワークデバイス名が出力されます。node 、rid 、codeは調査のための情報を示します。
対処法
数分時間を空けて再度実行してください。
typeは調査のための情報を示します。
対処法
当社技術員(CE)に連絡して、SCFが正常に動作しているかを確認してください。
errnoはエラー番号を示します。
対処法
当社技術員(CE)に連絡して、SCFが正常に動作しているかを確認してください。
errnoはエラー番号を示します。
対処法
サブクラスが不明な回線切替装置が接続されています。
0x01: 4回線切替装置
0x02: 16回線切替装置
サポート対象の回線切替装置かを確認してください。
対処法
RCIアドレス(addr)で指定された回線切替装置が存在しません。
当社技術員(CE)に連絡して、指定した回線切替装置のRCIアドレスに誤りがないか、または、正しく接続されているかを確認してください。
addrはRCIアドレスを示します。
対処法
指定した回線切替装置の電源が入っているか、RCIケーブルが外れていないかを確認してください。
addrは回線切替装置のRCIアドレスを示します。
対処法
RCIアドレス(addr)で指定された回線切替装置のmaskで指定された切替ユニットのリザーブ処理をno回繰り返しても失敗しました。
回線切替装置が故障していないか、RCI接続に誤りがないか、装置の電源電圧に異常がないかを確認してください。多発する場合は当社技術員(CE)に連絡してください。
addrは回線切替装置のRCIアドレス、maskは回線切替装置の切替ユニットを示すマスク、noはエラーを表示するまでのリトライ回数を示します。
保守情報(システム管理者向け)
指示された回線切替装置に異常がないか検査する。
対処法
回線切替装置の切替制御ボードで異常が検出されました。
addr: 異常が検出された回線切替装置のRCIアドレス
status: エラー種別ごとの回線切替装置の内部ステイタス
type: エラー種別
status: 回線切替装置のステイタス0の値(以下を参照)を示します。
切替え処理中以外であるのに、QSCの切替えラインがアサートされたままの状態(異常)であることを示します。
切替え処理中において、QSCの切替えラインがアサートできないことを示します。いったん、異常状態になると電源が未供給になるまでその状態は保たれます。
status: 回線切替装置のステイタス0の値(以下を参照)を示します。
QSC切替え機能イネーブル状態を示します。当BitがONの場合は、接続されている全てのQSCが異常であることを示します。
QSCに実装されたDC-DCコンバータの出力電圧が正常であることを示します。当BitがONの場合は、DC-DCコンバータの出力電圧が異常であることを示します。
備考) 当Bitは、4回線切替装置のみ有効です。
電源が1台の場合は0、電源が2台の場合は1を示します。
備考) 当Bitは、16回線切替装置のみ有効です。
電源の正常/異常を示します。(正常とは、故障もなく電力が供給されていることを示します。)
備考) 当Bitは、16回線切替装置のみ有効です。
status: 回線切替装置のステイタス1の値(以下を参照)を示します。
16回線切替装置かどうかを示します。
QSC(切替制御ボード)がどちらのスロットに実装されているかを示します。0x10、0x20以外の値の場合は異常です。
二重化されたQSCにおいて、もう一方のQSCが切替え処理(リザーブ解除、切替えコマンド0、切替えコマンド1)を実行中であることを示します。
回線切替装置が故障していないか、RCI接続に誤りがないか、装置の電源電圧に異常がないかを確認してください。多発する場合は当社技術員(CE)に連絡してください。
保守情報(システム管理者向け)
指示された回線切替装置に異常がないか検査する。
対処法
回線切替装置の切替ユニットで異常が検出されました。
addr: 異常が検出された回線切替装置のRCIアドレス
mask: 制御対象のLSUマスク
status: エラー種別ごとの回線切替装置の内部ステイタス(調査用)
type: エラー種別
status: 切替装置内の各LSUの異常状態をLSUマスクの値で示します。
0: 該当LSUは、正常であることを示します。
1: 該当LSUは、異常であることを示します。
status: 切替装置内の各LSUの接続(実装)状態をLSUマスクの値で示します。
0: 該当LSUは、未接続状態であることを示します。
1: 該当LSUは、接続状態であることを示します。
LSUマスクの値
LSU15 LSU14 LSU13 LSU12 ・・・ LSU03 LSU02 LSU01 LSU00
0x8000 0x4000 0x2000 0x1000 ・・・ 0x0008 0x0004 0x0002 0x0001
回線切替装置が故障していないか、RCI接続に誤りがないか、装置の電源電圧に異常がないかを確認してください。多発する場合は当社技術員(CE)に連絡してください。
保守情報(システム管理者向け)
指示された回線切替装置に異常がないか検査する。
対処法
本メッセージを控え、調査情報を採取し、当社技術員(SE)に連絡してください。調査情報の採取方法については、"トラブルシューティング"を参照してください。
全てのノードで調査情報を採取した後、異常が発生したノードを再起動してください。ノードの停止手段については、shutdown(1M)コマンドを使用してください。
code1、code2は調査のための情報を示します。
対処法
本メッセージを控え、調査情報を採取し、当社技術員(SE)に連絡してください。調査情報の採取方法については、"トラブルシューティング"を参照してください。
全てのノードで調査情報を採取した後、異常が発生したノードを再起動してください。ノードの停止手段については、shutdown(1M)コマンドを使用してください。
code1、code2は調査のための情報を示します。
対処法
本メッセージを控え、調査情報を採取し、当社技術員(SE)に連絡してください。調査情報の採取方法については、"トラブルシューティング" を参照してください。
全てのノードで調査情報を採取した後、異常が発生したノードを再起動してください。ノードの停止手段については、shutdown(1M)コマンドを使用してください。
code1、code2は調査のための情報を示します。
対処法
リソースSWLineに使用する回線切替装置のポート番号の属性情報(port)を設定してください。
ridは回線切替装置のSWLineのリソースIDを示します。
対処法
正しくポート番号を設定してください。
ridは回線切替装置のSWLineのリソースIDを、portはポート番号を示します。
対処法
共用リソースSH_SWLineに使用する切替ユニットのマスク(lsu_mask)の属性情報を設定してください。
ridは回線切替装置の共用リソースSH_SWLineのリソースIDを示します。
対処法
共用リソースSH_SWUの子リソースとして共用リソースSH_SWLineを作成し直してください。
ridは回線切替装置の共用リソースSH_SWLineのリソースIDを示します。
対処法
共用リソースSH_SWUに使用する回線切替装置のRCIアドレスの属性情報(addr)を設定してください。
ridは回線切替装置の共用リソースSH_SWUのリソースIDを示します。
対処法
回線切替装置の指定されたポートに接続するノードのリソースIDに、ノード以外のリソースIDか、存在しないリソースIDが指定されています。
ノードのリソースIDを正しく設定してください。
noは回線切替装置のポート番号、ridは指定されたリソースIDを示します。
対処法
回線切替装置のポート0側と1側に同じノードのリソースIDは指定できません。クラスタサービスの運用と待機に同じノードは設定できません。
ノードのリソースIDを正しく設定してください。
ridは指定されたノードのリソースIDを示します。
対処法
指定されたリソースIDは、すでにGDS等で使用中のため削除できません。
削除するリソースIDを確認し、リソースIDを正しく設定してください。
ridはリソースIDを示します。
対処法
リソースIDを正しく設定してください。
ridはリソースIDを、classは共用リソースクラスのクラス名を示します。
対処法
リソース名を正しく設定してください。
nameはリソース名を、classは共用リソースクラスのクラス名を示します。
目次 索引 |