PRIMECLUSTER 活用ガイド <メッセージ集> (Solaris(TM)オペレーティングシステム/Linux版)
目次 索引 前ページ次ページ

第6章 RMS に関するメッセージ> 6.1 RMSメッセージ

6.1.10 DET: ディテクタ


 

(DET, 1) FAULT REASON: Resource <resource> transitioned to a Faulted state due to a child fault.

[内容]

このメッセージは、依存するリソース(RMS グラフで下位にあるリソース)に発生した障害が理由で、<resource> に示されるリソースに障害が発生したとき表示されます。

[対処]

子リソースに障害が発生した原因を調べ、必要な修正を行ってください。


 

(DET, 2) FAULT REASON: Resource <resource> transitioned to a Faulted state due to a detector report.

[内容]

ディテクタから予期しない Faulted 状態が通知されたときにこのメッセージが出力されます。

[対処]

リソースに障害が発生した原因を調査し、適切な対処を実行してください。


 

(DET, 3) FAULT REASON: Resource <resource> transitioned to a Faulted state due to a script failure.

[内容]

このメッセージは、ディテクタがリソースのスクリプトの実行に失敗したときに表示されます。

[対処]

スクリプトに誤りがないか確認し、さらにリソースにも問題がないか確認してください。


 

(DET, 4) FAULT REASON: Resource <resource> transitioned to a Faulted state due to a FaultScript failure.This is a double fault.

[内容]

リソースに障害が発生したため FaultScript を実行しましたが、<resource> に示されるリソースの FaultScript の実行に失敗しました。

[対処]

FaultScript を実行するきっかけとなった故障リソースに対し、故障原因を調査してください。また、FaultScript の実行に失敗した <resource> に示されるリソースに対し、FaultScript の実行が失敗したことによるシステムへの影響を調査してください。リソースに障害が発生した原因、および、FaultScript の実行に失敗したことによるシステムへの影響が判明しない場合は、調査用の情報を採取し、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。


 

(DET, 5) FAULT REASON: Resource <resource> transitioned to a Faulted state due to the resource failing to come Offline after running its OfflineScript (offlineScript).

[内容]

Offline スクリプトを実行すると、リソースは Offline になります。ScriptTimeout 属性に指定された時間(秒)内に状態が変更されない場合、または Offline 以外の状態に変更された場合、リソースは Faulted の状態であると判断されます。

[対処]

Offline スクリプトを実行後にリソースが Offline 状態に変更されることを確認してください。


 

(DET, 6) FAULT REASON: Resource <resource> transitioned to a Faulted state due to the resource failing to come Online after running its OnlineScript (onlinescript).

[内容]

Online スクリプトを実行すると、リソースは Online になります。ScriptTimeout 属性に指定された時間(秒)内に状態が変更されない場合、または Online 以外の状態に変更された場合、リソースは Faulted の状態であると判断されます。

[対処]

Online スクリプトを実行後にリソースが Online 状態に変更されることを確認してください。


 

(DET, 7) FAULT REASON: Resource <resource> transitioned to a Faulted state due to the resource unexpectedly becoming Offline.

[内容]

このメッセージはリソースが不意に Offline になったときに表示されます。ディテクタが BM への応答を停止すると、リソースに障害が発生したと判断されます。

[対処]

<resource> に示されるリソースが不意に Offline 状態になった原因を調査してください。リソースが不意に Offline 状態になった原因が判明しない場合は、調査用の情報を採取し、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。


 

(DET, 8) Failed to create DET_REP_Q

[内容]

RMS がディテクタと RMS 自身の通信に使用する UNIX メッセージキュー DET_REP_Q を作成できない場合に、このメッセージが出力されて、RMS が終了コード 12 で終了します。

[対処]

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。


 

(DET, 9) Message send failed in detector request Q: queue

[内容]

hvlogclean の実行中に、ディテクタ要求キュー queue を使用して BM からディテクタに情報を送信します。この通信で問題が発生すると、このメッセージが出力されて、RMS が終了コード 12 で終了します。

[対処]

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。


 

(DET, 11) DETECTOR STARTUP FAILED: Corrupted command line <commandline>.

[内容]

このメッセージは、コマンド行に何も指定されていない場合、または無効な値が指定されている場合に表示されます。

[対処]

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。


 

(DET, 12) DETECTOR STARTUP FAILED <detector>.REASON: errorreason.

[内容]

ディテクタ detector errorreason が理由で起動しない場合、このメッセージが出力されます。理由 errorreason は次のいずれかです。

[対処]

エラーの原因に応じて適切な対処を行ってください。


 

(DET, 13) Failed to execute script <script>.

[内容]

ディテクタスクリプトが不良であるか、フォーマットが誤っています。

[対処]

ディテクタ起動スクリプトをチェックしてください。


 

(DET, 16) Cannot create gdet queue of kind gkind

[内容]

各汎用ディテクタは、BM との通信に使用するメッセージキューを持っています。ディテクタ用にkind という種類のキューを作成するときに問題が発生すると、このメッセージが出力されて、RMS が終了コード 12 で終了します。

[対処]

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。


 

(DET, 18) Error reading hvgdstartup file. Error message: errorreason.

[内容]

RMS がディテクタと RMS 自身の通信に使用する UNIX メッセージキュー DET_REP_Q を作成できない場合に、このメッセージが出力されて、RMS が終了コード 12 で終了します。このファイルを読取るときにエラーが発生すると、上記のメッセージがエラーの理由 errorreason とともに出力されます。RMS は終了コード 26 で終了します。

[対処]

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。


 

(DET, 24) FAULT REASON: Resource <resource> transitioned to a Faulted state due to the resource failing to come Standby after running its OnlineScript (onlinescript).

[内容]

スタンバイ要求中に Online スクリプトを実行すると、リソースは Standby になります。

ScriptTimeout 属性に指定された時間(秒)内に状態が変更されない場合、または Standby か Online 以外の状態に変更された場合、リソースは Faulted の状態であると判断されます。

[対処]

スタンバイ要求中に Online スクリプトを実行後、リソースが Standby または Online 状態に変更されることを確認してください。


 

(DET, 25) <resource>: received unexpected detector report "DetReportsOffline" - ignoring it Reason: Standby processing in progress, detector report may result from an interim transition state.

[内容]

Offline 状態から Standby 状態への状態遷移中であったため、クラスタ(RMS)は、状態遷移中の一時的な Offline 状態が通知されたものと判断して、本 Offline 状態の通知を無視した(フェイルオーバのトリガにしなかった)ことを示しています。

[対処]

情報のメッセージのため、対処不要です。


 

(DET, 26) FAULT REASON: Resource <resource> transitioned to a Faulted state due to the resource failing to come Online.

[内容]

このメッセージは、リソースを Faulted 状態にする可能性のある Online スクリプトを実行した後、リソースが Online になれなかった場合に表示されます。

[対処]

リソース resource が Online 状態になれなかった原因を調べてください。


 

(DET, 28) <object>: CalculateState() was invoked for a non-local object! This must never happen. Check for possible configuration errors!

[内容]

状態エンジンの中で要求を処理しているときに、要求トークンまたは応答トークンがオブジェクトに配信されましたが、そのオブジェクトがローカルノードに定義されていません。重大な内部エラーです。

[対処]

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。


 

(DET, 33) DETECTOR STARTUP FAILED: Restart count exceeded.

[内容]

ディテクタに異常があり所定回数以上、ディテクタを再起動しました。ディテクタの異常が考えられます。

[対処]

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。


 

(DET, 34) No heartbeat has been received from the detector with pid <pid>, <startupcommand>, during the last <seconds> seconds. The base monitor will send the process a SIGALRM to interrupt the detector if it is currently stalled waiting for the alarm.

[内容]

RMS ディテクタが停止しないようにするため、各ディテクタは BM に対し定期的にハートビートメッセージを送信します。ハートビートが一定期間途絶えると、switchlog に本メッセージが出力されます。BM は失速したプロセスにアラームシグナルを送信して、ディテクタがメインループを適切に処理します。メッセージには、BM がディテクタのハートビートを前回受信してからの経過時間が記載されています。この時間が 300 秒を超えていると BM は実行できません。BM は現在リアルタイムプロセスですが、メモリにはロックされません。このメッセージは bm プロセスがスワップアウトされ再度起動されることがなかった場合に出力されます。

[対処]

truss(1) や strace(1) 等のシステムツールを使用して、BM とディタクタが稼動しているかを確認してください。ハートビートの中断期間がタイムアウト時間の 300 秒を大きく超える場合は、システムスワップが必要であるかメインメモリが不足している可能性があります。


目次 索引 前ページ次ページ

All Rights Reserved, Copyright(C) 富士通株式会社 2009