Oracleインスタンスリソース異常によるリソースのAutoRecoverやuserApplicationのフェイルオーバが発生した場合のトラブル事例です。
[ケース1]
アーカイブ REDO ログ領域不足のため、監視用 SQL によるデータ更新処理がハングアップした場合に、リソース異常となる場合があります。
その後 userApplication がフェイルオーバしてもフェイルオーバ先の待機ノードでも共用ディスク上の領域不足により Oracle データベースの起動に失敗するため、最終的に両系停止となり業務が停止する場合があります。
Oracleデータベースのアラート・ログなどを確認し、参考となる情報が記録されていないか確認してください。
アーカイブ REDO ログをバックアップするなどしてディスク容量を確保してください。
[ケース2]
監視タイムアウトが2回連続して発生した場合にリソース異常となります。
syslog に以下のメッセージが出力されていれば該当します。
ERROR: 0226: Watch Timeout occurred
Oracleデータベース側からの調査・対処をしてください。
PRIMECLUSTER Wizard for Oracle による Oracle インスタンスの監視では、Oracleインスタンスから一定時間応答がなかった場合は「監視タイムアウト」と判断します。1回目の監視タイムアウトでは、Warning 状態となるだけでリソース異常にはなりませんが、これが2回連続して発生した場合、リソース異常と判断します。