Symfoware/RDBまたはDBミラーリングシステムの異常発生のメッセージ監視や状態表示を実行することで、ノードの異常発生を検知し、ノード切替えの判断を行うことができます。
Symfoware/RDBやDBミラーリングシステムの異常と、異常検知のために監視対象とするメッセージを示します。
異常の箇所 | 正系ノードで出力されるモニタデーモンのメッセージ | 副系ノードで出力されるモニタデーモンのメッセージ | 異常検知後の主な対処 |
---|---|---|---|
正系ノードのシステムダウン | - | 32031 | ノード切替えを実施して利用者業務を継続 |
正系ノードのSymfoware/RDBのシステムダウン | 32005 | 22024 | ノード切替えを実施して利用者業務を継続 |
正系ノードのSymfoware/RDBの応答待ち時間超過 | 22003 | 22021 | 正系ノードの状態の確認後、ノード切替えを実施して利用者業務を継続 |
正系ノードのロググループ管理ファイルの閉塞 | 22005 | 22023 | ノード切替えを実施して利用者業務を継続 |
正系ノードのログ管理ファイルの閉塞 | 22006 | 22023 | |
正系ノードのテンポラリログファイルの閉塞 | 22007 | 22023 | |
正系ノードのRDBディクショナリの閉塞 | 22008 | 22023 | |
正系ノードのDSIの閉塞 | 22009 | 22023 | |
正系ノードのRDBディレクトリファイルの閉塞 | 22011 | 22023 | |
正系ノードのRLPの異常 | 32021 | 32022 | 利用者業務が停止可能となった時点でDBミラーリングサービスの緊急停止を行い、DCUを再構築 |
副系ノードのRLPの異常 | 32023 | 32021 | ノード切替え不可のため、利用者業務が停止可能となった時点でDBミラーリングサービスの緊急停止を行い、DCUを再構築 |
DBミラーリングサービススクリプトの異常 | 32006 | 32007または32008 | DBミラーリングサービスのリカバリ停止を実施して、異常となる原因を取り除いてからDBミラーリングサービスを再起動 |
注1)Mirroring Controllerを利用している場合で、ノード間通信異常時に自動ノード切替えを行うときは、DBミラーリングシステムにより自動ノード切替えを行います。
注2)Mirroring Controllerを利用している場合で、DBミラーリング動作環境ファイルの設定が以下のときは、DBミラーリングシステムにより自動ノード切替えを行います。
- DB_DOWN_MODEの指定なし、または
- DB_DOWN_MODE=FAILOVER
注3)監視対象とするためには、Mirroring Controllerの利用および、DBミラーリング動作環境ファイルでDB_TIMEOUTの指定が必要です。
注4)監視対象とするためには、Mirroring Controllerの利用および、DBミラーリング動作環境ファイルでDB_INH_OBSERVEの指定が必要です。
注5)監査ログの以下の資源に異常が発生した場合は、モニタデーモンのメッセージを出力しません。
- 監査ログデータベース
- 監査ログ用ロググループのログ管理ファイル
- 監査ログ用ロググループのテンポラリログファイル
ポイント
正系ノードにおいて、ノード切替えの判断を必要とする異常を検知した場合、副系ノードにもモニタデーモンのメッセージを出力します。
参照
各異常のDBミラーリングシステムによる監視対象の設定方法については “D.1 DBミラーリング動作環境ファイルの編集”を参照してください。
ノード切替えの運用方法については“7.1.1 縮退運用”を参照してください。
ノード間通信異常時の自動ノード切替えについては、 “C.5.1 ノード間通信異常時の自動ノード切替え”を参照してください。