DBミラーリングシステムの運用では、Symfoware Serverが出力するメッセージを監視し、ディスク障害などのSymfoware Serverのデータベース資源に異常が発生した場合に、ノードの切替えを行うことが可能です。
また、DBミラーリング動作環境ファイルのDB_INH_OBSERVEパラメタを設定することで、異常発生時にDBミラーリングシステムで自動的にノードを切替えることも可能です。
通常はSymfoware Serverのメッセージを調査し、業務への影響調査や適切なリカバリを実施した後で、DBミラーリングシステムの機能を利用して、手動でノードの切替えを行う運用を推奨します。
なお、自動切替えを利用する場合は、以下の説明が業務上問題のないことを確認してください。
データベース資源の監視方法として自動切替えを選択した場合、異常を検知すると即座にノードの切替えを行います。このため、業務継続可能な状態でも切替えを行う可能性があります。また、ログファイル破壊などの場合に、適切なリカバリを実施後にノードの切替えを行った方が業務への影響を少なくできる場合があります。以下に詳細を説明します。
表やインデックスなどに障害が発生した場合、業務として重要でない、一部の障害で、全体の業務の切替えを行う可能性があります。このため、業務への影響を判断してから切替えを行うことを推奨します。
テンポラリログファイルなどのログファイルに異常が発生した場合、異常が発生したとき即時に切替えを行うより、Symfoware Serverの正常停止を試行するなどの適切な処置を行った後にノードを切替えた方が業務への影響を少なくすることが可能になります。
なお、自動ノード切替えを行うと、DCUの再構築が必要となります。
データベース資源の監視による自動切替えを選択した場合でも、監査ログに関する以下の資源については監視対象となりません。
監査ログデータベース
監査ログ用ロググループのログ管理ファイル
監査ログ用ロググループのテンポラリログファイル
データベースの資源とDBミラーリングシステムの資源を同一ストレージ上に配置したシステムにおいて、ストレージの電源断などでストレージが使用できなくなった場合、データベースの資源の監視よりもDBミラーリングシステムの資源の監視が先に異常を検知すると、自動ノード切替えが行われません。
この場合、RLP閉塞をディレイさせ、自動ノード切替えを行えるようにします。DBミラーリング動作環境ファイルにおいてRLP_INH_DELAY=ON、およびDB_INH_OBSERVEパラメタにDB監視資源定義ファイルの指定を行ってください。DB監視資源定義ファイルには、すべてのSymfoware Serverの資源の監視をするように指定してください。
RLP_INH_DELAY=ONを指定した場合、DB監視資源定義ファイルに指定した資源に異常が発生してから約30秒間、アプリケーションへの応答が待ちとなります。
なお、RLP閉塞のディレイを指定し、ストレージが使用できなくなった場合に自動ノード切替えが行われると、昇格正系になったノードではRLP閉塞となります。RLP閉塞になると、DCUの再構築が必要です。
ポイント
Symfoware Serverはメッセージによる監視を推奨しており、一般的にメッセージ監視運用は、Systemwalkerなどと連携して実現します。このため、データベースを配置しているディスク障害の監視は、メッセージ監視運用として実施することを推奨します。
Symfoware Serverにおいて、監査ログデータベースの異常により監査ログの取得ができないときにSymfoware Serverを強制停止する運用を行っている場合、Symfoware Serverのダウン監視を行うことでSymfoware Serverが強制停止するとノードが自動的に切替わります。これにより、切替えた先のノードで業務継続と監査ログの取得が可能となります。
V10.x以前のバージョンレベルと互換性のある監査ログに関する資源の異常監視を行う場合には、DB監視資源定義ファイルにMONITOR_AUDITLOG=YESを設定してください。
参照
監査ログデータベースの異常については、“セキュリティ運用ガイド”を参照してください。
運用設計の方針
下表にメッセージ監視で異常を検知した場合の運用方法案を説明します。運用設計の参考にしてください。
データベース資源 | 運用案 | 補足 |
---|---|---|
ロググループ管理ファイル ログ管理ファイル | メモリ上で当面は、業務継続可能なため、業務に影響が少ない時間帯などでノードの切替えを実施する(切替えたノードで業務を継続)。その後、障害が発生したロググループ管理ファイルまたはログ管理ファイルのリカバリを実施する。 | |
テンポラリログファイル | 業務への影響を少なくするため、Symfoware Serverの正常停止を試みてから、ノードの切替えを実施する(切替えたノードで業務を継続)。その後、障害が発生したテンポラリログファイルのリカバリを実施する。 | |
RDBディクショナリ RDBディレクトリファイル | ノードの切替えを実施する(切替えたノードで業務を継続)。その後、障害が発生したRDBディクショナリまたはRDBディレクトリファイルのリカバリを実施する。 | |
DSI(表またはインデックス) | 異常となったデータベース資源を調査し、業務への影響を判断(閉塞範囲、閉塞対象資源の重要度)してから、ノードの切替えを実施する。その後、障害が発生したDSI(表またはインデックス)のリカバリを実施する。 | 例えば異常となった資源を利用している業務より優先度の高い業務が正常動作している場合、優先度の高い業務の完了を待ってからノードの切替えを行う。 |
ポイント
アーカイブログファイルが閉塞した場合は、利用者業務は継続可能です。また、データベーススペースの閉塞は、メディアリカバリ作業で発生します。このため、これらの資源は通常はノード切替え対象とせず、異常が発生したノードでリカバリしてください(DBミラーリング動作環境ファイルでの監視設定はできません)。もし、これらの資源が閉塞したときにノードの切替えを行う場合は、通常のデータベース運用で実施しているメッセージ監視を元に、dxswitchコマンドで切替えを行ってください。
参照
リカバリ方法の詳細は“RDB運用ガイド”を参照してください。
切替え方法の詳細は“8.4 ノード切替え”を参照してください。
資源の異常発生時の監視方法の設定の詳細は“D.1 DBミラーリング動作環境ファイルの編集”を参照してください。
参考
モニタデーモンは、DBミラーリング動作環境ファイルに指定されたデータベース資源の監視を行い、異常が発生した場合に自動的にノードを切替えることが可能です。
モニタデーモンは、設定されたデータベース資源を3秒ごとにチェックします。設定された監視方法(HER:ディスク障害原因の閉塞など)を検出すると、データベースの異常が発生したと判断し、ノードの切替えを行います。
参照
監視データベース資源の指定方法については“D.1.1 監視データベース資源の指定”を参照してください。