Symfoware/RDBの起動で異常が発生した場合の運用手順を説明します。
Symfoware/RDB起動時にRLPの障害が発生してRLPが閉塞した場合に、RLPの復旧を行わずに、利用者業務を開始する方法について示します。
ポイント
データベースの二重化が行われている状態で利用者業務を開始する場合には、Symfoware/RDBを停止してから、障害が発生したロググループのDCUを再構築してください。
Symfoware/RDB起動時にRLPの障害が発生した場合でも、Symfoware/RDBは正常に起動します。
正系ノードでの業務を早急に開始したい場合
一部のロググループのRLPのみ障害が発生した場合でも、Symfoware/RDBを停止せず、データベースの二重化を中止して、早急に利用者業務を開始する場合の手順について示します。
注意
本手順では、すべてのロググループについてデータベースの二重化を中止します。そのため、できるだけ早く、利用者業務が停止可能な時間にDCUの再構築を行ってください。
ポイント
本手順では、データベースサーバ1を正系ノードとして利用者業務を開始する場合を記載しています。
データベースサーバ1またはデータベースサーバ2のいずれかで障害が発生した場合の手順は同じです。
異常メッセージを確認します。
データベースサーバの起動において、RLPの障害を検出した場合に、以下に示すメッセージが出力されているかを確認します。
DBミラーリングサービスの運用中断の警告メッセージを確認します。
qdg20762w:RLPが閉塞したため DBミラーリングサービスによるデータベースの二重化を中断しました RLP名='RLP名'
RLP閉塞メッセージを確認します。
qdg20122e:RLPを閉塞しました RLP名='RLP名'
イベントログから、媒体障害などを通知するメッセージを確認します。
DBミラーリングサービスを緊急停止します。
dxsvstopコマンドのtermオプションおよびcオプションにより、DBミラーリングサービスを緊急停止することで、本ノードを正系ノードとして使用することが可能です。
> dxsvstop -term -c
媒体障害などを通知するメッセージから障害の原因を調査し、リカバリします。
すべてのDCUを再構築します。
異常メッセージを確認します。
データベースサーバの起動において、RLPの障害を検出した場合に、以下に示すメッセージが出力されているかを確認します。
DBミラーリングサービスの運用中断の警告メッセージを確認します。
qdg20762w:RLPが閉塞したため DBミラーリングサービスによるデータベースの二重化を中断しました RLP名='RLP名'
RLP閉塞メッセージを確認します。
qdg20122e:RLPを閉塞しました RLP名='RLP名'
イベントログから、媒体障害などを通知するメッセージを確認します。
DBミラーリングサービスを緊急停止します。
dxsvstopコマンドのtermオプションにより、DBミラーリングサービスを緊急停止します。
> dxsvstop -term
媒体障害などを通知するメッセージから障害の原因を調査し、リカバリします。
すべてのDCUを再構築します。
利用者業務を開始します。
データベースサーバ1およびデータベースサーバ2のDBミラーリングサービスの緊急停止が完了してから、利用者業務を開始します。
利用者業務を停止します。
夜間などの利用者業務停止が可能な時間帯に行います。
参照
RLPを配置しているストレージシステムの異常原因を調査する際、GDSなどのボリューム管理ソフトウェアを使用している場合は、当該製品のマニュアルを参照してください。
監視プロセスの起動については、“Connection Manager ユーザーズガイド”を参照してください。
アプリケーション接続環境の開設プロシジャについては“RDB運用ガイド”を参照してください。
BC管理DBのメモリ常駐については“8.1.3 BC管理DBのメモリ常駐”を参照してください。
DCUの再構築の詳細については“11.9 DCUの再構築”を参照してください。
障害が発生したロググループのみデータベースの二重化を中止して業務を開始する場合
一部のロググループのRLPのみ障害が発生した場合、障害が発生したロググループのみデータベースの二重化を中止して、利用者業務を開始する場合の手順について示します。本手順では、いったんSymfoware/RDBを停止して、障害が発生したロググループのDCUのみを削除してから、Symfoware/RDBの再起動後に、利用者業務を開始します。
注意
障害が発生したロググループについてはデータベースの二重化が停止しているため、ノード切替えが発生した場合には、新たな正系ノードで同じロググループ名のデータベースの内容が保証できなくなります。そのため、できるだけ早く、障害が発生したロググループのDCUを再構築してください。
ポイント
データベースサーバ1またはデータベースサーバ2のいずれかで障害が発生した場合の手順は同じです。
異常メッセージを確認します。
データベースサーバの起動において、RLPの障害を検出した場合に、以下に示すメッセージが出力されているかを確認します。
DBミラーリングサービスの運用中断の警告メッセージを確認します。
qdg20762w:RLPが閉塞したため DBミラーリングサービスによるデータベースの二重化を中断しました RLP名='RLP名'
RLP閉塞メッセージを確認します。
qdg20122e:RLPを閉塞しました RLP名='RLP名'
イベントログから、媒体障害などを通知するメッセージを確認します。
障害が発生したロググループのDCUを削除します。
手順1.で確認したRLPが作成されているロググループについてDCUを削除します。
障害が発生したロググループのDCUの削除については“ロググループ単位のDCUの再構築”のRLP管理オブジェクトの削除(手順4)からREURNログ抽出ファイルおよびRERUNログ引き継ぎファイルの削除(手順10)までを行ってください。
モニタデーモンのサービスをWindowsサービスに登録します。
このとき、モニタデーモンの自動起動の設定は解除されます。自動起動が必要な場合は、Windowsサービスの設定を変更してください。
> dxservice -r
DBミラーリングシステムを起動します。
正系ノードのDBミラーリングシステムを起動します。
DBミラーリングシステムを停止します。
通常停止によるDBミラーリングサービスの停止を行って、DBミラーリングシステムを停止します。
モニタデーモンのサービスをWindowsサービスから削除します。
> dxservice -d
媒体障害などを通知するメッセージから障害の原因を調査し、リカバリします。
障害が発生したロググループのDCUを再構築します。
障害が発生したロググループのDCUの再構築については、手順3.でDCUの削除まで実施しているため、“ロググループ単位のDCUの再構築”のRLP定義ファイルの修正(手順11)から行ってください。
異常メッセージを確認します。
データベースサーバの起動において、RLPの障害を検出した場合に、以下に示すメッセージが出力されているかを確認します。
DBミラーリングサービスの運用中断の警告メッセージを確認します。
qdg20762w:RLPが閉塞したため DBミラーリングサービスによるデータベースの二重化を中断しました RLP名='RLP名'
RLP閉塞メッセージを確認します。
qdg20122e:RLPを閉塞しました RLP名='RLP名'
イベントログから、媒体障害などを通知するメッセージを確認します。
障害が発生したロググループのDCUを削除します。
データベースサーバ1での手順3.について、副系ノードとしての手順を実施します。
モニタデーモンのサービスをWindowsサービスに登録します。
このとき、モニタデーモンの自動起動の設定は解除されます。自動起動が必要な場合は、Windowsサービスの設定を変更してください。
> dxservice -r
DBミラーリングシステムを起動します。
副系ノードのDBミラーリングシステムを起動します。
データベースサーバ1での手順5. について、副系ノードとしての手順を実施します。
DBミラーリングシステムを停止します。
データベースサーバ1での手順6. について、副系ノードとしての手順を実施します。
モニタデーモンのサービスをWindowsサービスから削除します。
> dxservice -d
媒体障害などを通知するメッセージから障害の原因を調査し、リカバリします。
障害が発生したロググループのDCUを再構築します。
データベースサーバ1での手順9. について、副系ノードとしての手順を実施します。
利用者業務を開始します。
データベースサーバ1およびデータベースサーバ2のDBミラーリングサービスの緊急停止が完了してから、利用者業務を開始します。
利用者業務を停止します。
夜間などの利用者業務停止が可能な時間帯に行います。
参照
RLPを配置しているストレージシステムの異常原因を調査する際、GDSなどのボリューム管理ソフトウェアを使用している場合は、当該製品のマニュアルを参照してください。
DBミラーリングシステムの起動手順については“8.1 DBミラーリングシステムの起動”を参照してください。
DBミラーリングシステムの停止手順については“8.2 DBミラーリングシステムの停止”を参照してください。
DCUの再構築の詳細については“11.9 DCUの再構築”を参照してください。
BCログ管理ファイルに入出力障害が発生した場合のリカバリ操作の手順を示します。
操作の手順
両ノード共通の操作
RDBREPORTから、BCログ管理ファイルの異常を通知する以下のいずれかのメッセージを確認します。
qdg20162u:BCログ管理ファイルが閉塞されています
qdg20165u:BCログ管理ファイルの入出力障害を検出しました
qdg20166u:BCログ管理ファイルに異常があります
rdbbcdcuコマンドのVオプションおよび、bオプションを実行してDCUの運用情報を表示し、DCUを構成するすべてのRLPが表示されないことを確認します。
> rdbbcdcu -V -b
Symfoware/RDBを停止します。
障害ボリュームを交換します。
rdbbclogコマンドのMオプションおよび、rオプションを実行して、BCログ管理ファイルを再作成します 。
> rdbbclog -M -r
rdbbcrlpコマンドのAオプションおよび、pオプション、Sオプションを実行して、すべてのロググループごとに、BC ログ管理ファイルに DCUを構成する2つのRLP を再登録します 。
> rdbbcrlp -A -p 主系RLP名 -S 送信用RLMのファイル名 > rdbbcrlp -A -p 従系RLP名 -S 送信用RLMのファイル名
rdbbcdcuコマンドのVオプションおよび、bオプションを実行してDCUの運用情報を表示し、すべてのロググループごとに、DCUを構成する2つのRLPが正常に登録されたことを確認します。
> rdbbcdcu -V -b LogGroup : system RLCbuffNum : - RLCbuffSize : - RLCnum : 3 RLCsize : 10240K RLPid RLPname Kind OnMode OnStat RLPstat InhCause ConStat DisConCause LogRemain 1 rlp001 origin capture online normal - disconnection own-stop - 2 rlp002 duplicate init standby normal - disconnection own-stop -
Symfoware/RDBを起動します。
DCUを再構築します。
BCログ管理ファイルの異常が発生したノードが正系または昇格正系であり、かつ、以下のいずれかに該当する場合は、DCUの再構築が必要です。
利用者業務を開始した場合
Symfoware/RDB起動時に以下のメッセージが出力された場合
qdg02604i:ダウンリカバリ処理を開始します
ポイント
BCログ管理ファイルをリカバリした後に、すべてのロググループごとに、DCUを構成する2つのRLPをBCログ管理ファイルに再登録する必要があります。
本手順は、副系ノードで異常が発生した場合も同じです。ただし、DCUの再構築は不要です。
ノードの状態は、dxinfコマンドのsオプションを実行して確認します。
参照
Symfoware/RDBの起動、および停止については“セットアップガイド”を参照してください。
DCUの再構築の詳細については“11.9 DCUの再構築”を参照してください。
データの暗号化を利用している場合で、以下のファイルに異常が発生したときは、ファイルをリカバリしてからデータベースサーバを起動してください。
証明書ファイル、サーバ秘密鍵ファイルの異常
証明書ファイルの期限切れ
マスタ暗号化キーファイルの異常
業務を早急に開始したい場合は、ファイルのアクセスが可能なノードで、正系ノードのDBミラーリングサービスを開始してください。その後、ファイルをリカバリして、副系ノードのDBミラーリングサービスを開始してください。
参照
暗号化のファイルのリカバリについては“RDB運用ガイド” を参照してください。