ページの先頭行へ戻る
Symfoware Server V11.0.0 Mirroring Controller運用ガイド
Symfoware

5.1.1 Symfoware/RDB起動時の異常

Symfoware/RDBの起動で異常が発生した場合の運用手順を説明します。

5.1.1.1 Symfoware/RDB起動時のRLPの障害

Symfoware/RDB起動時にRLPの障害が発生してRLPが閉塞した場合に、RLPの復旧を行わずに、利用者業務を開始する方法について示します。

ポイント

  • データベースの二重化が行われている状態で利用者業務を開始する場合には、Symfoware/RDBを停止してから、障害が発生したロググループのDCUを再構築してください。

  • Symfoware/RDB起動時にRLPの障害が発生した場合でも、Symfoware/RDBは正常に起動します。

正系ノードでの業務を早急に開始したい場合

一部のロググループのRLPのみ障害が発生した場合でも、Symfoware/RDBを停止せず、データベースの二重化を中止して、早急に利用者業務を開始する場合の手順について示します。

注意

本手順では、すべてのロググループについてデータベースの二重化を中止します。そのため、できるだけ早く、利用者業務が停止可能な時間にDCUの再構築を行ってください。

ポイント

  • 本手順では、データベースサーバ1を正系ノードとして利用者業務を開始する場合を記載しています。

  • データベースサーバ1またはデータベースサーバ2のいずれかで障害が発生した場合の手順は同じです。

操作の手順

データベースサーバ1の操作
  1. 異常メッセージを確認します。
    データベースサーバの起動において、RLPの障害を検出した場合に、以下に示すメッセージが出力されているかを確認します。

    • DBミラーリングサービスの運用中断の警告メッセージを確認します。

      rdb: WARNING: qdg20762w:RLPが閉塞したため DBミラーリングサービスによるデータベースの二重化を中断しました RLP名='RLP名'
    • RLP閉塞メッセージを確認します。

      rdb: ERROR: qdg20122e:RLPを閉塞しました RLP名='RLP名'
  2. システムログから、媒体障害などを通知するメッセージを確認します。

  3. 監視プロセスを起動します。

  4. DBミラーリングサービスを緊急停止します。
    dxsvstopコマンドのtermオプションおよびcオプションにより、DBミラーリングサービスを緊急停止することで、本ノードを正系ノードとして使用することが可能です。

    $ dxsvstop -term -c
  5. 媒体障害などを通知するメッセージから障害の原因を調査し、リカバリします。

  6. すべてのDCUを再構築します。


データベースサーバ2の操作
  1. 異常メッセージを確認します。
    データベースサーバの起動において、RLPの障害を検出した場合に、以下に示すメッセージが出力されているかを確認します。

    • DBミラーリングサービスの運用中断の警告メッセージを確認します。

      rdb: WARNING: qdg20762w:RLPが閉塞したため DBミラーリングサービスによるデータベースの二重化を中断しました RLP名='RLP名'
    • RLP閉塞メッセージを確認します。

      rdb: ERROR: qdg20122e:RLPを閉塞しました RLP名='RLP名'
  2. システムログから、媒体障害などを通知するメッセージを確認します。

  3. 監視プロセスを起動します。

  4. DBミラーリングサービスを緊急停止します。
    dxsvstopコマンドのtermオプションにより、DBミラーリングサービスを緊急停止します。

    $ dxsvstop -term
  5. 媒体障害などを通知するメッセージから障害の原因を調査し、リカバリします。

  6. すべてのDCUを再構築します。

アプリケーションサーバの操作
  1. 利用者業務を開始します。
    データベースサーバ1およびデータベースサーバ2のDBミラーリングサービスの緊急停止が完了してから、利用者業務を開始します。

  2. 利用者業務を停止します。
    夜間などの利用者業務停止が可能な時間帯に行います。

参照

  • RLPを配置しているストレージシステムの異常原因を調査する際、GDSなどのボリューム管理ソフトウェアを使用している場合は、当該製品のマニュアルを参照してください。

  • 監視プロセスの起動については“2.1.3 監視プロセスの起動”を参照してください。

  • BC管理DBのメモリ常駐については“2.1.4 BC管理DBのメモリ常駐”を参照してください。

  • DCUの再構築の詳細については“5.9 DCUの再構築”を参照してください。

障害が発生したロググループのみデータベースの二重化を中止して業務を開始する場合

一部のロググループのRLPのみ障害が発生した場合、障害が発生したロググループのみデータベースの二重化を中止して、利用者業務を開始する場合の手順について示します。本手順では、一旦、Symfoware/RDBを停止して、障害が発生したロググループのDCUのみを削除してから、Symfoware/RDBの再起動後に、利用者業務を開始します。

注意

障害が発生したロググループについてはデータベースの二重化が停止しているため、ノード切替えが発生した場合には、新たな正系ノードで同じロググループ名のデータベースの内容が保証できなくなります。そのため、できるだけ早く、障害が発生したロググループのDCUを再構築してください。

ポイント

データベースサーバ1またはデータベースサーバ2のいずれかで障害が発生した場合の手順は同じです。

操作の手順

データベースサーバ1の操作
  1. 異常メッセージを確認します。
    データベースサーバの起動において、RLPの障害を検出した場合に、以下に示すメッセージが出力されているかを確認します。

    • DBミラーリングサービスの運用中断の警告メッセージを確認します。

      rdb: WARNING: qdg20762w:RLPが閉塞したため DBミラーリングサービスによるデータベースの二重化を中断しました RLP名='RLP名'
    • RLP閉塞メッセージを確認します。

      rdb: ERROR: qdg20122e:RLPを閉塞しました RLP名='RLP名'
  2. システムログから、媒体障害などを通知するメッセージを確認します。

  3. 障害が発生したロググループのDCUを削除します。
    手順1.で確認したRLPが作成されているロググループについてDCUを削除します。
    障害が発生したロググループのDCUの削除については“ロググループ単位のDCUの再構築”のRLP管理オブジェクトの削除(手順4)から等価性コピーの終了(手順9)までを行ってください。

  4. DBミラーリングシステムを起動します。
    正系ノードのDBミラーリングシステムを起動します。

  5. DBミラーリングシステムを停止します。
    通常停止モードによるDBミラーリングサービスの停止を行って、DBミラーリングシステムを停止します。

  6. 媒体障害などを通知するメッセージから障害の原因を調査し、リカバリします。

  7. 障害が発生したロググループのDCUを再構築します。
    障害が発生したロググループのDCUの再構築については、手順3.でDCUの削除まで実施しているため、“ロググループ単位のDCUの再構築”のRLP定義ファイルの修正(手順10)から行ってください。

データベースサーバ2の操作
  1. 異常メッセージを確認します。
    データベースサーバの起動において、RLPの障害を検出した場合に、以下に示すメッセージが出力されているかを確認します。

    • DBミラーリングサービスの運用中断の警告メッセージを確認します。

      rdb: WARNING: qdg20762w:RLPが閉塞したため DBミラーリングサービスによるデータベースの二重化を中断しました RLP名='RLP名'
    • RLP閉塞メッセージを確認します。

      rdb: ERROR: qdg20122e:RLPを閉塞しました RLP名='RLP名'
  2. システムログから、媒体障害などを通知するメッセージを確認します。

  3. 障害が発生したロググループのDCUを削除します。
    データベースサーバ1での手順3.について、副系ノードとしての手順を実施します。

  4. DBミラーリングシステムを起動します。
    副系ノードのDBミラーリングシステムを起動します。
    データベースサーバ1での手順4. について、副系ノードとしての手順を実施します。

  5. DBミラーリングシステムを停止します。
    データベースサーバ1での手順5. について、副系ノードとしての手順を実施します。

  6. 媒体障害などを通知するメッセージから障害の原因を調査し、リカバリします。

  7. 障害が発生したロググループのDCUを再構築します。
    データベースサーバ1での手順7. について、副系ノードとしての手順を実施します。

アプリケーションサーバの操作
  1. 利用者業務を開始します。
    データベースサーバ1およびデータベースサーバ2のDBミラーリングサービスの緊急停止が完了してから、利用者業務を開始します。

  2. 利用者業務を停止します。
    夜間などの利用者業務停止が可能な時間帯に行います。

参照

  • RLPを配置しているストレージシステムの異常原因を調査する際、GDSなどのボリューム管理ソフトウェアを使用している場合は、当該製品のマニュアルを参照してください。

  • DBミラーリングシステムの起動手順については“2.1 DBミラーリングシステムの起動”を参照してください。

  • DBミラーリングシステムの停止手順については“2.2 DBミラーリングシステムの停止”を参照してください。

  • DCUの再構築の詳細については“5.9 DCUの再構築”を参照してください。

5.1.1.2 Symfoware/RDB起動時のBCログ管理ファイルの異常

BCログ管理ファイルに入出力障害が発生した場合のリカバリ操作の手順を示します。

操作の手順

両ノード共通の操作

  1. RDBREPORTから、BCログ管理ファイルの異常を通知する以下のいずれかのメッセージを確認します。

    rdb: ERROR: qdg20162u:BCログ管理ファイルが閉塞されています
    rdb: ERROR: qdg20165u:BCログ管理ファイルの入出力障害を検出しました
    rdb: ERROR: qdg20166u:BCログ管理ファイルに異常があります
  2. rdbbcdcuコマンドのVオプションおよび、bオプションを実行してDCUの運用情報を表示し、DCUを構成するすべてのRLPが表示されないことを確認します。

    $ rdbbcdcu -V -b
  3. Symfoware/RDBを停止します。

  4. 障害原因を調査します。BCログ管理ファイルを配置するGDSリソースの非活性が原因の場合は、手順5、10、11を実施してください。
    それ以外の場合は、手順6、7、8、9、10、11を実施してください。

  5. BCログ管理ファイルを配置するGDSリソースを起動します。

  6. 障害ボリュームを交換します。

  7. rdbbclogコマンドのMオプションおよび、rオプションを実行して、BCログ管理ファイルを再作成します 。

    $ rdbbclog -M -r
  8. rdbbcrlpコマンドのAオプションおよび、pオプション、Sオプションを実行して、すべてのロググループごとに、BC ログ管理ファイルに DCUを構成する2つのRLP を再登録します 。

    $ rdbbcrlp -A -p 主系RLP名 -S 自側送信用RLMのローデバイス名
    $ rdbbcrlp -A -p 従系RLP名 -S 自側送信用RLMのローデバイス名
  9. rdbbcdcuコマンドのVオプションおよび、bオプションを実行してDCUの運用情報を表示し、すべてのロググループごとに、DCUを構成する2つのRLPが正常に登録されたことを確認します。

    $ rdbbcdcu -V -b
    
    LogGroup             : system
    RLCbuffNum           : -
    RLCbuffSize          : -
    RLCnum               : 3
    RLCsize              : 10240K
    RLPid  RLPname  Kind       OnMode   OnStat     RLPstat       InhCause   ConStat        DisConCause
        1  rlp001   origin     capture  online     normal        -          disconnection  own-stop
        2  rlp002   duplicate  init     standby    normal        -          disconnection  own-stop
  10. Symfoware/RDBを起動します。

  11. DCUを再構築します。
    BCログ管理ファイルの異常が発生したノードが正系または昇格正系であり、かつ、以下のいずれかに該当する場合は、DCUの再構築が必要です。

    • 利用者業務を開始した場合

    • Symfoware/RDB起動時に以下のメッセージが出力された場合

      rdb: ERROR: qdg02604i:ダウンリカバリ処理を開始します

ポイント

  • BCログ管理ファイルをリカバリした後に、すべてのロググループごとに、DCUを構成する2つのRLPをBCログ管理ファイルに再登録する必要があります。

  • 本手順は、副系ノードで異常が発生した場合も同じです。ただし、DCUの再構築は不要です。

  • ノードの状態は、dxinfコマンドのsオプションを実行して確認します。

参照

  • Symfoware/RDBの起動、および停止については“セットアップガイド”を参照してください。

  • DCUの再構築の詳細については“5.9 DCUの再構築”を参照してください。