Symfoware Server Mirroring Controller 運用ガイド
目次 索引 前ページ次ページ

第5章 異常時の運用> 5.8 正系ノードでのDBミラーリングシステムの異常> 5.8.5 データベースの二重化処理の異常

5.8.5.4 ディスコネクション状態からのリカバリ

DBミラーリングシステムの運用ではRLPを配置しているリモートコピー環境の異常や相手先データベースが停止した場合に、ディスコネクション状態になります。

この場合のリカバリ手順を説明します。

■ディスコネクション状態の確

ディスコネクション状態が発生すると以下のメッセージが出力されます。

rdb: INFO: qdg20154i:ディスコネクション状態になりました RLP名='RLP名' 

■ディスコネクション状態の原因調査と対

DBミラーリングサービスの開始中にディスコネクション状態になった場合の原因の調査方法と対処方法について説明します。

◆両ノード共通

  1. rdbbcdcuコマンドを実行して主系RLPのコネクション状態を確認します。OnStatが“online”かつConStatが“disconnection”の場合、DBミラーリングサービスの開始中にディスコネクション状態となっています。
    “RLPname”で表示されたRLP名を確認してください。

    $ rdbbcdcu -V
  2. 上記で確認したRLP名を指定して、rdbbcrlpコマンドを実行し、等価性コピーの状態を表示します。

    $ rdbbcrlp -V -R -p RLP名
  3. rdbbcrlpコマンドの実行結果より、ディスコネクション原因(DisconnectCause)および等価性コピーの状態(Stat)を確認します。
    DisconnectCauseの表示に対するディスコネクションの原因および対処方法の対応を以下に示します。

[表:ディスコネクションの原因と対処方法]

DisconnectCauseの表示

原因

対処方法

-

相手ノードのDBミラーリングサービスが開始未

相手ノードのDBミラーリングサービスの開始

other-down

相手ノードのSymfoware/RDB の停止中(注)

相手ノードのSymfoware/RDBの起動

own-stop

自ノードのSymfoware/RDBの停止中

自ノードのSymfoware/RDBの起動

acm-error

ACMの等価性コピーの異常

等価性コピーの異常によるディスコネクション状態からのリカバリ

注) ディスコネクション原因が相手ノードのダウンの場合は、相手ノードのダウンから約10分後にディスコネクション状態およびディスコネクション原因が表示されます。
等価性コピーの状態(Stat)で等価性コピーの異常が発生している場合は、等価性コピーの異常によるディスコネクション状態からのリカバリ手順で対処してください。

上記の表で「相手ノードのDBミラーリングサービスが開始未」、「相手ノードのSymfoware/RDB の停止中」、「自ノードのSymfoware/RDBの停止中」の場合、それぞれ上記の表の対処方法で記載しているとおり、DBミラーリングサービスおよびSymfoware/RDBを起動することでディスコネクション状態が解消されます。「ACMの等価性コピーの異常」の場合は、「等価性コピーの異常によるディスコネクション状態からのリカバリ」に従って対処してください。

等価性コピーの異常によるディスコネクション状態からのリカバリ手順については“等価性コピーの異常によるディスコネクション状態からのリカバリ”を参照してください。

等価性コピーの異常によるディスコネクション状態からのリカバ

ACMの等価性コピーの異常が発生し、ディスコネクション状態になった場合のリカバリ方法を説明します。

◆操作の手順

◆両ノード共通

  1. rdbbcdcuコマンドを実行して状態を確認します。OnStatが“online”かつConStatが“disconnection”の場合、“RLPname”で表示されたRLP名を確認します。
    オンライン・オフライン状態が“suspend”の場合は、Symfoware/RDBの起動またはDBミラーリングサービスの開始を実施してください。

    $ rdbbcdcu -V

    表示例

    $ rdbbcdcu -V
    
    LogGroup             : system
    RLCbuffNum           : 128
    RLCbuffSize          : 2K
    RLCnum               : 3
    RLCsize              : 10240K
    RLPid  RLPname  Kind       OnMode   OnStat            RLPstat        InhCause   ConStat        DisConCause
        1  rlp001   origin     capture  online            normal         -          disconnection  acm-error
  2. 上記で確認したRLP名を指定して、rdbbcrlpコマンドを実行してRLPの等価性コピーの状態を表示します。ディスコネクション状態(Connection:disconnection)で、ディスコネクション原因がACMの異常(DisconnectCause:acm-error)またはStatが等価性コピーの異常を示していることを確認します。

    $ rdbbcrlp -V -R -p RLP名 

    表示例

    $ rdbbcrlp -V -R -p rlp001
    
    RLPname              : rlp001
    Connection           : disconnection
    DisconnectCause      : acm-error
    
    Id      RECstatus    Stat        OwnPath      OtherPath
    RLM-S   abnormal     halt        /dev/blockdev1@SRC-SV  /dev/blockdev2@TARG-SV
    RLM-R   abnormal     halt        /dev/blockdev2@SRC-SV  /dev/blockdev1@TARG-SV
    rlc001  abnormal     halt        /dev/blockdev3@SRC-SV  /dev/blockdev3@TARG-SV
    rlc002  abnormal     halt        /dev/blockdev4@SRC-SV  /dev/blockdev4@TARG-SV
    rlc003  abnormal     halt        /dev/blockdev5@SRC-SV  /dev/blockdev5@TARG-SV
    ACMのswsrpstatコマンドの結果(stat)として以下のいずれかが表示されている場合は、ACMに異常が発生していることが考えられます。
    ACMのマニュアルを参照して異常原因の調査とリカバリを行ってください。
    • halt

    • failed

    • ?????

  3. dxsvstopコマンドを実行して、DBミラーリングサービスのリカバリ停止を行います。

    $ dxsvstop -r
  4. rdbbcconコマンドを実行して、コネクション状態にします。

    $ rdbbccon -p RLP名 
    コネクション再開処理完了のメッセージが出力されます。
    rdb: INFO: qdg20343i:コネクション再開処理が完了しました RLP名='RLP名'

    コネクション再開のメッセージ例

    rdb: INFO: qdg20158i:コネクション状態を確立しました RLP名='RLP名'
  5. rdbbcrlpコマンドを実行し、等価性コピーの異常のリカバリとコネクション状態を確認します。

    $ rdbbcrlp -V -R -p RLP名 
  6. dxsvstartコマンドの -cオプションまたは-rオプションを実行して(本リカバリ操作前と同じモードで実行します)、DBミラーリングサービスを開始します(リカバリモードの終了)。

    [正系ノードの場合]

    $ dxsvstart -c 

    [副系ノードの場合]

    $ dxsvstart -r 


目次 索引 前ページ次ページ

All Rights Reserved, Copyright(C) 富士通株式会社 2007-2008