Symfoware Server Mirroring Controller 運用ガイド |
目次
索引
![]() ![]() |
第5章 異常時の運用 | > 5.8 正系ノードでのDBミラーリングシステムの異常 | > 5.8.5 データベースの二重化処理の異常 |
DBミラーリングシステムの運用ではRLPを配置しているリモートコピー環境の異常や相手先データベースが停止した場合に、ディスコネクション状態になります。
この場合のリカバリ手順を説明します。
ディスコネクション状態が発生すると以下のメッセージが出力されます。
rdb: INFO: qdg20154i:ディスコネクション状態になりました RLP名='RLP名' |
DBミラーリングサービスの開始中にディスコネクション状態になった場合の原因の調査方法と対処方法について説明します。
rdbbcdcuコマンドを実行して主系RLPのコネクション状態を確認します。OnStatが“online”かつConStatが“disconnection”の場合、DBミラーリングサービスの開始中にディスコネクション状態となっています。
“RLPname”で表示されたRLP名を確認してください。
$ rdbbcdcu -V |
上記で確認したRLP名を指定して、rdbbcrlpコマンドを実行し、等価性コピーの状態を表示します。
$ rdbbcrlp -V -R -p RLP名 |
rdbbcrlpコマンドの実行結果より、ディスコネクション原因(DisconnectCause)および等価性コピーの状態(Stat)を確認します。
DisconnectCauseの表示に対するディスコネクションの原因および対処方法の対応を以下に示します。
DisconnectCauseの表示 |
原因 |
対処方法 |
---|---|---|
- |
相手ノードのDBミラーリングサービスが開始未 |
相手ノードのDBミラーリングサービスの開始 |
other-down |
相手ノードのSymfoware/RDB の停止中(注) |
相手ノードのSymfoware/RDBの起動 |
own-stop |
自ノードのSymfoware/RDBの停止中 |
自ノードのSymfoware/RDBの起動 |
acm-error |
ACMの等価性コピーの異常 |
等価性コピーの異常によるディスコネクション状態からのリカバリ |
注) ディスコネクション原因が相手ノードのダウンの場合は、相手ノードのダウンから約10分後にディスコネクション状態およびディスコネクション原因が表示されます。
等価性コピーの状態(Stat)で等価性コピーの異常が発生している場合は、等価性コピーの異常によるディスコネクション状態からのリカバリ手順で対処してください。
上記の表で「相手ノードのDBミラーリングサービスが開始未」、「相手ノードのSymfoware/RDB の停止中」、「自ノードのSymfoware/RDBの停止中」の場合、それぞれ上記の表の対処方法で記載しているとおり、DBミラーリングサービスおよびSymfoware/RDBを起動することでディスコネクション状態が解消されます。「ACMの等価性コピーの異常」の場合は、「等価性コピーの異常によるディスコネクション状態からのリカバリ」に従って対処してください。
等価性コピーの異常によるディスコネクション状態からのリカバリ手順については“等価性コピーの異常によるディスコネクション状態からのリカバリ”を参照してください。
ACMの等価性コピーの異常が発生し、ディスコネクション状態になった場合のリカバリ方法を説明します。
rdbbcdcuコマンドを実行して状態を確認します。OnStatが“online”かつConStatが“disconnection”の場合、“RLPname”で表示されたRLP名を確認します。
オンライン・オフライン状態が“suspend”の場合は、Symfoware/RDBの起動またはDBミラーリングサービスの開始を実施してください。
$ rdbbcdcu -V |
表示例
$ rdbbcdcu -V LogGroup : system RLCbuffNum : 128 RLCbuffSize : 2K RLCnum : 3 RLCsize : 10240K RLPid RLPname Kind OnMode OnStat RLPstat InhCause ConStat DisConCause 1 rlp001 origin capture online normal - disconnection acm-error |
上記で確認したRLP名を指定して、rdbbcrlpコマンドを実行してRLPの等価性コピーの状態を表示します。ディスコネクション状態(Connection:disconnection)で、ディスコネクション原因がACMの異常(DisconnectCause:acm-error)またはStatが等価性コピーの異常を示していることを確認します。
$ rdbbcrlp -V -R -p RLP名 |
表示例
$ rdbbcrlp -V -R -p rlp001 RLPname : rlp001 Connection : disconnection DisconnectCause : acm-error Id RECstatus Stat OwnPath OtherPath RLM-S abnormal halt /dev/blockdev1@SRC-SV /dev/blockdev2@TARG-SV RLM-R abnormal halt /dev/blockdev2@SRC-SV /dev/blockdev1@TARG-SV rlc001 abnormal halt /dev/blockdev3@SRC-SV /dev/blockdev3@TARG-SV rlc002 abnormal halt /dev/blockdev4@SRC-SV /dev/blockdev4@TARG-SV rlc003 abnormal halt /dev/blockdev5@SRC-SV /dev/blockdev5@TARG-SV |
ACMのswsrpstatコマンドの結果(stat)として以下のいずれかが表示されている場合は、ACMに異常が発生していることが考えられます。
ACMのマニュアルを参照して異常原因の調査とリカバリを行ってください。
halt
failed
?????
dxsvstopコマンドを実行して、DBミラーリングサービスのリカバリ停止を行います。
$ dxsvstop -r |
rdbbcconコマンドを実行して、コネクション状態にします。
$ rdbbccon -p RLP名 |
コネクション再開処理完了のメッセージが出力されます。
rdb: INFO: qdg20343i:コネクション再開処理が完了しました RLP名='RLP名'コネクション再開のメッセージ例
rdb: INFO: qdg20158i:コネクション状態を確立しました RLP名='RLP名'
rdbbcrlpコマンドを実行し、等価性コピーの異常のリカバリとコネクション状態を確認します。
$ rdbbcrlp -V -R -p RLP名 |
dxsvstartコマンドの -cオプションまたは-rオプションを実行して(本リカバリ操作前と同じモードで実行します)、DBミラーリングサービスを開始します(リカバリモードの終了)。
[正系ノードの場合]
$ dxsvstart -c |
[副系ノードの場合]
$ dxsvstart -r |
利用者業務はコネクション状態を確認して開始してください。
利用者業務開始後にディスコネクション状態になり、そのまま利用者業務を継続すると、空きのRLCファイルがなくなり、RLPが閉塞します。RLPが閉塞した場合、DCUの再構築が必要になるため、ディスコネクション状態の発生時には、早急に対処するようにしてください。
データベースの切替えが動作すると、データベースの切替えを行うためにSymfoware/RDBが停止状態になるため、ディスコネクション状態になります。このとき、ディスコネクション状態の対処は不要です。例えば、正系ノードのデータベースがダウンなどで停止すると通常は副系ノードのデータベースに切替えます。このとき、ディスコネクション状態になります。なお、副系ノードのデータベースが切替え不可な場合に、正系ノードのデータベースのダウンが発生すると、正系ノードのデータベースを再起動して利用者業務を継続します。このときディスコネクション状態になりますが、正系ノードのデータベースの再起動により、ディスコネクション状態は自動的にリカバリされます。
ACMについては“ETERNUS SFAdvancedCopy Manager 運用手引書”を参照してください。
DCUの再構築については“DCUの再構築”を参照してください。
目次
索引
![]() ![]() |