クラスタシステムにおけるレプリケーション運用では、通常運用と異なる以下の注意事項があります。
レプリケーションコマンド実行中にフェイルオーバが発生した場合、swsrprecoverresコマンドを使用して整合性がとれるようにリカバリー対処が必要です。
同期型レプリケーションを使用する場合、複写先ボリュームをクラスタアプリケーションに登録しないでください。同期処理の開始後にクラスタアプリケーションがフェイルオーバするときがあります。
クラスタ運用を行う場合、AdvancedCopy ManagerはuserApplicationに組み込まれており、クラスタサービス(userApplication)の一部として動作するため、レプリケーション運用はクラスタサービス(userApplication)の運用系で実施する必要があります。
待機状態となっているノードや、別のクラスタサービス(userApplication)からレプリケーションを行うことはできません。
複製元ボリューム上にファイルシステムを構築し、そのファイルシステムをクラスタのリソースに登録している場合は、以下の注意事項があります。
複製先ボリュームをクラスタアプリケーションに登録しないでください。
以下の手順でレプリケーションを行います。
PRIMECLUSTER環境におけるスナップショット型レプリケーション手順
userApplicationをMaintenance(保守)モードに移行します。
# hvutil -m on userApplication
複製元ボリュームがファイルシステムでかつアンマウントされた状態でレプリケーションを行う場合は、複製元ボリュームをアンマウントしてください。
手順2を実施した場合は、複製元ボリュームのクラスタリソースがオフライン(Offline)であることを確認してください。
リソースがオフライン(Offline)であることを確認するコマンドは以下になります。
# hvassert -s <複製元ボリュームのクラスタリソース名> Offline
上記コマンドの復帰値が0になるまで待ってください。
レプリケーションを実行します。
# /opt/FJSVswsrp/bin/swsrpmake From-Volume-Name To-Volume-Name FROM=From-Volume-Name TO=To-Volume-Name swsrpmake completed
手順2を実施した場合は、複製元ボリュームをマウントしてください。
複製元ボリュームのクラスタリソースがオンライン(Online)であることを確認してください。
リソースがオンライン(Online)であることを確認するコマンドは以下になります。
# hvassert -s <複製元ボリュームのクラスタリソース名> Online
上記コマンドの復帰値が0になるまで待ってください。
userApplicationのMaintenance(保守)モードを停止します。
# hvutil -m off userApplication
PRIMECLUSTER環境における同期型レプリケーション手順
同期処理を開始します。
# /opt/FJSVswsrp/bin/swsrpstartsync From-Volume-Name To-Volume-Name FROM=From-Volume-Name TO=To-Volume-Name swsrpstartsync completed
等価性維持状態を確認します。
userApplicationをMaintenance(保守)モードに移行します。
# hvutil -m on userApplication
複製元ボリュームがファイルシステムでかつアンマウントされた状態でレプリケーションを行う場合は、複製元ボリュームをアンマウントしてください。
手順4を実施した場合は、複製元ボリュームのクラスタリソースがオフライン(Offline)であることを確認してください。
リソースがオフライン(Offline)であることを確認するコマンドは以下になります。
# hvassert -s <複製元ボリュームのクラスタリソース名> Offline
上記コマンドの復帰値が0になるまで待ってください。
レプリケーションを実行します。
# /opt/FJSVswsrp/bin/swsrpmake From-Volume-Name To-Volume-Name FROM=From-Volume-Name TO=To-Volume-Name swsrpmake completed
手順4を実施した場合は、複製元ボリュームをマウントしてください。
複製元ボリュームのクラスタリソースがオンライン(Online)であることを確認してください。
リソースがオンライン(Online)であることを確認するコマンドは以下になります。
# hvassert -s <複製元ボリュームのクラスタリソース名> Online
上記コマンドの復帰値が0になるまで待ってください。
userApplicationのMaintenance(保守)モードを停止します。
# hvutil -m off userApplication
注意
スナップショット型レプリケーションの実行の手順2、または、同期型レプリケーションの実行の手順4を実施する場合、前後処理スクリプト内で複製元ボリュームがマウントされていた場合の処理が実施されません。
前後処理スクリプト内の該当部分をカスタマイズする場合、この点を考慮してカスタマイズしてください。
クラスタリソースの状態はクラスタのディテクタによって定周期または非同期に行われているため、複製元ボリュームをマウント・アンマウント実行したタイミングやシステム負荷によって、クラスタリソースの状態に反映されるまで時間がかかり、hvassertコマンドでその状態を確認できないことがあります。そのため、hvassertコマンドでクラスタリソースの状態を確認するタイミングについて、以下の点に注意してください。
クラスタのFSystemリソースのファイルシステムをアンマウント(またはマウント)完了日時を起点として、hvassertコマンドでクラスタリソースがOffline(またはOnline)であることを確認するには、クラスタリソースの監視間隔以上の時間が経過してから確認してください。なお、hvassertコマンドの-sオプションの代わりに-wオプションを指定することで、引数で指定したクラスタリソースが、引数で指定した状態となるまで待つ最大時間を指定できます。
# hvassert -w <複製元ボリュームのクラスタリソース名> Offline(またはOnline) <最大待ち時間(秒数)>
待ち時間はシステム負荷やクラスタリソースの反映処理時間も考慮する必要があります。そのため、待ち時間は、システム運用の環境、目的、要件に合わせて最大値を設定してください。
なお、PRIMECLUSTERのFSystemリソースのデフォルトの監視間隔は10秒です。ただし、この監視間隔は、PRIMECLUSTER 4.2におけるデフォルト値です。利用されるPRIMECLUSTERにあわせて確認してください。
hvassertコマンドの詳細は、『PRIMECLUSTER 活用ガイド <コマンドリファレンス編>』の「hvassert (1M)」を確認してください。
PRIMECLUSTERでクラスタ運用している場合
AdvancedCopy Managerが属するuserApplicationが稼働している場合、稼働ノードだけでレプリケーション運用が可能です。待機ノードではレプリケーション運用の環境が整っていない(必要なリソースが使用できない)ため、レプリケーション運用できません。同様に、userApplicationが停止している場合も、環境が整っていないため、レプリケーション運用できません。
ただし、userApplicationが停止している場合に限り、一時的に必要最低限の環境を整えることでレプリケーション運用できます。
注意
スケーラブル運用の業務との複合運用を行っている場合は、スケーラブル運用のuserApplicationだけを停止し、運用管理サーバ業務および管理対象サーバ業務のuserApplicationは停止しないでください。
レプリケーション運用ディスク(運用したい複写元/複写先ボリューム)を有効にすることで、通常時と同じレプリケーション運用を行うことができます。
レプリケーション運用ディスクを有効にできない場合、スケーラブル運用のuserApplicationを停止してのレプリケーション運用はできません。
以下の共有ディスクを有効(オンラインやファイルシステムの場合はマウント)にできない場合は、レプリケーション運用できません。
AdvancedCopy Manager共有データ用共有ディスク
レプリケーション運用ディスク (運用したい複写元/複写先ボリューム)
レプリケーション運用での以下の操作はできません。
運用管理サーバからのレプリケーション運用の操作(-hオプション指定によるホストの指示)
複製元/複製先ボリュームの追加削除
-mオプションを指定しないサーバ間レプリケーション
運用管理サーバ業務兼管理対象サーバ業務でレプリケーション管理の表示系コマンドを実行する場合、コマンドにオプションを指定する必要があります。レプリケーション管理の表示系コマンドは、「10.3 レプリケーション管理のコマンド」を参照してください。
以下の手順で、userApplication停止中のレプリケーション運用を行います。
両ノードでuserApplicationが停止していることを確認します。
userApplicationの停止方法は、PRIMECLUSTERのマニュアルを参照してください。
レプリケーション運用したいノードにtelnetなどでログインします。
論理IPアドレスは使用できません。物理IPアドレスを使用して運用するノードを直接利用してください。
共有ディスクを有効にします。
共有ディスクを起動(オンライン)します。
AdvancedCopy Manager共有データ用共有ディスクをマウントします。
複製元/複製先ボリュームをファイルシステムとしてマウントして運用していた場合はマウントします。
注意
共有ディスクの有効化は必ずどちらか一方のノードで行ってください。両ノードで同じ共有ディスクを有効にしないでください。
環境変数SWSTGNODEに該当業務の論理ノード名を設定します。
環境変数の設定方法は以下のとおりです。
[実行例]
# SWSTGNODE=logicalNodeName
# export SWSTGNODE |
レプリケーション運用を実施します。
クラスタ運用の通常時と同様、レプリケーション運用できます。
複製先ボリュームから複製元ボリュームにリストアすることもできます。
手順3で有効にしたすべての共有ディスクを解除します。
マウントしたファイルシステムは、アンマウントします。
共有ディスクを停止(オフライン)します。
userApplicationを起動(オンライン)します。
必要に応じて、userApplicationを起動します。
userApplicationの起動方法は、PRIMECLUSTERのマニュアルを参照してください。