SafeCLUSTERまたはPRIMECLUSTER
クラスタシステムにおけるレプリケーション運用については、通常運用と異なる以下の注意事項があります。
レプリケーションコマンド実行中にフェイルオーバが発生した場合、10.4.3.1 swsrprecoverres(資源整合コマンド)を使用して整合性がとれるようにリカバリ対処が必要です。
クラスタ運用を行う場合、AdvancedCopy ManagerはuserApplicationに組み込まれており、userApplicationの一部として動作するため、レプリケーション運用はuserApplicationの運用系で実施する必要があります。
待機状態となっているノードや、別のuserApplicationからレプリケーションを行うことはできません。
PRIMECLUSTER
PRIMECLUSTER 4.0A20以前
複製元ボリューム上にファイルシステムを構築し、そのファイルシステムをクラスタのリソースに登録している場合は、以下の注意事項があります。
レプリケーションの前後処理を変更して、複製元ボリュームをアンマウントしないレプリケーション運用に変更する必要があります。
複製先ボリュームにはRAWパーティションを設定してください。
業務の運用中に10.4.2.2 swsrpmake(複製作成コマンド)を使用して、複製先ボリュームから複製元ボリュームにリストアすることはできません。ボリュームのデータを復旧する場合は、ddコマンドを使用してコピーするか、複製先ボリュームをマウントして必要なデータをコピーしてください。
または、11.1.9.1 userApplication停止時のレプリケーションを実施してください。
PRIMECLUSTER 4.0A30以降
複製元ボリューム上にファイルシステムを構築し、そのファイルシステムをクラスタのリソースに登録している場合は、以下の注意事項があります。
複製先ボリュームにはRAWパーティションを設定してください。
以下の手順でレプリケーションを行います。
PRIMECLUSTER環境下におけるACMによるスナップショット型レプリケーション手順
userApplicationをMaintenance(保守)モードに移行します。
# hvutil -m on userApplication
複製元ボリュームがファイルシステムでかつアンマウントされた状態で
レプリケーションを行う場合は、複製元ボリュームをアンマウントしてください。
手順2.を実施した場合は、複製元ボリュームのクラスタリソースが
オフライン(Offline)であることを確認してください。
リソースがオフライン(Offline)であることを確認するコマンドは以下になります。
# hvassert -s <複製元ボリュームのクラスタリソース名> Offline
上記コマンドの復帰値が0になるまで待ってください。
レプリケーションを実行します。
# /opt/FJSVswsrp/bin/swsrpmake From-Volume-Name To-Volume-Name FROM=From-Volume-Name TO=To-Volume-Name swsrpmake completed
手順2.を実施した場合は、複製元ボリュームをマウントしてください。
複製元ボリュームのクラスタリソースがオンライン(Online)であることを確認してください。
リソースがオンライン(Online)であることを確認するコマンドは以下になります。
# hvassert -s <複製元ボリュームのクラスタリソース名> Online
上記コマンドの復帰値が0になるまで待ってください。
userApplicationのMaintenance(保守)モードを停止します。
# hvutil -m off userApplication
PRIMECLUSTER環境下におけるACMによる同期型レプリケーション手順
同期処理を開始します。
# /opt/FJSVswsrp/bin/swsrpstartsync From-Volume-Name To-Volume-Name FROM=From-Volume-Name TO=To-Volume-Name swsrpstartsync completed
等価性維持状態を確認します。
userApplicationをMaintenance(保守)モードに移行します。
# hvutil -m on userApplication
複製元ボリュームがファイルシステムでかつアンマウントされた状態でレプリケーションを行う場合は、複製元ボリュームをアンマウントしてください。
手順4.を実施した場合は、複製元ボリュームのクラスタリソースがオフライン(Offline)であることを確認してください。
リソースがオフライン(Offline)であることを確認するコマンドは以下になります。
# hvassert -s <複製元ボリュームのクラスタリソース名> Offline
上記コマンドの復帰値が0になるまで待ってください。
レプリケーションを実行します。
# /opt/FJSVswsrp/bin/swsrpmake From-Volume-Name To-Volume-Name FROM=From-Volume-Name TO=To-Volume-Name swsrpmake completed
手順4.を実施した場合は、複製元ボリュームをマウントしてください。
複製元ボリュームのクラスタリソースがオンライン(Online)であることを確認してください。
リソースがオンライン(Online)であることを確認するコマンドは以下になります。
# hvassert -s <複製元ボリュームのクラスタリソース名> Online
上記コマンドの復帰値が0になるまで待ってください。
userApplicationのMaintenance(保守)モードを停止します。
# hvutil -m off userApplication
注意
スナップショット型レプリケーションの実行の手順2.、または、同期型レプリケーションの実行の手順4.を実施する場合、前後処理スクリプト内で複製元ボリュームがマウントされていた場合の処理が実施されません。
前後処理スクリプト内の該当部分をカスタマイズされる場合は、この点を考慮してカスタマイズを行ってください。
クラスタリソースの状態はクラスタのディテクタによって定周期または非同期に行われていますので、業務ボリュームをマウント・アンマウント実行したタイミングやシステム負荷によって、クラスタリソースの状態に反映されるまでに時間がかかる場合があり、hvassertコマンドでその状態を確認できない場合があります。
そのため、hvassertコマンドでクラスタリソースの状態を確認するタイミングについて、以下の点にご注意ください。
クラスタのFSystemリソースのファイルシステムをアンマウント(もしくはアンマウント)完了日時を起点として、hvassertコマンドでクラスタリソースがOffline(もしくはOffline)であることを確認するためには、クラスタリソースの監視間隔以上の時間が経過してから確認してください。
なお、hvassertコマンドの-sオプションの代わりに-wオプションを指定することで、引数で指定したクラスタリソースが、引数で指定した状態となるまで待つ最大時間を指定することができます。
# hvassert -w <複製元ボリュームのクラスタリソース名> Offline(もしくはOnline) <最大待ち時間(秒数)>
1)の待ち時間はシステム負荷やクラスタリソースの反映処理時間も考慮する必要があります。
そのため、1)の待ち時間は、システム運用の環境、目的、要件に合わせて最大値を設定してください。
なお、PRIMECLUSTERのFSystemリソースのデフォルトの監視間隔は10秒です。
ただし、この監視間隔は、PRIMECLUSTER 4.2におけるデフォルト値です。利用されるPRIMECLUSTERにあわせて確認してください。
hvassertコマンドについては、『PRIMECLUSTER 導入運用手引書』の「hvassert (1M)」を確認してください。
AdvancedCopy Managerが属するuserApplicationが稼働している場合、稼働ノードでのみレプリケーション運用が可能です。待機ノードではレプリケーション運用を行うための環境が整っていない(必要なリソースが使用できない)ため、レプリケーション運用を行うことはできません。同様に、userApplicationが停止している場合も、環境が整っていないためにレプリケーション運用を行うことはできません。
ただしuserApplicationが停止している場合に限り、一時的に必要最低限の環境を整えることで、レプリケーション運用を行うことができます。
注意
スケーラブル運用の業務との複合運用を行っている場合は、スケーラブル運用のuserApplicationのみを停止し、Storage(管理)サーバ業務のuserApplicationは停止しないでください。
レプリケーション運用ディスク(運用したい複写元ボリューム/複写先ボリューム)を有効にすることで、通常時と同じレプリケーション運用を行うことができます。
レプリケーション運用ディスクを有効にできない場合、スケーラブル運用のuserApplicationを停止してのレプリケーション運用はできません。
以下の共有ディスクを有効(オンラインやファイルシステムの場合はマウント)にできない場合、レプリケーション運用を行うことはできません。
AdvancedCopy Manager共有データ用共有ディスク
レプリケーション運用ディスク(運用したい複写元ボリューム/複写先ボリューム)
レプリケーション運用での以下の操作はできません。
Storage管理サーバからのレプリケーション運用の操作(-h オプション指定によるホストの指示)
複製元/複製先ボリュームの追加削除
-mオプションを指定しないサーバ間レプリケーション
Storage管理サーバ業務兼Storageサーバ業務にてレプリケーション管理の表示系コマンドを実行する場合、コマンドにオプションを指定する必要があります。レプリケーション管理の表示系コマンドについては、「10.4 レプリケーション管理のコマンド」を参照してください。
以下の手順にて、userApplication停止中のレプリケーション運用を行います。
両ノードでuserApplicationが停止していることを確認します。
userApplicationを停止する方法については、PRIMECLUSTERのマニュアルを参照してください。
レプリケーション運用したいノードにtelnet等でログインします。
論理IPアドレスは使用できません。物理IPアドレスを使用して運用するノードを直接ご利用ください。
共有ディスクを有効にします。
共有ディスクを起動(オンライン)します。
AdvancedCopy Manager共有データ用共有ディスクをマウントします。
複製元/複製先ボリュームをファイルシステムとしてマウントして運用していた場合はマウントします。
注意
共有ディスクの有効化は必ずどちらか一方のノードで行ってください。両ノードで同じ共有ディスクを有効にしないでください。
環境変数SWSTGNODEに該当業務の論理ノード名を設定します。
環境変数の設定方法は以下のとおりです。
<実行例>
# SWSTGNODE=論理ノード名 # export SWSTGNODE |
レプリケーション運用を実施します。
クラスタ運用の通常時と同様、レプリケーション運用を行うことができます。
複製先ボリュームから複製元ボリュームにリストアすることもできます。
手順3で有効にした共有ディスクを全て解除します。
マウントしたファイルシステムは、アンマウントします。
共有ディスクを停止(オフライン)します。
userApplicationを起動(オンライン)します。
必要に応じて、userApplicationを起動します。
userApplicationの起動方法については、PRIMECLUSTERのマニュアルを参照してください。