ここでは、物理L-Serverに接続するストレージ筺体の高可用性について説明します。
物理L-Serverが利用しているLUNを2台のストレージ装置間でレプリケーションしている場合、ストレージ装置が故障しても物理L-Serverの運用を速やかに復旧できます。
ここでは、1つのマネージャーに管理されているLUNのレプリケーションが行われている2台のストレージ装置間で、物理L-Serverが利用しているディスクを切り替える場合について説明します。
Disaster Recovery環境で物理L-Serverおよび物理L-Serverが利用するディスクを切り替える場合、「付録J Disaster Recovery」を参照してください。
図I.2 ストレージの運用系/待機系の切替え
前提条件
切替え対象のディスクリソースは、ストレージ装置で事前に作成されたLUNが対象で、事前に運用系ストレージと待機系ストレージの間でLUNのレプリケーションが設定されている必要があります。
このとき、本製品で自動作成したディスクリソースは、切替えの対象になりません。
運用系ストレージと待機系ストレージの間で、LUNのレプリケーションの関係は、運用系:待機系が1:1である必要があります。
運用系のディスクリソースは、物理L-Serverに接続している必要があります。
ストレージプールに登録していない、またはL-Serverに接続していないディスクリソースは処理の対象になりません。
ディスクリソースの切替えは、事前に作成したレプリケーション定義ファイルに記述された、レプリケーションの対応関係に基づいて処理を行います。レプリケーション定義ファイルに記述されていないディスクリソースは処理の対象になりません。
LUNの追加など、ストレージの構成を変更した場合、レプリケーション定義ファイルを修正する必要があります。
待機系のディスクリソースは、本製品に検出されている必要があります。LUNがサーバからアクセス可能な状態の場合、本製品から検出されません。また、検出されたディスクリソースはストレージプールに登録しないでください。
レプリケーション定義ファイルに記述するストレージ装置の識別子(ETERNUS、NetApp、またはEMC CLARiXの場合はIPアドレス、EMC Symmetrix DMXの場合はSymmID)が重複しない構成である必要があります。
このとき、運用系に存在するストレージ装置と同じIPアドレスまたはSymmIDをもつストレージ装置は、待機系のストレージ装置にできません。
ストレージ装置がNetAppで、ストレージのレプリケーションにMetroCluster機能を利用する構成の場合、本機能を利用した切替え処理はできません。
MetroCluster機能で運用系ストレージと待機系ストレージを切り替えることで、物理L-Serverの運用を復旧できます。
物理L-Serverが動作するサーバから、運用系のストレージ装置および待機系のストレージ装置にアクセスできるように、ファイバーチャネルスイッチを事前に設定しておく必要があります。
ストレージ装置がETERNUSの場合、事前の設定は必要ありません。
切替えに必要な時間は、運用系のストレージ装置を利用しているL-Serverの数やL-Serverが利用しているディスクリソースの数に比例します。
ストレージ装置の故障から復旧するまでの時間は、事前にテストを行い把握しておくことをお勧めします。
ストレージ装置のLUNのレプリケーション
ETERNUSの場合
ETERNUS SF AdvancedCopy Managerを利用して、LUNのレプリケーションを定義してください。
EMC CLARiXの場合
MirrorView機能を利用して、LUNのレプリケーションを定義してください。
EMC Symmetrix DMXの場合
SRDF機能を利用して、デバイスのレプリケーションを定義してください。
レプリケーション定義ファイル
レプリケーション定義ファイルは事前に作成します。レプリケーション定義ファイルにはレプリケーションの対応関係を記述します。
レプリケーション定義ファイルの書式は以下のとおりです。
運用系ストレージ装置のIPアドレス,運用系ボリューム識別子,待機系ストレージ装置のIPアドレス,待機系ボリューム識別子 |
運用系ストレージ装置および待機系ストレージ装置のIPアドレスと運用系ボリューム識別子および待機系ボリューム識別子の組合せが一意になるように設定してください。レプリケーション定義ファイル内で重複していると、スクリプト作成時にエラーになります。
ETERNUSの場合
レプリケーションの対応関係は、ETERNUS SF AdvancedCopy Managerで確認してください。例えば、ETERNUS SF AdvancedCopy ManagerのCopy Control Moduleを利用してレプリケーションを行っている場合、acec queryコマンドで確認します。
ストレージの識別子にはストレージのIPアドレスを指定してください。ストレージのIPアドレスはrcxadm storage listコマンドで確認してください。
ボリューム識別子については、ETERNUS SF AdvancedCopy Managerで確認してください。ボリューム識別子はゼロサプレスなしの16進形式で記述してください。
例
192.168.1.24,0x0001,192.168.2.25,0x0005 192.168.1.24,0x0002,192.168.2.25,0x0006 192.168.3.25,0x0001,192.168.4.26,0x0005 |
EMC CLARiXの場合
レプリケーションの対応関係は、MirrorView機能で確認してください。
ストレージの識別子にはIPアドレスを指定してください。IPアドレスはrcxadm storage listコマンドで確認してください。
ボリューム識別子については、MirrorView機能で確認してください。ボリューム識別子はゼロサプレスなしの16進形式で記述してください。
例
192.168.1.24,0x0001,192.168.2.25,0x0005 192.168.1.24,0x0002,192.168.2.25,0x0006 192.168.3.25,0x0001,192.168.4.26,0x0005 |
EMC Symmetrix DMXの場合
レプリケーションの対応関係は、SRDF機能で確認してください。
ストレージの識別子にはSymmIDを指定してください。SymmIDはrcxadm storage listコマンドで確認してください。
ボリューム識別子にはデバイスを指定してください。デバイスはSRDF機能で確認してください。ボリューム識別子はゼロサプレスなしの16進形式で記述してください。
例
000192601264,0001, 000192601265,0005 000192601264,0002, 000192601265,0006 000192601274,0001, 000192601275,0005 |
運用系から待機系に切り替える場合(failover)
運用系から待機系に切り替える手順について説明します。
レプリケーション定義ファイルを作成します。
レプリケーション定義ファイルについては、「レプリケーション定義ファイル」を参照してください。
rcxstorage -failoverコマンドを実行して、以下のスクリプトを作成します。
failoverスクリプト
物理L-Server停止スクリプト
物理L-Server起動スクリプト
rcxstorageコマンドについては、「ServerView Resource Orchestrator リファレンスガイド」の「1.7.13 rcxstorage」を参照してください。
これらのスクリプトは運用系のストレージ装置単位で作成します。
これらのスクリプトはコマンドが実行された時点の構成情報に基づいて作成されます。構成を変更した場合、これらのスクリプトを再作成してください。
運用系と待機系のストレージ装置が、ストレージツリーに表示されているときに実行してください。運用系のストレージ装置が故障しても、ストレージツリーに表示されている間は、スクリプトを作成できます。
注意
ストレージツリーに操作対象のストレージ装置が表示されていないとき、これらのスクリプトは作成できません。
作成した物理L-Server停止スクリプトを、マネージャーが動作しているサーバで実行します。これにより、failoverスクリプトで処理対象にしている物理L-Serverが停止されます。L-Serverで動作しているOSのシャットダウン処理を行わず、サーバを強制的に停止する場合は、物理L-Server停止スクリプト実行時に-forceオプションを指定してください。
スクリプトの実行時にエラーが発生した場合、当社技術員に連絡してください。
注意
物理L-Serverは物理L-Server停止スクリプトに記述された順序で停止されます。物理L-Serverの停止順序の指定が必要な場合は、物理L-Server停止スクリプトを編集してください。
物理L-ServerのHBAのWWPNと、運用系ストレージのポートの、WWPNの組合せのゾーニングをファイバーチャネルスイッチから削除します。ストレージがETERNUSの場合、failoverスクリプト実行時に本製品がファイバーチャネルスイッチのゾーニングを削除するため、本手順は必要ありません。
ストレージのレプリケーション機能が停止していない場合は停止してください。
作成したfailoverスクリプトをマネージャーが動作しているサーバで実行します。
スクリプトの実行時にエラーが発生した場合、当社技術員に連絡してください。
待機系のストレージにアクセスするため、ファイバーチャネルスイッチに物理L-ServerのHBAのWWPNと、待機系ストレージのポートの、WWPNの組合せのゾーニングを追加します。ストレージがETERNUSの場合、failoverスクリプト実行時に本製品がファイバーチャネルスイッチのゾーニングを追加済みのため、本手順は必要ありません。
待機系のストレージのLUNへの読込み/書込みをする場合、必要に応じてレプリケーションの設定を変更してください。
作成した物理L-Server起動スクリプトを、マネージャーが動作しているサーバで実行します。これにより、物理L-Serverが起動されます。
スクリプトの実行時にエラーが発生した場合、当社技術員に連絡してください。
注意
物理L-Serverは物理L-Server起動スクリプトに記述された順序で起動されます。物理L-Serverの起動順序の指定が必要な場合は、物理L-Server起動スクリプトを編集してください。
待機系から運用系に切り替える場合(failback)
待機系から運用系に切り替える手順について説明します。
運用系のストレージ装置の修理を依頼してください。
ストレージ管理製品を利用して、運用系のストレージ装置の論理構成(RAID、LUN)を復旧してください。
ストレージ管理製品を利用して、運用系のストレージ装置のLUNマスキング定義およびLUNマッピング定義を確認し、物理L-ServerのHBAのWWPNに関連する定義が残っている場合は削除してください。
レプリケーション機能の設定変更により、待機系のストレージ装置から運用系のストレージ装置へのレプリケーションを行い、運用系と待機系のLUNが等価状態になるまで待ちます。
レプリケーション定義ファイルを準備します。
レプリケーション定義ファイルは、failoverと同じものを使用します。ただし、failoverスクリプトを実行したあとに構成を変更した場合、レプリケーション定義ファイルを修正してください。
rcxstorage -failbackコマンドを実行して以下のスクリプトを作成します。
failbackスクリプト
物理L-Server停止スクリプト
物理L-Server起動スクリプト
rcxstorageコマンドについては、「ServerView Resource Orchestrator リファレンスガイド」の「1.7.13 rcxstorage」を参照してください。
これらのスクリプトは運用系のストレージ装置単位で作成します。
これらのスクリプトは、failoverスクリプトを実行して、待機系のストレージ装置に切り替えたあと、作成できます。
これらのスクリプトはコマンドが実行された時点の構成情報に基づいて作成されます。構成を変更した場合、これらのスクリプトを作成し直してください。
運用系のストレージ装置と待機系のストレージ装置がストレージツリーに表示されているときに実行してください。ストレージツリーに操作対象のストレージ装置が表示されていないとき、これらのスクリプトは作成できません。
作成した物理L-Server停止スクリプトを、マネージャーが動作しているサーバで実行します。これにより、failbackスクリプトで処理対象にしている物理L-Serverが停止されます。L-Serverで動作しているOSのシャットダウン処理を行わず、サーバを強制的に停止する場合は、物理L-Server停止スクリプト実行時に-forceオプションを指定してください。
スクリプトの実行時にエラーが発生した場合、当社技術員に連絡してください。
注意
物理L-Serverは物理L-Server停止スクリプトに記述された順序で停止されます。物理L-Serverの停止順序の指定が必要な場合は、物理L-Server停止スクリプトを編集してください。
物理L-ServerのHBAのWWPNと、待機系ストレージのポートの、WWPNの組合せのゾーニングをファイバーチャネルスイッチから削除します。ストレージがETERNUSの場合、failbackスクリプト実行時に本製品がファイバーチャネルスイッチのゾーニングを削除するため、本手順は必要ありません。
ストレージのレプリケーション機能を停止します。
作成したfailbackスクリプトをマネージャーが動作しているサーバで実行します。
スクリプトの実行時にエラーが発生した場合、当社技術員に連絡してください。
運用系のストレージにアクセスするため、ファイバーチャネルスイッチに物理L-ServerのHBAのWWPNと、運用系ストレージのポートの、WWPNの組合せのゾーニングを追加します。ストレージがETERNUSの場合、failbackスクリプト実行時に本製品がファイバーチャネルスイッチのゾーニングを追加済みのため、本手順は必要ありません。
レプリケーション機能の設定変更により、運用系のストレージ装置から待機系のストレージ装置へのレプリケーションを行い、運用系と待機系のLUNが等価状態になるまで待ちます。
作成した物理L-Server起動スクリプトを、マネージャーが動作しているサーバで実行します。これにより、物理L-Serverが起動されます。
スクリプトの実行時にエラーが発生した場合、当社技術員に連絡してください。
注意
物理L-Serverは物理L-Server起動スクリプトに記述された順序で起動されます。物理L-Serverの起動順序の指定が必要な場合は、物理L-Server起動スクリプトを編集してください。