ハードウェア障害等が発生した場合の対処フローを以下に示します。
図8.3 ハードウェア障害等が発生した場合の対処フロー
注意
「status欄」の詳細については、「8.4.1 概要」を参照してください。
status欄が"?????"の場合は、ETERNUS Web GUIでコピー処理がエラーサスペンド状態("failed")またはハードウェアサスペンド状態("halt")になっていないか確認してください。
コピー処理がこれらの状態になっている場合は上記の対処フローにしたがって対処を行ってください。
それ以外の場合は、別の原因(Storageサーバ、スイッチ等)が考えられますので、富士通技術員(SE)に連絡してください。
エラーコードは、以下の2通りの方法で確認できます。
9.4.2.3 swsrpstat(運用状況表示コマンド)で確認する方法
9.4.2.3 swsrpstat(運用状況表示コマンド)のオプションに"-O"を指定して実行します。
ETERNUS Web GUIで確認する方法
[状態表示]メニューで、状態表示の[アドバンスト・コピー状態表示]をクリックします。
「セッション状態」で該当コピー種別の「稼動セッション数」リンクをクリックします。
該当コピー処理の「Error Code」欄の値を参照します。
エラーコードの意味は以下の通りです。
エラーコード | 意味 |
---|---|
0xBA | 以下のa)またはb)のときに、複写元ボリュームに不良セクタが作成された。 a)QuickOPCが物理コピー未実施かつトラッキング処理中である b)EC/RECがサスペンド状態(複製確立状態)である (注) |
0xBB | Snap Data VolumeまたはSnap Data Poolの容量不足が発生した。 |
0xBA、0xBB | 上記以外のエラーが発生した。 |
エラーコード0xBA、0xBBは以下のETERNUS ディスクアレイの場合にのみ返却されます。
ETERNUS4000/ETERNUS8000(ファームウェアバージョンV11L30-0000以降)
ETERNUS6000(ファームウェアバージョンV31L40-0000以降)
上記以外のETERNUS ディスクアレイの場合には、エラーコード0xBA、0xBBが示す事象は以下の方法で判断します。
事象 | 判断方法 |
---|---|
0xBAが示す事象 | 本事象が発生することはありません。 上記a)またはb)のときに、複写元ボリュームに不良セクタが発生しても、コピー状態は変化しません。 |
0xBBが示す事象 | ETERNUS Web GUIでSnap Data Volumeの使用済み容量を確認することにより、物理容量の不足が発生したか否かを判断してください。
本事象に該当する場合は、「8.4.2.3 Snap Data VolumeまたはSnap Data Poolの容量不足が発生した場合の対処方法」を参照してください。 |
複製ボリュームにハードウェア障害が発生した場合、以下の手順に従って障害の復旧作業を行ってください。
9.4.2.4 swsrpcancel(複製解除コマンド)で異常の発生している処理をキャンセルします。サーバ間レプリケーションを行っていた場合で、操作サーバからキャンセルできない場合は、非操作サーバからキャンセルします。
コマンドによるキャンセルができない場合は、ETERNUS Web GUIを使用してキャンセルします。
9.4.2.3 swsrpstat(運用状況表示コマンド)を実行して、他に異常が発生していないことを確認します。
9.4.1.3 swsrpdelvol(複製ボリューム情報削除コマンド)を使用して、異常の発生している複製ボリュームを削除します。
9.4.1.1 swsrpsetvol(複製ボリューム情報設定コマンド)を使用して、新しい複製ボリュームを登録します。異常の発生していた複製ボリュームを修復して再度使用する場合は、GUIクライアントから[特定デバイスの情報取得/反映]を実施してから、複製ボリュームに登録しなおしてください。
エラーとなった処理を再実行します。
複写元ボリュームに不良セクタが発生した場合、複写元ボリュームの復旧は以下の手順で行ってください。
9.4.2.4 swsrpcancel(複製解除コマンド)で異常の発生している処理をキャンセルします。
サーバ間レプリケーションを行っていた場合で、操作サーバからキャンセルできない場合は、非操作サーバからキャンセルします。
コマンドによるキャンセルができない場合は、ETERNUS Web GUIを使用してキャンセルします。
9.4.2.3 swsrpstat(運用状況表示コマンド)を実行して、他に異常が発生していないことを確認します。
不良セクタ領域はその領域を上書きすることによって復旧されます。複製元ボリュームの用途/使用状況に応じて、以下の復旧方法から適切な方法を選択して復旧を行ってください。
復旧方法1
上位ソフト(ファイルシステム、DBMS等)から再構築できる領域である場合は再構築を行う。
復旧方法2
不良セクタ領域が未使用領域やテンポラリ領域のような使用されていない領域である場合は専用ツール(例:UNIXのddコマンド)で書き込みを行う。
復旧方法3
9.4.2.2 swsrpmake(複製作成コマンド)を使用して複製先ボリュームからデータを復旧する(なお、不良セクタが発生したコピー処理の複製先ボリュームからの復旧も可能です)。
Snap Data Volumeの容量不足は、Snap Data Poolを使用していない場合に発生し、Snap Data Poolの容量不足はSnap Data Poolを使用している場合に発生します。
以下に、Snap Data VolumeまたはSnap Data Poolの容量不足が発生した場合の復旧方法を説明します。
Snap Data Volumeの容量不足の復旧方法
以下に、Snap Data Volumeで容量不足が発生した場合の復旧方法を説明します。
Snap Data Volumeの容量不足が発生した場合は、9.4.2.4 swsrpcancel(複製解除コマンド)で異常の発生している処理をキャンセルします。
サーバ間レプリケーションを行っていた場合で、操作サーバからキャンセルできない場合は、非操作サーバからキャンセルします。
コマンドによるキャンセルができない場合は、ETERNUS Web GUIを使用してキャンセルします。
なお、Snap Data Volumeの容量不足が発生する原因としては以下が考えられます。
Snap Data Volumeの物理容量の見積りが適切でない。
Snap Data Volumeの物理容量の見積りは適切だが、SnapOPC/SnapOPC+セッションが存在しない状態でSnap Data Volumeに大量の更新を行ったため、Snap Data Volumeの物理容量が無駄に消費されている。
Snap Data Volumeの使用状況は、9.6.2 swstsdv(Snap Data Volumeの操作/参照コマンド)のサブコマンドに"stat"を指定して確認できます。
上記、a.に該当する場合は、Snap Data Volumeの物理容量を再度見積もり、Snap Data Volumeの再作成をしてください。
上記、b.に該当する場合は、ETERNUS Web GUIを使用するか、9.6.2 swstsdv(Snap Data Volumeの操作/参照コマンド)のサブコマンドに"init"を指定して、Snap Data Volumeの初期化をしてください。
Snap Data Volumeの再作成/初期化を行った後は、パーティション(スライス)の再作成が必要になります。
Snap Data Poolの容量不足の復旧方法
以下に、Snap Data Poolで容量不足が発生した場合の復旧方法を説明します。
Snap Data Poolの容量不足が発生した場合は、9.4.2.4 swsrpcancel(複製解除コマンド)で異常の発生している処理をキャンセルします。
サーバ間レプリケーションを行っていた場合で、操作サーバからキャンセルできない場合は、非操作サーバからキャンセルします。
コマンドによるキャンセルができない場合は、ETERNUS Web GUIを使用してキャンセルします。
なお、Snap Data Poolの容量不足が発生する原因としては以下が考えられます。
Snap Data Poolの容量の見積りが適切でない。
Snap Data Poolの容量の見積りは適切だが、SnapOPC/SnapOPC+セションが存在しない状態でSnap Data Volumeに大量の更新を行ったため、Snap Data Poolの容量が無駄に消費されている。
Snap Data Poolの使用状況は、9.6.2 swstsdv(Snap Data Volumeの操作/参照コマンド)のサブコマンドに"poolstat"指定して確認できます。
上記、a.に該当する場合は、Snap Data Poolの容量を再度見積もり、Snap Data Poolの容量を増設した後、Snap Data Volumeの再作成をしてください。
上記、b.に該当する場合は、ETERNUS Web GUIを使用するか、9.6.2 swstsdv(Snap Data Volumeの操作/参照コマンド)のサブコマンドに"init"を指定して、Snap Data Volumeの初期化をしてください。
Snap Data Volumeの再作成/初期化を行った後は、パーティション(スライス)の再作成が必要になります。
RECのRecoveryモードによって、RECを再開(Resume)する方法が異なります。
[Automatic Recoveryモードの場合]
全パス閉塞(halt)の原因を取り除きます。
ETERNUS ディスクアレイにより自動的にRECが再開(Resume)されます。
[Manual Recoveryモードの場合]
全パス閉塞(halt)の原因を取り除きます。
9.4.2.2 swsrpmake(複製作成コマンド)を使用してhalt状態のRECを強制サスペンドします。
[ボリューム単位の場合] swsrpmake -j <複写元ボリューム名> <複写先ボリューム名> [グループ単位の場合] swsrpmake -j -Xgroup <グループ名> |
9.4.2.1 swsrpstartsync(複製開始コマンド)を使用してRECを再開(Resume)します(強制サスペンド後のRECを再開する場合は-tオプションの指定が必要です)。
[ボリューム単位の場合] swsrpstartsync -t <複写元ボリューム名> <複写先ボリューム名> [グループ単位の場合] swsrpstartsync -t -Xgroup <グループ名> |