ETERNUS SF AdvancedCopy Manager 運用手引書 13.2 -Linux-
目次 索引 前ページ次ページ

第9章 運用保守> 9.4 レプリケーション中に発生したハードウェア障害等の対処方法

9.4.2 対処方法

ハードウェア障害等が発生した場合の対処フローを以下に示します。

[図: 対処フロー図(レプリケーション中の障害の場合)]

status欄が"?????"の場合は、ETERNUSmgr/GRmgrでコピー処理がエラーサスペンド状態("failed")またはハードウェアサスペンド状態("halt")になっていないか確認してください。コピー処理がこれらの状態になっている場合は上記の対処フローにしたがって対処を行ってください。それ以外の場合は、別の原因(Storageサーバ、スイッチ等)が考えられますので、富士通技術員(SE)に連絡してください。

9.4.2.1 複製ボリュームにハードウェア障害が発生した場合の対処方法 

複製ボリュームにハードウェア障害が発生した場合、以下の手順に従って障害の復旧作業を行ってください。

  1. 複製解除コマンド(swsrpcancel)で異常の発生している処理をキャンセルします。サーバ間レプリケーションを行っていた場合で、操作サーバからキャンセルできない場合は、非操作サーバからキャンセルします。

  2. コマンドによるキャンセルができない場合は、ETERNUSmgr/GRmgrを使用してキャンセルします。

  3. 資源整合コマンド(swsrprecoverres)を実行します。

  4. 運用状況表示コマンド(swsrpstat)を実行して、他に異常が発生していないことを確認します。

  5. 複製ボリューム情報削除コマンド(swsrpdelvol)を使用して、異常の発生している複製ボリュームを削除します。

  6. 複製ボリューム情報設定コマンド(swsrpsetvol)を使用して、新しい複製ボリュームを登録します。異常の発生していた複製ボリュームを修復して再度使用する場合は、初期画面から[特定デバイスの情報取得/反映]を実施してから、複製ボリュームに登録しなおしてください。

  7. エラーとなった処理を再実行します。

9.4.2.2 複写元ボリュームに不良セクタが発生した場合の対処方法 

複写元ボリュームに不良セクタが発生した場合、複写元ボリュームの復旧は以下の手順で行ってください。

  1. 複製解除コマンド(swsrpcancel)で異常の発生している処理をキャンセルします。
    サーバ間レプリケーションを行っていた場合で、操作サーバからキャンセルできない場合は、非操作サーバからキャンセルします。
    コマンドによるキャンセルができない場合は、ETERNUSmgrを使用してキャンセルします。

  2. 運用状況表示コマンド(swsrpstat)を実行して、他に異常が発生していないことを確認します。

  3. 不良セクタ領域はその領域を上書きすることによって復旧されます。複製元ボリュームの用途/使用状況に応じて、以下の復旧方法から適切な方法を選択して復旧を行ってください。

9.4.2.3 Snap Data Disk(Snap Data Volume)の使用量が物理容量を超えた場合の対処方法

Snap Data Disk (Snap Data Volume)の使用済み容量が物理容量を超えた場合は、複製解除コマンド(swsrpcancel)で異常の発生している処理をキャンセルします。

サーバ間レプリケーションを行っていた場合で、操作サーバからキャンセルできない場合は、非操作サーバからキャンセルします。

コマンドによるキャンセルができない場合は、ETERNUSmgrを使用してキャンセルします。異常の発生した処理をキャンセルすることにより、再びSnapOPCが実行可能になります。

Snap Data Diskの物理容量オーバーが発生する原因としては以下が考えられます。

  1. Snap Data Diskの物理容量の見積りが適切でない。

  2. Snap Data Diskの物理容量の見積りは適切だが、SnapOPCセッションが存在しない状態でSnap Data Diskに大量の更新を行ったため、Snap Data Diskの物理容量が無駄に消費されている。

上記、a.に該当する場合は、Snap Data Diskの物理容量を再度見積もり、Snap Data Diskの再作成を行ってください。

上記、b.に該当する場合は、ETERNUSmgrよりSnap Data Diskの初期化を行ってください。

なお、Snap Data Diskの再作成/初期化を行った後は、ディスクパーティション(スライス)の再作成が必要になります。

9.4.2.4 リモートコピー処理で異常(halt)が発生した場合の対処方法 

RECのRecoveryモードによって、RECを再開(Resume)する方法が異なります。

[Automatic Recoveryモードの場合]

  1. 全パス閉塞(halt)の原因を取り除きます。

  2. ETERNUS ディスクアレイにより自動的にRECが再開(Resume)されます。

[Manual Recoveryモードの場合]

  1. 全パス閉塞(halt)の原因を取り除きます。

  2. 複製作成コマンド(swsrpmake)を使用してhalt状態のRECを強制サスペンドします。

    [ボリューム単位の場合]

    swsrpmake -j <複写元ボリューム名> <複写先ボリューム名>

    [グループ単位の場合]

    swsrpmake -j -Xgroup <グループ名>


  3. 複製開始コマンド(swsrpstartsync)を使用してRECを再開(Resume)します(強制サスペンド後のRECを再開する場合は-tオプションの指定が必要です)。

    [ボリューム単位の場合]

    swsrpstartsync -t <複写元ボリューム名> <複写先ボリューム名>

    [グループ単位の場合]

    swsrpstartsync -t -Xgroup <グループ名>


目次 索引 前ページ次ページ

All Rights Reserved, Copyright(C) 富士通株式会社 2000-2008