スライスの状態が以下に該当する場合は、それぞれに記載されている対処を行ってください。
(1) ミラーボリュームを構成するミラースライスが INVALID 状態である。
説明
ボリュームを構成するスライスの状態は次の方法で確認できます。
# sdxinfo -S -o Volume1 |
この例では、ボリューム Volume1 を構成するスライスのうち、Object2 に存在するスライスが、STATUS フィールドに示されているとおり INVALID 状態になっています。Object2 は、最上位ミラーグループ Group1 に接続されているディスクまたは下位グループです。
ミラースライス Volume1.Object2 が INVALID 状態となる原因として、次の 5 とおりの原因が考えられます。
ミラースライス Volume1.Object2 で I/O エラーが発生した。
Object2 に関連するディスク部品が故障して、ミラースライス Volume1.Object2 で I/O エラーが発生した。
Object2 に関連するディスク以外の部品 (I/O アダプタ、I/O ケーブル、I/O コントローラ、電源、ファンなど) が故障して、ミラースライス Volume1.Object2 で I/O エラーが発生した。
ミラースライス Volume1.Object2 への等価性コピー処理中に、コピー元のスライス Volume1.Object1 で I/O エラーが発生した。
ミラースライス Volume1.Object2 への等価性コピー処理中に、Object1 に関連するディスク部品が故障して、コピー元のスライス Volume1.Object1 で I/O エラーが発生した。
ミラースライス Volume1.Object2 への等価性コピー処理中に、Object1 に関連するディスク以外の部品 (I/O アダプタ、I/O ケーブル、I/O コントローラ、電源、ファンなど) が故障して、コピー元のミラースライス Volume1.Object1 で I/O エラーが発生した。
その他
ミラースライス Volume1.Object2 への等価性コピー処理が、運用管理ビューの [コピー中止] 操作、sdxcopy コマンド、または不慮の電源切断などによって中止された。
SCSI タイムアウトにより、I/O エラーが発生した。SCSI タイムアウトの発生は、以下のメッセージから判断できます。
kernel: mptscsih: iocn: attempting task abort! (sc=e00001401a0dce80)
対処
1) sdxinfo コマンドを使って、異常が発生しているディスクの物理ディスク名を特定します。
(例 A1)
# sdxinfo -G -o Volume1 # sdxinfo -D -o Volume1 -e long |
この例では、Object2 は最上位グループ Group1 に接続されているディスクです。E フィールドに示されているとおり、ディスク Object2 で I/O エラーが発生しており、(原因 a) または (原因 b) に該当します。ディスク Object2 の物理ディスク名は、DEVNAM フィールドに示されているとおり sdb です。
(例 A1) において、INVALID 状態のスライスが存在するディスク Object2 の E フィールドの値が 0 であり、かつ、ディスク Object2 とミラーリングされているディスク Object1 の E フィールドの値が 1 である場合は、ディスク Object1 で I/O エラーが発生しており、(原因 a') または (原因 b') に該当します。この場合は、「(2) 等価性コピー処理中にコピー元スライスで I/O エラーが発生して、コピー先スライスが INVALID 状態になった。」を参照して復旧を行ってください。
また、(例 A1) において E フィールドが 1 のディスクが 1 つも存在しない場合は、(原因 c) に該当します。
(例 B1)
# sdxinfo -G -o Volume1 # sdxinfo -D -o Volume1 -e long |
この例では、Object2 は最上位グループ Group1 に接続されている下位グループです。E フィールドに示されているとおり、Object2 に接続されているディスク Disk3 で I/O エラーが発生しており、(原因 a) または (原因 b) に該当します。Disk3 に対応する物理ディスク名は、DEVNAM フィールドに示されているとおり sdc です。
(例 B1) において、INVALID 状態のスライスが存在する下位グループ Object2 に接続されているディスク (Disk3 および Disk4) の E フィールドの値が 0 であり、かつ、下位グループ Object2 とミラーリングされている下位グループ Object1 に接続されているディスク (Disk1 または Disk2) の E フィールドの値が 1 である場合は、Object1 に接続されているディスクで I/O エラーが発生しており、(原因 a') または (原因 b') に該当します。この場合は、「(2) 等価性コピー処理中にコピー元スライスで I/O エラーが発生して、コピー先スライスが INVALID 状態になった。」を参照して復旧を行ってください。
(例 B1) で E フィールドが 1 のディスクが存在しない場合は、(原因 c) に該当します。
2) 物理ディスクの異常について、ディスクドライバのログメッセージなどをもとにして確認します。
ディスクのハードウェア故障のなかには、I/O アダプタ、I/O ケーブル、I/O コントローラ、電源、ファンなど、ディスク以外にもさまざまな部品の故障あるいは不良が原因として考えられます。
当社の技術員へ連絡して、故障または不良箇所を特定してください。
故障および不良箇所がない場合は、(原因 c) に該当します。
以下では、原因 a、b、c の 3 つの場合に分けて、対処方法を説明します。
a. (原因 a) に該当する場合
a1) ディスクの交換を行う前と交換後に以下の操作が必要です。運用管理ビューを使ったディスク交換手順については、「7.3.1.2 操作手順」を参照してください。
ディスクを交換する前には、次の操作を行ってください。
(例 A1)
# sdxswap -O -c Class1 -d Object2 |
この例では、最上位グループ Group1 に接続されているディスク Object2 を交換します。
(例 B1)
# sdxswap -O -c Class1 -d Disk3 |
この例では、最上位グループ Group1 の下位グループ Object2 に接続されているディスク Disk3 を交換します。
a2) ディスクを交換してください。
a3) 交換が完了した後に、次の操作を行ってください。
(例 A3)
# sdxswap -I -c Class1 -d Object2 |
または、
(例 B3)
# sdxswap -I -c Class1 -d Disk3 |
a4) 手順 3) に従って、スライスの状態を確認します。
b. (原因 b) に該当する場合
b1) いったんシステムをシャットダウンして、故障箇所を修復した後にブートしてください。自動的に等価性コピーが行われてミラーリング状態を回復します。
b2) 手順 3) に従って、スライスの状態を確認します。
c. (原因 c) に該当する場合
c1) ミラーボリュームの等価性コピーを実行します。
# sdxcopy -B -c Class1 -v Volume1 |
c2) 手順 3) に従って、スライスの状態を確認します。
3) ボリュームを構成するスライスの状態が復旧できたかどうかは、以下の方法で確認できます。
# sdxinfo -S -o Volume1 |
この例では、Object1 および Object2 内のスライスは、いずれも ACTIVE 状態であり、復旧処理が完了したことを示しています。
(2) 等価性コピー処理中にコピー元スライスで I/O エラーが発生して、コピー先スライスが INVALID 状態になった。
説明
等価性コピー処理中にコピー元スライスで I/O エラーが発生した場合、コピー元スライスは ACTIVE 状態のまま、コピー先スライスが INVALID 状態になります。
原因として、以下の 2 つが考えられます。
等価性コピー処理中にコピー元のディスク部品が故障して、コピー元のスライスで I/O エラーが発生した。
等価性コピー処理中にコピー元のディスク以外の部品 (I/O アダプタ、I/O ケーブル、I/O コントローラ、電源、ファンなど) が故障して、コピー元のスライスで I/O エラーが発生した。
この現象に該当するかどうかを判定し、異常が発生しているディスクの物理ディスク名を特定する方法については、「(1) ミラーボリュームを構成するミラースライスが INVALID 状態である。」の [説明] と [対処] の手順 1) を参照してください。
対処
まず、物理ディスクの異常について、ディスクドライバのログメッセージなどをもとにして確認します。当社の技術員へ連絡して、故障または不良箇所を特定してください。
(原因 b) に該当する場合は、いったんシステムをシャットダウンして、故障箇所を修復した後にブートしてください。自動的に等価性回復コピーが行われてミラーリング状態が回復されます。
(原因 a) に該当する場合は、以下の手順で復旧します。次の 3 つの場合に分けて、手順を説明します。
A. / (ルート)、/usr、または /var の場合【EFI】
B. swap 領域の場合【EFI】
C. その他 (/ (ルート)、/usr、/var、swap 以外) の場合
以下では、クラス名が Class1、 ボリューム名が Volume1、 故障したコピー元のディスク名が Disk1、 コピー先のディスク名が Disk2 である場合の復旧手順を例として示します。
# sdxinfo -S -o Volume1 # sdxinfo -G -o Volume1 # sdxinfo -D -o Volume1 -e long |
A. / (ルート)、/usr、または /var の場合【EFI】
「D.1.5 システムディスクに関する異常【EFI】」の「(4) システムがブートできない (全ブートディスク装置の故障)。」に従って復旧を行います。「対処」の手順では、ルートクラスに登録されているすべてのディスクではなく、故障したコピー元のディスクのみを交換します。
B. swap 領域の場合【EFI】
B.1) swapのボリュームを確認します。
# swapon -s
Filename Type Size Used Priority
/dev/sfdsk/gdssys32 partition 4194296 0 -1 |
B.2) ボリュームを swap 領域から削除します。
# swapoff /dev/sfdsk/gdssys32 |
ボリュームを構成するディスクの故障箇所や故障の程度によっては、I/O エラーのために swapoff(8) コマンドが失敗する場合があります。この場合は、以下の B.2.1)、B.2.2) の手順で、ボリュームを swap 領域から削除します。
B.2.1) システム再起動後にボリュームを swap 領域として使用しないようにするため、swap の行をコメントアウトします。
# vim /etc/fstab |
B.2.2) システムを再起動します。
# shutdown -r now |
B.3) ボリュームを停止します。
# sdxvolume -F -c Class1 -v Volume1 |
B.4) INVALID 状態になったコピー先のスライスの状態を復旧します。
# sdxfix -V -c Class1 -d Disk2 -v Volume1 |
B.5) 復旧したコピー先のスライスが STOP 状態、コピー元のスライスが INVALID 状態になったことを確認します。
# sdxinfo -S -o Volume1 |
B.6) ボリュームを起動します。
# sdxvolume -N -c Class1 -v Volume1 |
B.7) ボリュームを再度 swap 領域に追加します。
# swapon /dev/sfdsk/gdssys32 |
手順 B.2.1) を実行した場合は、/etc/fstab ファイルの内容を元に戻します。
# vim /etc/fstab |
B.8) 故障したコピー元のディスクを GDS の管理から切り離して、交換可能な状態にします。
# sdxswap -O -c Class1 -d Disk1 |
B.9) 故障したコピー元のディスクを交換します。
B.10) 交換したディスクを GDS の管理下に組み込んで、使用可能な状態に戻します。
# sdxswap -I -c Class1 -d Disk1 |
C. その他(/ (ルート)、/usr、/var、swap 以外) の場合
C.1) ボリュームを使用しているアプリケーションを停止します。
C.2) ボリューム上のファイルシステムがマウントされている場合は、アンマウントします。
ここでは、ボリュームが ext4 ファイルシステムとして使用されている場合の例を示します。
# umount /dev/sfdsk/Class1/dsk/Volume1 |
ボリュームを構成するディスクの故障箇所や故障の程度によっては、I/O エラーのために umount コマンドが失敗する場合があります。この場合、C.2.1) ~ C.2.3) 手順を実行することにより、ファイルシステムをアンマウントします。
C.2.1) クラス Class1 がクラスタアプリケーションに登録されている場合は、そのクラスタアプリケーションを削除します。
C.2.2) システム再起動後にボリュームをマウントしないようにするため、/etc/fstab/ ファイルの /dev/sfdsk/Class1/dsk/Volume1 の行をコメントアウトします。
C.2.3) システムを再起動します。
C.3) ボリュームを停止します。
# sdxvolume -F -c Class1 -v Volume1 |
C.4) INVALID 状態になったコピー先のスライスの状態を復旧します。
# sdxfix -V -c Class1 -d Disk2 -v Volume1 |
C.5) 復旧したコピー先のスライスが STOP 状態、コピー元のスライスが INVALID 状態になったことを確認します。
# sdxinfo -S -o Volume1 |
C.6) ボリュームを起動します。
# sdxvolume -N -c Class1 -v Volume1 |
C.7) ボリュームのデータは整合性が失われている可能性があります。必要に応じて、バックアップデータのリストア、または fsck(8) コマンドによる修復を行ってください。
注意
システムダウン後の高速等価性回復コピー処理中にコピー元スライスで I/O エラーが発生した場合は、fsck(8) コマンドで修復できる可能性があります。
手順 C.2.2) を実行した場合は、/etc/fstab ファイルの内容を元に戻します。
手順 C.2.1) を実行した場合は、手順 C.2.1) で削除したクラスタアプリケーションを再度作成します。
C.8) 故障したコピー元ディスクを GDS の管理下から切り離して、交換可能な状態にします。
# sdxswap -O -c Class1 -d Disk1 |
C.9) 故障したコピー元のディスクを交換します。
C.10) 交換したディスクを GDS の管理下に組み込んで、使用可能な状態に戻します。
# sdxswap -I -c Class1 -d Disk1 |
(3) ボリュームを構成するスライスが TEMP 状態である。
説明
sdxslice コマンドにより、スライスの切り離しを行った後、組み込みが行われていないためです。または、運用管理ビューで「スライス切離し」の操作を行った後、「スライス組込み」を行っていないためです。
対処
必要に応じて、sdxslice コマンドによるスライスの組み込み、あるいは、運用管理ビューによる「スライス組込み」の操作を行ってください。
(4) ボリュームを構成するスライスが TEMP-STOP 状態である。
説明
sdxslice コマンドにより、スライスの停止を行った後で起動が行われていないか、または、切離しを行ったノードが自ノードではないためです。あるいは、運用管理ビューで「スライス停止」の操作を行った後、「スライス起動」の操作を行っていないためです。
対処
必要に応じて、sdxslice コマンドによるスライスの起動またはスライスの引継ぎ、あるいは運用管理ビューによる「スライス起動」の操作を行ってください。
(5) ボリュームを構成するスライスが COPY 状態である。
説明
スライスを組み込むために、等価性コピー処理を行っています。または、マスタとプロキシの間で等価性コピー処理を行っています。
対処
等価性コピー処理が完了するまで、しばらくお待ちください。なお、等価性コピー処理中のスライスがあった場合でも、ボリュームが起動されていれば、アクセス可能です。
(6) ボリュームを構成するスライスが NOUSE 状態である。
説明
スライスに関連するディスクの状態が DISABLE または SWAP 状態になると、スライスへの操作を抑止するために NOUSE 状態となります。
対処
ディスクの DISABLE または SWAP 状態を復旧させてください。詳しくは、「D.1.2 ディスク状態に関する異常」を参照してください。