PRIMECLUSTER Global Disk Services 説明書 4.2 (Linux版) |
目次
![]() ![]() |
付録F トラブルシューティング | > F.1 トラブルへの対処方法 |
スライスの状態が以下に該当する場合は、それぞれに記載されている対処を行ってください。
ボリュームを構成するスライスの状態は次の方法で確認できます。
# sdxinfo -S -o Volume1 OBJ CLASS GROUP DISK VOLUME STATUS ------ ------- ------- ------- -------- -------- slice Class1 Group1 Object1 Volume1 ACTIVE slice Class1 Group1 Object2 Volume1 INVALID |
この例では、ボリューム Volume1 を構成するスライスのうち、Object2 に存在するスライスが、STATUS フィールドに示されているとおり INVALID 状態になっています。Object2 は、最上位ミラーグループ Group1 に接続されているディスクまたは下位グループです。
ミラースライス Volume1.Object2 が INVALID 状態となる原因として、次の 5 通りの原因が考えられます。
ミラースライス Volume1.Object2 で I/O エラーが発生した。
ミラースライス Volume1.Object2 への等価性コピー処理中に、コピー元のスライス Volume1.Object1 で I/O エラーが発生した。
その他
1) sdxinfo コマンドを使って、異常が発生しているディスクの物理ディスク名を特定します。
(例 A1)
# sdxinfo -G -o Volume1 OBJ NAME CLASS DISKS BLKS FREEBLKS SPARE ------ ------- ------- ------------------- -------- -------- ----- group Group1 Class1 Object1:Object2 17596416 17498112 0 # sdxinfo -D -o Volume1 -e long OBJ NAME TYPE CLASS GROUP DEVNAM DEVBLKS FREEBLKS DEVCONNECT STATUS E ------ ------- ------ ------- ------- ------- -------- -------- ---------------- ------- ----- disk Object1 mirror Class1 Group1 sda 17596416 * node1:node2 ENABLE 0 disk Object2 mirror Class1 Group1 sdb 17596416 * node1:node2 ENABLE 1 |
この例では、Object2 は最上位グループ Group1 に接続されているディスクです。E フィールドに示されているとおり、ディスク Object2 で I/O エラーが発生しており、(原因 a) または (原因 b) に該当します。ディスク Object2 の物理ディスク名は、DEVNAM フィールドに示されているとおり sdb です。
(例 A1) において、INVALID 状態のスライスが存在するディスク Object2 の E フィールドの値が 0 であり、かつ、ディスク Object2 とミラーリングされているディスク Object1 の E フィールドの値が 1 である場合は、ディスク Object1 で I/O エラーが発生しており、(原因 a') または (原因 b') に該当します。この場合は、「(2) 等価性コピー処理中にコピー元スライスで I/O エラーが発生して、コピー先スライスが INVALID 状態になった。」を参照して復旧を行ってください。
また、(例 A1) において E フィールドが 1 のディスクが 1 つも存在しない場合は、(原因 c) に該当します。
(例 B1)
# sdxinfo -G -o Volume1 OBJ NAME CLASS DISKS BLKS FREEBLKS SPARE ------ ------- ------- ------------------- -------- -------- ----- group Group1 Class1 Object1:Object2 35127296 35028992 0 group Object1 Class1 Disk1:Disk2 35127296 * * group Object2 Class1 Disk3:Disk4 35127296 * * # sdxinfo -D -o Volume1 -e long OBJ NAME TYPE CLASS GROUP DEVNAM DEVBLKS FREEBLKS DEVCONNECT STATUS E ------ ------- ------ ------- ------- ------- -------- -------- ---------------- ------- ----- disk Disk1 stripe Class1 Object1 sda 17596416 * node1:node2 ENABLE 0 disk Disk2 stripe Class1 Object1 sdb 17596416 * node1:node2 ENABLE 0 disk Disk3 stripe Class1 Object2 sdc 17682084 * node1:node2 ENABLE 1 disk Disk4 stripe Class1 Object2 sdd 17682084 * node1:node2 ENABLE 0 |
この例では、Object2 は最上位グループ Group1 に接続されている下位グループです。E フィールドに示されているとおり、Object2 に接続されているディスク Disk3 で I/O エラーが発生しており、(原因 a) または (原因 b) に該当します。Disk3 に対応する物理ディスク名は、DEVNAM フィールドに示されているとおり sdc です。
(例 B1) において、INVALID 状態のスライスが存在する下位グループ Object2 に接続されているディスク (Disk3 および Disk4) の E フィールドの値が 0 であり、かつ、下位グループ Object2 とミラーリングされている下位グループ Object1 に接続されているディスク (Disk1 または Disk2) の E フィールドの値が 1 である場合は、Object1 に接続されているディスクで I/O エラーが発生しており、(原因 a') または (原因 b') に該当します。この場合は、「(2) 等価性コピー処理中にコピー元スライスで I/O エラーが発生して、コピー先スライスが INVALID 状態になった。」を参照して復旧を行ってください。
(例 B1) で E フィールドが 1 のディスクが存在しない場合は、(原因 c) に該当します。
2) 物理ディスクの異常について、ディスクドライバのログメッセージなどをもとにして確認します。
ディスクのハードウェア故障のなかには、I/O アダプタ、I/O ケーブル、I/O コントローラ、電源、ファンなど、ディスク以外にもさまざまな部品の故障あるいは不良が原因として考えられます。
当社の技術員へ連絡して、故障または不良箇所を特定してください。
故障および不良箇所が無い場合は、(原因 c) に該当します。
以下では、原因 a, b, c の 3 つの場合に分けて、対処方法を説明します。
a. (原因 a) に該当する場合
a1) ディスクの交換を行う前と交換後に以下の操作が必要です。運用管理ビューを使ったディスク交換手順については、「ディスク交換」を参照してください。
ディスクを交換する前には、次の操作を行ってください。
(例 A1)
# sdxswap -O -c Class1 -d Object2 |
この例では、最上位グループ Group1 に接続されているディスク Object2 を交換します。
(例 B1)
# sdxswap -O -c Class1 -d Disk3 |
この例では、最上位グループ Group1 の下位グループ Object2 に接続されているディスク Disk3 を交換します。
a2) ディスクを交換してください。
a3) 交換が完了した後に、次の操作を行ってください。
(例 A3)
# sdxswap -I -c Class1 -d Object2 |
または、
(例 B3)
# sdxswap -I -c Class1 -d Disk3 |
a4) 手順 3) に従って、スライスの状態を確認します。
b. (原因 b) に該当する場合
b1) いったんシステムをシャットダウンして、故障箇所を修復した後にブートしてください。自動的に等価性コピーが行われてミラーリング状態を回復します。
b2) 手順 3) に従って、スライスの状態を確認します。
c. (原因 c) に該当する場合
c1) ミラーボリュームの等価性コピーを実行します。
# sdxcopy -B -c Class1 -v Volume1 |
c2) 手順 3) に従って、スライスの状態を確認します。
3) ボリュームを構成するスライスの状態が復旧できたかどうかは、以下の方法で確認できます。
# sdxinfo -S -o Volume1 OBJ CLASS GROUP DISK VOLUME STATUS ------ ------- ------- ------- ------- -------- slice Class1 Group1 Object1 Volume1 ACTIVE slice Class1 Group1 Object2 Volume1 ACTIVE |
この例では、Object1 および Object2 内のスライスは、いずれも ACTIVE 状態であり、復旧処理が完了したことを示しています。
等価性コピー処理中にコピー元スライスで I/O エラーが発生した場合、コピー元スライスは ACTIVE 状態のまま、コピー先スライスが INVALID 状態になります。
原因として、以下の 2 つが考えられます。
この現象に該当するかどうかを判定し、異常が発生しているディスクの物理ディスク名を特定する方法については、「(1) ミラーボリュームを構成するミラースライスが INVALID 状態である。」の [説明] と [対処] の手順 1) を参照してください。
まず、物理ディスクの異常について、ディスクドライバのログメッセージなどをもとにして確認します。当社の技術員へ連絡して、故障または不良箇所を特定してください。
(原因 b) に該当する場合は、いったんシステムをシャットダウンして、故障箇所を修復した後にブートしてください。自動的に等価性回復コピーが行われてミラーリング状態が回復されます。
(原因 a) に該当する場合は、以下の手順で復旧します。次の 3 つの場合に分けて、手順を説明します。
A. / (ルート)、/usr、または /var の場合【Itanium】
B. swap 領域の場合【Itanium】
C. その他 (/ (ルート)、/usr、/var、swap 以外) の場合
以下では、クラス名が Class1、 ボリューム名が Volume1、 故障したコピー元のディスク名が Disk1、 コピー先のディスク名が Disk2 である場合の復旧手順を例として示します。
# sdxinfo -S -o Volume1 OBJ CLASS GROUP DISK VOLUME STATUS ------ ------- ------- ------- ------- -------- slice Class1 Group1 Disk1 Volume1 ACTIVE slice Class1 Group1 Disk2 Volume1 INVALID # sdxinfo -G -o Volume1 OBJ NAME CLASS DISKS BLKS FREEBLKS SPARE ------ ------- ------- ------------------- -------- -------- ----- group Group1 Class1 Disk1:Disk2 17596416 17498112 0 # sdxinfo -D -o Volume1 -e long OBJ NAME TYPE CLASS GROUP DEVNAM DEVBLKS FREEBLKS DEVCONNECT STATUS E ------ ------- ------ ------- ------- ------- -------- -------- ---------------- ------- ----- disk Disk1 mirror Class1 Group1 sda 17596416 * node1:node2 ENABLE 1 disk Disk2 mirror Class1 Group1 sdb 17596416 * node1:node2 ENABLE 0 |
A. / (ルート)、/usr、または /var の場合【Itanium】
当社技術員に連絡してください。
B. swap 領域の場合【Itanium】
B.1) ボリュームを swap 領域から削除します。
# swapoff /dev/sfdsk/Class1/dsk/Volume1 |
ボリュームを構成するディスクの故障箇所や故障の程度によっては、I/O エラーのために swapoff(8) コマンドが失敗する場合があります。この場合は、以下の B.1.1)、B.1.2) の手順で、ボリュームを swap 領域から削除します。
B.1.1) システム再起動後にボリュームを swap 領域として使用しないようにするため、/etc/fstab ファイルの /dev/sfdsk/Class1/dsk/Volume1 の行をコメントアウトします。
# vim /etc/fstab編集前: /dev/sfdsk/Class1/dsk/Volume1 swap swap defaults 0 0 編集後: #/dev/sfdsk/Class1/dsk/Volume1 swap swap defaults 0 0
B.1.2) システムを再起動します。
# shutdown -r now
B.2) ボリュームを停止します。
# sdxvolume -F -c Class1 -v Volume1 |
B.3) INVALID 状態になったコピー先のスライスの状態を復旧します。
# sdxfix -V -c Class1 -d Disk2 -v Volume1 |
B.4) 復旧したコピー先のスライスが STOP 状態、コピー元のスライスが INVALID 状態になったことを確認します。
# sdxinfo -S -o Volume1 OBJ CLASS GROUP DISK VOLUME STATUS ------ ------- ------- ------- ------- -------- slice Class1 Group1 Disk1 Volume1 INVALID slice Class1 Group1 Disk2 Volume1 STOP |
B.5) ボリュームを起動します。
# sdxvolume -N -c Class1 -v Volume1 |
B.6) ボリュームを再度 swap 領域に追加します。
# swapon /dev/sfdsk/Class1/dsk/Volume1 |
手順 B.1.1) を実行した場合は、/etc/fstab ファイルの内容を元に戻します。
# vim /etc/fstab編集前: #/dev/sfdsk/Class1/dsk/Volume1 swap swap defaults 0 0 編集後: /dev/sfdsk/Class1/dsk/Volume1 swap swap defaults 0 0
B.7) 故障したコピー元のディスクを GDS の管理から切り離して、交換可能な状態にします。
# sdxswap -O -c Class1 -d Disk1 |
B.8) 故障したコピー元のディスクを交換します。
B.9) 交換したディスクを GDS の管理下に組み込んで、使用可能な状態に戻します。
# sdxswap -I -c Class1 -d Disk1 |
C. その他(/ (ルート)、/usr、/var、swap 以外) の場合
C.1) ボリュームを使用しているアプリケーションを停止します。
C.2) ボリューム上のファイルシステムがマウントされている場合は、アンマウントします。
ここでは、ボリュームが ext3 ファイルシステムとして使用されている場合の例を示します。
# umount /dev/sfdsk/Class1/dsk/Volume1 |
ボリュームを構成するディスクの故障箇所や故障の程度によっては、I/O エラーのために umount コマンドが失敗する場合があります。この場合、C.2.1) 〜 C.2.3) 手順を実行することにより、ファイルシステムをアンマウントします。
C.2.1) クラス Class1 がクラスタアプリケーションに登録されている場合は、そのクラスタアプリケーションを削除します。
C.2.2) システム再起動後にボリュームをマウントしないようにするため、/etc/fstab/ ファイルの /dev/sfdsk/Class1/dsk/Volume1 の行をコメントアウトします。
C.2.3) システムを再起動します。
C.3) ボリュームを停止します。
# sdxvolume -F -c Class1 -v Volume1 |
C.4) INVALID 状態になったコピー先のスライスの状態を復旧します。
# sdxfix -V -c Class1 -d Disk2 -v Volume1 |
C.5) 復旧したコピー先のスライスが STOP 状態、コピー元のスライスが INVALID 状態になったことを確認します。
# sdxinfo -S -o Volume1 OBJ CLASS GROUP DISK VOLUME STATUS ------ ------- ------- ------- ------- -------- slice Class1 Group1 Disk1 Volume1 INVALID slice Class1 Group1 Disk2 Volume1 STOP |
C.6) ボリュームを起動します。
# sdxvolume -N -c Class1 -v Volume1 |
C.7) ボリュームのデータは整合性が失われている可能性があります。必要に応じて、バックアップデータのリストア、または fsck(8) コマンドによる修復を行ってください。
システムダウン後の高速等価性回復コピー処理中にコピー元スライスで I/O エラーが発生した場合は、fsck(8) コマンドで修復できる可能性があります。
手順 C.2.2) を実行した場合は、/etc/fstab ファイルの内容を元に戻します。
手順 C.2.1) を実行した場合は、手順 C.2.1) で削除したクラスタアプリケーションを再度作成します。
C.8) 故障したコピー元ディスクを GDS の管理下から切り離して、交換可能な状態にします。
# sdxswap -O -c Class1 -d Disk1 |
C.9) 故障したコピー元のディスクを交換します。
C.10) 交換したディスクを GDS の管理下に組み込んで、使用可能な状態に戻します。
# sdxswap -I -c Class1 -d Disk1 |
sdxslice コマンドにより、スライスの切り離しを行った後、組み込みが行われていないためです。または、運用管理ビューで「スライス切離し」の操作を行った後、「スライス組込み」を行っていないためです。
必要に応じて、sdxslice コマンドによるスライスの組み込み、あるいは、運用管理ビューによる「スライス組込み」の操作を行ってください。
sdxslice コマンドにより、スライスの停止を行った後で起動が行われていないか、または、切離しを行ったノードが自ノードではないためです。あるいは、運用管理ビューで「スライス停止」の操作を行った後、「スライス起動」の操作を行っていないためです。
必要に応じて、sdxslice コマンドによるスライスの起動またはスライスの引継ぎ、あるいは運用管理ビューによる「スライス起動」の操作を行ってください。
スライスを組み込むために、等価性コピー処理を行っています。または、マスタとプロキシの間で等価性コピー処理を行っています。
等価性コピー処理が完了するまで、しばらくお待ちください。なお、等価性コピー処理中のスライスがあった場合でも、ボリュームが起動されていれば、アクセス可能です。
スライスに関連するディスクの状態が DISABLE または SWAP 状態になると、スライスへの操作を抑止するために NOUSE 状態となります。
ディスクの DISABLE または SWAP 状態を復旧させてください。詳しくは、「ディスク状態に関する異常」を参照してください。
目次
![]() ![]() |