PRIMECLUSTER Global Disk Services 説明書 4.1 (Solaris(TM) オペレーティングシステム版) |
目次
![]() ![]() |
付録F トラブルシューティング | > F.1 トラブルへの対処方法 |
スライスの状態が以下に該当する場合は、それぞれに記載されている対処を行ってください。
ボリュームを構成するスライスの状態は次の方法で確認できます。
# sdxinfo -S -o Volume1 OBJ CLASS GROUP DISK VOLUME STATUS ------ ------- ------- ------- -------- -------- slice Class1 Group1 Object1 Volume1 ACTIVE slice Class1 Group1 Object2 Volume1 INVALID |
この例では、ボリューム Volume1 を構成するスライスのうち、Object2 に存在するスライスが、STATUS フィールドに示されているとおり INVALID 状態になっています。Object2 は、最上位ミラーグループ Group1 に接続されているディスクまたは下位グループです。
ミラースライスVolume1.Object2がINVALID状態となる原因として、次の 5 通りの原因が考えられます。
ミラースライスVolume1.Object2でI/Oエラーが発生した。
ミラースライス Volume1.Object2 への等価性コピー処理中に、コピー元のスライス Volume1.Object1 でI/Oエラーが発生した。
その他
1) sdxinfoコマンドを使って、異常が発生しているディスクの物理ディスク名を特定します。
(例A1)
# sdxinfo -G -o Volume1 OBJ NAME CLASS DISKS BLKS FREEBLKS SPARE ------ ------- ------- ------------------- -------- -------- ----- group Group1 Class1 Object1:Object2 17596416 17498112 0 # sdxinfo -D -o Volume1 -e long OBJ NAME TYPE CLASS GROUP DEVNAM DEVBLKS FREEBLKS DEVCONNECT STATUS E ------ ------- ------ ------- ------- ------- -------- -------- ---------------- ------- ----- disk Object1 mirror Class1 Group1 c1t1d0 17596416 * node1 ENABLE 0 disk Object2 mirror Class1 Group1 c2t3d0 17596416 * node1 ENABLE 1 |
この例では、Object2 は最上位グループ Group1 に接続されているディスクです。Eフィールドに示されているとおり、ディスク Object2 でI/Oエラーが発生しており、(原因a)または(原因b)に該当します。ディスク Object2 の物理ディスク名は、DEVNAMフィールドに示されているとおりc2t3d0です。
例A1において、INVALID状態のスライスが存在するディスク Object2 のEフィールドの値が0であり、かつ、ディスク Object2 とミラーリングされているディスク Object1 のEフィールドの値が1である場合は、ディスク Object1 でI/O エラーが発生しており、(原因a')または(原因b')に該当します。この場合は、「(2)等価性コピー処理中にコピー元スライスでI/Oエラーが発生して、コピー先スライスがINVALID状態になった。」を参照して復旧を行ってください。
また、(例A1)においてEフィールドが1のディスクが1つも存在しない場合は、(原因c)に該当します。
(例B1)
# sdxinfo -G -o Volume1 OBJ NAME CLASS DISKS BLKS FREEBLKS SPARE ------ ------- ------- ------------------- -------- -------- ----- group Group1 Class1 Object1:Object2 35127296 35028992 0 group Object1 Class1 Disk1:Disk2 35127296 * * group Object2 Class1 Disk3:Disk4 35127296 * * # sdxinfo -D -o Volume1 -e long OBJ NAME TYPE CLASS GROUP DEVNAM DEVBLKS FREEBLKS DEVCONNECT STATUS E ------ ------- ------ ------- ------- ------- -------- -------- ---------------- ------- ----- disk Disk1 stripe Class1 Object1 c1t1d0 17596416 * node1 ENABLE 0 disk Disk2 stripe Class1 Object1 c1t2d0 17596416 * node1 ENABLE 0 disk Disk3 stripe Class1 Object2 c2t3d0 17682084 * node1 ENABLE 1 disk Disk4 stripe Class1 Object2 c2t4d0 17682084 * node1 ENABLE 0 |
この例では、Object2 は最上位グループ Group1 に接続されている下位グループです。E フィールドに示されているとおり、Object2 に接続されているディスク Disk3 でI/Oエラーが発生しており、(原因a)または(原因b)に該当します。Disk3 に対応する物理ディスク名は、DEVNAMフィールドに示されているとおりc2t3d0です。
(例B1)において、INVALID状態のスライスが存在する下位グループ Object2 に接続されているディスク(Disk3 および Disk4)のEフィールドの値が0であり、かつ、下位グループ Object2 とミラーリングされている下位グループ Object1 に接続されているディスク(Disk1 または Disk2)のEフィールドの値が1である場合は、Object1 に接続されているディスクでI/Oエラーが発生しており、(原因a')または(原因b')に該当します。この場合は、「(2)等価性コピー処理中にコピー元スライスでI/Oエラーが発生して、コピー先スライスがINVALID状態になった。」を参照して復旧を行ってください。
(例B1)でEフィールドが1のディスクが存在しない場合は、原因cに該当します。
2) 物理ディスクの異常について、ディスクドライバのログメッセージなどをもとにして確認します。
ディスクのハードウェア故障のなかには、I/Oアダプタ、I/Oケーブル、I/Oコントローラ、電源、ファンなど、ディスク以外にもさまざまな部品の故障あるいは不良が原因として考えられます。
当社の技術員へ連絡して、故障または不良箇所を特定してください。
故障および不良箇所が無い場合は、(原因c)に該当します。
以下では、原因a, b, cの3つの場合に分けて、対処方法を説明します。
a. (原因a)に該当する場合
a1)ディスクの交換を行う前と交換後に以下の操作が必要です。運用管理ビューを使ったディスク交換手順については、「ディスク交換」を参照してください。
ディスクを交換する前には、次の操作を行ってください。
(例A1)
# sdxswap -O -c Class1 -d Object2 |
この例では、最上位グループ Group1 に接続されているディスク Object2 を交換します。
(例B1)
# sdxswap -O -c Class1 -d Disk3 |
この例では、最上位グループ Group1 の下位グループ Object2 に接続されているディスク Disk3 を交換します。
a2) ディスクを交換してください。
a3) 交換が完了した後に、次の操作を行ってください。
(例A3)
# sdxswap -I -c Class1 -d Object2 |
または、
(例B3)
# sdxswap -I -c Class1 -d Disk3 |
a4) 手順3)に従って、スライスの状態を確認します。
b. (原因b)に該当する場合
b1)いったんシステムをシャットダウンして、故障箇所を修復した後にブートしてください。自動的に等価性コピーが行われてミラーリング状態を回復します。
b2) 手順3)に従って、スライスの状態を確認します。
c. (原因c)に該当する場合
c1)ミラーボリュームの等価性コピーを実行します。
# sdxcopy -B -c Class1 -v Volume1 |
c2) 手順3)に従って、スライスの状態を確認します。
3) ボリュームを構成するスライスの状態が復旧できたかどうかは、以下の方法で確認できます。
# sdxinfo -S -o Volume1 OBJ CLASS GROUP DISK VOLUME STATUS ------ ------- ------- ------- ------- -------- slice Class1 Group1 Object1 Volume1 ACTIVE slice Class1 Group1 Object2 Volume1 ACTIVE |
この例では、Object1 および Object2 内のスライスは、いずれもACTIVE状態であり、復旧処理が完了したことを示しています。
等価性コピー処理中にコピー元スライスでI/Oエラーが発生した場合、コピー元スライスはACTIVE状態のまま、コピー先スライスがINVALID状態になります。
原因として、以下の2つが考えられます。
この現象に該当するかどうかを判定し、異常が発生しているディスクの物理ディスク名を特定する方法については、「(1)ミラーボリュームを構成するミラースライスがINVALID状態である。」の[説明]と[対処]の手順1)を参照してください。
まず、物理ディスクの異常について、ディスクドライバのログメッセージなどをもとにして確認します。当社の技術員へ連絡して、故障または不良箇所を特定してください。
(原因b)に該当する場合は、いったんシステムをシャットダウンして、故障箇所を修復した後にブートしてください。自動的に等価性回復コピーが行われてミラーリング状態が回復されます。
(原因a)に該当する場合は、以下の手順で復旧します。次の 3 つの場合に分けて、手順を説明します。
A. /(ルート)、/usr、または/var の場合
B. swap領域の場合
C. その他(/(ルート)、 /usr、 /var、swap以外) の場合
以下では、クラス名が Class1、 ボリューム名が Volume1、 故障したコピー元のディスク名が Disk1、 コピー先のディスク名が Disk2 である場合の復旧手順を例として示します。
# sdxinfo -S -o Volume1 OBJ CLASS GROUP DISK VOLUME STATUS ------ ------- ------- ------- ------- -------- slice Class1 Group1 Disk1 Volume1 ACTIVE slice Class1 Group1 Disk2 Volume1 INVALID # sdxinfo -G -o Volume1 OBJ NAME CLASS DISKS BLKS FREEBLKS SPARE ------ ------- ------- ------------------- -------- -------- ----- group Group1 Class1 Disk1:Disk2 17596416 17498112 0 # sdxinfo -D -o Volume1 -e long OBJ NAME TYPE CLASS GROUP DEVNAM DEVBLKS FREEBLKS DEVCONNECT STATUS E ------ ------- ------ ------- ------- ------- -------- -------- ---------------- ------- ----- disk Disk1 mirror Class1 Group1 c1t1d0 17596416 * node1 ENABLE 1 disk Disk2 mirror Class1 Group1 c2t3d0 17596416 * node1 ENABLE 0 |
A. /(ルート)、/usr、または/var の場合
当社技術員に連絡してください。
B. swap 領域の場合
B.1) ボリュームを swap 領域から削除します。
# swap -d dev/sfdsk/Class1/dsk/Volume1 |
ボリュームを構成するディスクの故障箇所や故障の程度によっては、I/Oエラーのために swap -d コマンドが失敗する場合があります。この場合は、以下のB.1.1)、B.1.2)の手順で、ボリュームを swap 領域から削除します。
B.1.1) システム再起動後にボリュームを swap 領域として使用しないようにするため、/etc/vfstabファイルの/dev/sfdsk/Class1/dsk/Volume1 の行をコメントアウトします。
# vi /etc/vfstab 編集前: /dev/sfdsk/Class1/dsk/Volume1 - - swap - no - 編集後: #/dev/sfdsk/Class1/dsk/Volume1 - - swap - no - |
B.1.2) システムを再起動します。
# shutdown -y -i6 -g0 |
B.2) ボリュームを停止します。
# sdxvolume -F -c Class1 -v Volume1 |
B.3) INVALID状態になったコピー先のスライスの状態を復旧します。
# sdxfix -V -c Class1 -d Disk2 -v Volume1 |
B.4) 復旧したコピー先のスライスがSTOP状態、コピー元のスライスがINVALID状態になったことを確認します。
# sdxinfo -S -o Volume1 OBJ CLASS GROUP DISK VOLUME STATUS ------ ------- ------- ------- ------- -------- slice Class1 Group1 Disk1 Volume1 INVALID slice Class1 Group1 Disk2 Volume1 STOP |
B.5) ボリュームを起動します。
# sdxvolume -N -c Class1 -v Volume1 |
B.6) ボリュームを再度 swap 領域に追加します。
# swap -a /dev/sfdsk/Class1/dsk/Volume1 |
手順B.1.1) を実行した場合は、/etc/vfstab ファイルの内容を元に戻します。
# vi /etc/vfstab 編集前: #/dev/sfdsk/Class1/dsk/Volume1 - - swap - no - 編集後: /dev/sfdsk/Class1/dsk/Volume1 - - swap - no - |
B.7) 故障したコピー元のディスクをGDSの管理から切り離して、交換可能な状態にします。
# sdxswap -O -c Class1 -d Disk1 |
B.8) 故障したコピー元のディスクを交換します。
B.9) 交換したディスクをGDSの管理下に組み込んで、使用可能な状態に戻します。
# sdxswap -I -c Class1 -d Disk1 |
C. その他( /(ルート)、 /usr、 /var、 swap以外)の場合
C.1) ボリュームを使用しているアプリケーションを停止します。
C.2) ボリューム上のファイルシステムがマウントされている場合は、アンマウントします。
# umount /dev/sfdsk/Class1/dsk/Volume1 |
ボリュームを構成するディスクの故障箇所や故障の程度によっては、I/Oエラーのために umount コマンドが失敗する場合があります。この場合、-f オプションを指定して umount コマンドを再実行します。
C.3) ボリュームを停止します。
# sdxvolume -F -c Class1 -v Volume1 |
C.4) INVALID状態になったコピー先のスライスの状態を復旧します。
# sdxfix -V -c Class1 -d Disk2 -v Volume1 |
C.5) 復旧したコピー先のスライスがSTOP状態、コピー元のスライスがINVALID状態になったことを確認します。
# sdxinfo -S -o Volume1 OBJ CLASS GROUP DISK VOLUME STATUS ------ ------- ------- ------- ------- -------- slice Class1 Group1 Disk1 Volume1 INVALID slice Class1 Group1 Disk2 Volume1 STOP |
C.6) ボリュームを起動します。
# sdxvolume -N -c Class1 -v Volume1 |
C.7) ボリュームのデータは整合性が失われている可能性があります。必要に応じて、バックアップデータのリストア、または fsck(1M)コマンドによる修復を行ってください。
システムダウン後の高速等価性回復コピー処理中にコピー元スライスでI/Oエラーが発生した場合は、fsck(1M)コマンドで修復できる可能性があります。
C.8) 故障したコピー元ディスクをGDSの管理下から切り離して、交換可能な状態にします。
# sdxswap -O -c Class1 -d Disk1 |
C.9) 故障したコピー元のディスクを交換します。
C.10) 交換したディスクをGDSの管理下に組み込んで、使用可能な状態に戻します。
# sdxswap -I -c Class1 -d Disk1 |
sdxsliceコマンドにより、スライスの切り離しを行った後、組み込みが行われていないためです。または、運用管理ビューで「スライス切離し」の操作を行った後、「スライス組込み」を行っていないためです。
必要に応じて、sdxsliceコマンドによるスライスの組み込み、あるいは、運用管理ビューによる「スライス組込み」の操作を行ってください。
sdxsliceコマンドにより、スライスの停止を行った後で起動が行われていないか、または、切離しを行ったノードが自ノードではないためです。あるいは、運用管理ビューで「スライス停止」の操作を行った後、「スライス起動」の操作を行っていないためです。
必要に応じて、sdxsliceコマンドによるスライスの起動またはスライスの引継ぎ、あるいは運用管理ビューによる「スライス起動」の操作を行ってください。
スライスを組み込むために、等価性コピー処理を行っています。
または、マスタとプロキシの間で等価性コピー処理を行っています。
等価性コピー処理が完了するまで、しばらくお待ちください。なお、等価性コピー処理中のスライスがあった場合でも、ボリュームが起動されていれば、アクセス可能です。
スライスに関連するディスクの状態がDISABLEまたはSWAP状態になると、スライスへの操作を抑止するためにNOUSE状態となります。
ディスクのDISABLEまたはSWAP状態を復旧させてください。詳しくは、「ディスク状態に関する異常」を参照してください。
目次
![]() ![]() |