PRIMECLUSTER Global Disk Services 説明書 4.1 (Linux版)
目次 前ページ次ページ

付録F トラブルシューティング> F.1 トラブルへの対処方法

F.1.1 スライス状態に関する異常


 

(1) ミラーボリュームを構成するミラースライスがINVALID状態である。

 

[説明]

ボリュームを構成するスライスの状態は次の方法で確認できます。

# sdxinfo -S -o Volume1

OBJ    CLASS   GROUP   DISK    VOLUME   STATUS
------ ------- ------- ------- -------- --------
slice  Class1  Group1  Object1 Volume1 ACTIVE
slice  Class1  Group1  Object2 Volume1 INVALID

 

この例では、ボリューム Volume1 を構成するスライスのうち、Object2 に存在するスライスが、STATUS フィールドに示されているとおり INVALID 状態になっています。Object2 は、最上位ミラーグループ Group1 に接続されているディスクまたは下位グループです。

ミラースライスVolume1.Object2がINVALID状態となる原因として、次の5つが考えられます。

[対処]

1) sdxinfoコマンドを使って、異常が発生しているディスクの物理ディスク名を特定します。

(例A1)

# sdxinfo -G -o Volume1

OBJ    NAME    CLASS   DISKS               BLKS     FREEBLKS SPARE
------ ------- ------- ------------------- -------- -------- -----
group  Group1  Class1  Object1:Object2     17596416 17498112     0

# sdxinfo -D -o Volume1 -e long

OBJ    NAME    TYPE   CLASS   GROUP   DEVNAM  DEVBLKS  FREEBLKS DEVCONNECT       STATUS  E
------ ------- ------ ------- ------- ------- -------- -------- ---------------- ------- -----
disk   Object1 mirror Class1  Group1   sda    17596416 *        node1:node2      ENABLE  0
disk   Object2 mirror Class1  Group1   sdb    17596416 *        node1:node2      ENABLE  1

 

この例では、Object2 は最上位グループ Group1 に接続されているディスクです。Eフィールドに示されているとおり、ディスク Object2 でI/Oエラーが発生しており、(原因a)または(原因b)に該当します。ディスク Object2 の物理ディスク名は、DEVNAMフィールドに示されているとおりsdbです。

例A1において、INVALID状態のスライスが存在するディスク Object2 のEフィールドの値が0であり、かつ、ディスク Object2 とミラーリングされているディスク Object1 のEフィールドの値が1である場合は、ディスク Object1 でI/O エラーが発生しており、(原因a')または(原因b')に該当します。この場合は、「(2)等価性コピー処理中にコピー元スライスでI/Oエラーが発生して、コピー先スライスがINVALID状態になった」を参照して復旧を行ってください。

また、(例A1)においてEフィールドが1のディスクが1つも存在しない場合は、(原因c)に該当します。

(例B1)

# sdxinfo -G -o Volume1

OBJ    NAME    CLASS   DISKS               BLKS     FREEBLKS SPARE
------ ------- ------- ------------------- -------- -------- -----
group  Group1  Class1  Object1:Object2     35127296 35028992     0
group  Object1 Class1  Disk1:Disk2         35127296 *            *
group  Object2 Class1  Disk3:Disk4         35127296 *            *

# sdxinfo -D -o Volume1 -e long

OBJ    NAME    TYPE   CLASS   GROUP   DEVNAM  DEVBLKS  FREEBLKS DEVCONNECT       STATUS  E
------ ------- ------ ------- ------- ------- -------- -------- ---------------- ------- -----
disk   Disk1   stripe Class1  Object1  sda    17596416 *        node1:node2      ENABLE  0
disk   Disk2   stripe Class1  Object1  sdb    17596416 *        node1:node2      ENABLE  0
disk   Disk3   stripe Class1  Object2  sdc    17682084 *        node1:node2      ENABLE  1
disk   Disk4   stripe Class1  Object2  sdd    17682084 *        node1:node2      ENABLE  0

この例では、Object2 は最上位グループ Group1 に接続されている下位グループです。E フィールドに示されているとおり、Object2 に接続されているディスク Disk3 でI/Oエラーが発生しており、(原因a)または(原因b)に該当します。Disk3 に対応する物理ディスク名は、DEVNAMフィールドに示されているとおりsdcです。

(例B1)において、INVALID状態のスライスが存在する下位グループ Object2 に接続されているディスク(Disk3 および Disk4)のEフィールドの値が0であり、かつ、下位グループ Object2 とミラーリングされている下位グループ Object1 に接続されているディスク(Disk1 または Disk2)のEフィールドの値が1である場合は、Object1 に接続されているディスクでI/Oエラーが発生しており、(原因a')または(原因b')に該当します。この場合は、「(2)等価性コピー処理中にコピー元スライスでI/Oエラーが発生して、コピー先スライスがINVALID状態になった」を参照して復旧を行ってください。

(例B1)でEフィールドが1のディスクが存在しない場合は、原因cに該当します。

 

2) 物理ディスクの異常について、ディスクドライバのログメッセージなどをもとにして確認します。

ディスクのハードウェア故障のなかには、I/Oアダプタ、I/Oケーブル、I/Oコントローラ、電源、ファンなど、ディスク以外にもさまざまな部品の故障あるいは不良が原因として考えられます。

当社の技術員へ連絡して、故障または不良箇所を特定してください。

故障および不良箇所が無い場合は、(原因c)に該当します。

(原因a)に該当する場合は手順3a)〜5a)と手順6)、(原因b)に該当する場合は手順3b)と手順6)、(原因c)に該当する場合は手順3c)と手順6)を実施してください。

 

3a) (原因a)に該当する場合、ディスクの交換を行う前と交換後に以下の操作が必要です。運用管理ビューを使ったディスク交換手順については、「ディスク交換」を参照してください。

ディスクを交換する前には、次の操作を行ってください。

(例A3)

# sdxswap -O -c Class1 -d Object2

 

この例では、最上位グループ Group1 に接続されているディスク Object2 を交換します。

 

(例B3)

# sdxswap -O -c Class1 -d Disk3

 

この例では、最上位グループ Group1 の下位グループ Object2 に接続されているディスク Disk3 を交換します。

 

4a) ディスクを交換してください。

 

5a) 交換が完了した後に、次の操作を行ってください。

(例A5)

# sdxswap -I -c Class1 -d Object2

 

または、

 

(例B5)

# sdxswap -I -c Class1 -d Disk3

 

3b) 原因bに該当する場合は、いったんシステムをシャットダウンして、故障箇所を修復した後にブートしてください。自動的に等価性コピーが行われてミラーリング状態を回復します。

 

3c) 原因cに該当する場合は、ミラーボリュームの等価性コピーを実行します。

# sdxcopy -B -c Class1 -v Volume1

 

6) ボリュームを構成するスライスの状態が復旧できたかどうかは、以下の方法で確認できます。

# sdxinfo -S -o Volume1

OBJ    CLASS   GROUP   DISK    VOLUME  STATUS
------ ------- ------- ------- ------- --------
slice  Class1  Group1  Object1 Volume1 ACTIVE
slice  Class1  Group1  Object2 Volume1 ACTIVE

この例では、Object1 および Object2 内のスライスは、いずれもACTIVE状態であり、復旧処理が完了したことを示しています。

 


 

(2) 等価性コピー処理中にコピー元スライスでI/Oエラーが発生して、コピー先スライスがINVALID状態になった。

 

[説明]

等価性コピー処理中にコピー元スライスでI/Oエラーが発生した場合、コピー元スライスはACTIVE状態のまま、コピー先スライスがINVALID状態になります。

原因として、以下の2つが考えられます。

(原因a)
等価性コピー処理中にコピー元のディスク部品が故障して、コピー元のスライスでI/Oエラーが発生した。
(原因b)
等価性コピー処理中にコピー元のディスク以外の部品(I/Oアダプタ、I/Oケーブル、I/Oコントローラ、電源、ファンなど)が故障して、コピー元ののスライスでI/Oエラーが発生した。

この現象に該当するかどうかを判定し、異常が発生しているディスクの物理ディスク名を特定する方法については、「(1)ミラーボリュームを構成するミラースライスがINVALID状態である。」の[説明]と[対処]の手順1)を参照してください。

[対処]

まず、物理ディスクの異常について、ディスクドライバのログメッセージなどをもとにして確認します。当社の技術員へ連絡して、故障または不良箇所を特定してください。

(原因b)に該当する場合は、いったんシステムをシャットダウンして、故障箇所を修復した後にブートしてください。自動的に等価性回復コピーが行われてミラーリング状態が回復されます。

(原因a)に該当する場合は、以下の手順で復旧します。

以下では、クラス名が Class1, ボリューム名が Volume1, 故障したコピー元のディスク名が Disk1, コピー先のディスク名が Disk2 である場合の復旧手順を例として示します。

# sdxinfo -S -o Volume1

OBJ    CLASS   GROUP   DISK    VOLUME  STATUS
------ ------- ------- ------- ------- --------
slice  Class1  Group1  Disk1   Volume1 ACTIVE
slice  Class1  Group1  Disk2   Volume1 INVALID

# sdxinfo -G -o Volume1

OBJ    NAME    CLASS   DISKS               BLKS     FREEBLKS SPARE
 ------ ------- ------- ------------------- -------- -------- -----
 group  Group1  Class1  Disk1:Disk2         17596416 17498112     0

# sdxinfo -D -o Volume1 -e long

OBJ    NAME    TYPE   CLASS   GROUP   DEVNAM  DEVBLKS  FREEBLKS DEVCONNECT       STATUS  E
------ ------- ------ ------- ------- ------- -------- -------- ---------------- ------- -----
disk   Disk1   mirror Class1  Group1   sda    17596416 *        node1:node2      ENABLE  1
disk   Disk2   mirror Class1  Group1   sdb    17596416 *        node1:node2      ENABLE  0

 

1) ボリュームを使用しているアプリケーションを停止します。

 

2) ボリューム上のファイルシステムがマウントされている場合は、アンマウントします。

ここでは、ボリュームが ext3 ファイルシステムとして使用されている場合の例を示します。

# umount /dev/sfdsk/Class1/dsk/Volume1

ボリュームを構成するディスクの故障箇所や故障の程度によっては、I/Oエラーのために umount コマンドが失敗する場合があります。この場合、2-1)〜2-3)の手順を実行することにより、ファイルシステムをアンマウントします。

2-1) クラス Class1 がクラスタアプリケーションに登録されている場合は、そのクラスタアプリケーションを削除します。

2-2) システム再起動後にボリュームをマウントしないようにするため、/etc/fstab/ファイルの /dev/sfdsk/Class1/dsk/Volume1 の行をコメントアウトします。

2-3) システムを再起動します。

3) ボリュームを停止します。

# sdxvolume -F -c Class1 -v Volume1 -e allnodes

4) INVALID状態になったコピー先のスライスの状態を復旧します。

# sdxfix -V -c Class1 -d Disk2 -v Volume1

5) 復旧したコピー先のスライスがSTOP状態、コピー元のスライスがINVALID状態になったことを確認します。

# sdxinfo -S -o Volume1

OBJ    CLASS   GROUP   DISK    VOLUME  STATUS
------ ------- ------- ------- ------- --------
slice  Class1  Group1  Disk1   Volume1 INVALID
slice  Class1  Group1  Disk2   Volume1 STOP

6) ボリュームを起動します。

# sdxvolume -N -c Class1 -v Volume1

7) ボリュームのデータは整合性が失われている可能性があります。必要に応じて、バックアップデータのリストア、またはfsck(8)コマンドによる修復を行ってください。


システムダウン後の高速等価性回復コピー処理中にコピー元スライスでI/Oエラーが発生した場合は、fsck(8)コマンドで修復できる可能性があります。

手順 2-2)を実行した場合は、/etc/fstabファイルの内容を元に戻します。

手順 2-1)を実行した場合は、手順 2-1)で削除したクラスタアプリケーションを再度作成します。

8) 故障したコピー元ディスクをGDSの管理下から切り離して、交換可能な状態にします。

# sdxswap -O -c Class1 -d Disk1

9) 故障したコピー元のディスクを交換します。

10) 交換したディスクをGDSの管理下に組み込んで、使用可能な状態に戻します。

# sdxswap -I -c Class1 -d Disk1


 

(3) ボリュームを構成するスライスがTEMP状態である。

 

[説明]

sdxsliceコマンドにより、スライスの切り離しを行った後、組み込みが行われていないためです。または、運用管理ビューで「スライス切離し」の操作を行った後、「スライス組込み」を行っていないためです。

[対処]

必要に応じて、sdxsliceコマンドによるスライスの組み込み、あるいは、運用管理ビューによる「スライス組込み」の操作を行ってください。

 


 

(4) ボリュームを構成するスライスがTEMP-STOP状態である。

 

[説明]

sdxsliceコマンドにより、スライスの停止を行った後で起動が行われていないか、または、切離しを行ったノードが自ノードではないためです。あるいは、運用管理ビューで「スライス停止」の操作を行った後、「スライス起動」の操作を行っていないためです。

[対処]

必要に応じて、sdxsliceコマンドによるスライスの起動またはスライスの引継ぎ、あるいは運用管理ビューによる「スライス起動」の操作を行ってください。

 


 

(5) ボリュームを構成するスライスがCOPY状態である。

 

[説明]

スライスを組み込むために、等価性コピー処理を行っています。

または、マスタとプロキシの間で等価性コピー処理を行っています。

[対処]

等価性コピー処理が完了するまで、しばらくお待ちください。なお、等価性コピー処理中のスライスがあった場合でも、ボリュームが起動されていれば、アクセス可能です。

 


 

(6) ボリュームを構成するスライスがNOUSE状態である。

 

[説明]

スライスに関連するディスクの状態がDISABLEまたはSWAP状態になると、スライスへの操作を抑止するためにNOUSE状態となります。

[対処]

ディスクのDISABLEまたはSWAP状態を復旧させてください。詳しくは、「ディスク状態に関する異常」を参照してください。

 


目次 前ページ次ページ

All Rights Reserved, Copyright(C) 富士通株式会社 2005