PRIMECLUSTER Global Disk Services 説明書 4.2 (Linux版)
目次 前ページ次ページ

付録F トラブルシューティング> F.1 トラブルへの対処方法

F.1.1 スライス状態に関する異常

スライスの状態が以下に該当する場合は、それぞれに記載されている対処を行ってください。

(1) ミラーボリュームを構成するミラースライスが INVALID 状態である。

[説明]

ボリュームを構成するスライスの状態は次の方法で確認できます。

# sdxinfo -S -o Volume1
OBJ    CLASS   GROUP   DISK    VOLUME   STATUS
------ ------- ------- ------- -------- --------
slice  Class1  Group1  Object1 Volume1  ACTIVE
slice  Class1  Group1  Object2 Volume1  INVALID

この例では、ボリューム Volume1 を構成するスライスのうち、Object2 に存在するスライスが、STATUS フィールドに示されているとおり INVALID 状態になっています。Object2 は、最上位ミラーグループ Group1 に接続されているディスクまたは下位グループです。

ミラースライス Volume1.Object2 が INVALID 状態となる原因として、次の 5 通りの原因が考えられます。

[対処]

1) sdxinfo コマンドを使って、異常が発生しているディスクの物理ディスク名を特定します。

(例 A1)

# sdxinfo -G -o Volume1
OBJ    NAME    CLASS   DISKS               BLKS     FREEBLKS SPARE
------ ------- ------- ------------------- -------- -------- -----
group  Group1  Class1  Object1:Object2     17596416 17498112     0
# sdxinfo -D -o Volume1 -e long
OBJ    NAME    TYPE   CLASS   GROUP   DEVNAM  DEVBLKS  FREEBLKS DEVCONNECT       STATUS  E
------ ------- ------ ------- ------- ------- -------- -------- ---------------- ------- -----
disk   Object1 mirror Class1  Group1   sda    17596416 *        node1:node2      ENABLE  0
disk   Object2 mirror Class1  Group1   sdb    17596416 *        node1:node2      ENABLE  1

この例では、Object2 は最上位グループ Group1 に接続されているディスクです。E フィールドに示されているとおり、ディスク Object2 で I/O エラーが発生しており、(原因 a) または (原因 b) に該当します。ディスク Object2 の物理ディスク名は、DEVNAM フィールドに示されているとおり sdb です。

(例 A1) において、INVALID 状態のスライスが存在するディスク Object2 の E フィールドの値が 0 であり、かつ、ディスク Object2 とミラーリングされているディスク Object1 の E フィールドの値が 1 である場合は、ディスク Object1 で I/O エラーが発生しており、(原因 a') または (原因 b') に該当します。この場合は、「(2) 等価性コピー処理中にコピー元スライスで I/O エラーが発生して、コピー先スライスが INVALID 状態になった。」を参照して復旧を行ってください。

また、(例 A1) において E フィールドが 1 のディスクが 1 つも存在しない場合は、(原因 c) に該当します。

(例 B1)

# sdxinfo -G -o Volume1
OBJ    NAME    CLASS   DISKS               BLKS     FREEBLKS SPARE
------ ------- ------- ------------------- -------- -------- -----
group  Group1  Class1  Object1:Object2     35127296 35028992     0
group  Object1 Class1  Disk1:Disk2         35127296 *            *
group  Object2 Class1  Disk3:Disk4         35127296 *            *
# sdxinfo -D -o Volume1 -e long
OBJ    NAME    TYPE   CLASS   GROUP   DEVNAM  DEVBLKS  FREEBLKS DEVCONNECT       STATUS  E
------ ------- ------ ------- ------- ------- -------- -------- ---------------- ------- -----
disk   Disk1   stripe Class1  Object1  sda    17596416 *        node1:node2      ENABLE  0
disk   Disk2   stripe Class1  Object1  sdb    17596416 *        node1:node2      ENABLE  0
disk   Disk3   stripe Class1  Object2  sdc    17682084 *        node1:node2      ENABLE  1
disk   Disk4   stripe Class1  Object2  sdd    17682084 *        node1:node2      ENABLE  0

この例では、Object2 は最上位グループ Group1 に接続されている下位グループです。E フィールドに示されているとおり、Object2 に接続されているディスク Disk3 で I/O エラーが発生しており、(原因 a) または (原因 b) に該当します。Disk3 に対応する物理ディスク名は、DEVNAM フィールドに示されているとおり sdc です。

(例 B1) において、INVALID 状態のスライスが存在する下位グループ Object2 に接続されているディスク (Disk3 および Disk4) の E フィールドの値が 0 であり、かつ、下位グループ Object2 とミラーリングされている下位グループ Object1 に接続されているディスク (Disk1 または Disk2) の E フィールドの値が 1 である場合は、Object1 に接続されているディスクで I/O エラーが発生しており、(原因 a') または (原因 b') に該当します。この場合は、「(2) 等価性コピー処理中にコピー元スライスで I/O エラーが発生して、コピー先スライスが INVALID 状態になった。」を参照して復旧を行ってください。

(例 B1) で E フィールドが 1 のディスクが存在しない場合は、(原因 c) に該当します。

 

2) 物理ディスクの異常について、ディスクドライバのログメッセージなどをもとにして確認します。

ディスクのハードウェア故障のなかには、I/O アダプタ、I/O ケーブル、I/O コントローラ、電源、ファンなど、ディスク以外にもさまざまな部品の故障あるいは不良が原因として考えられます。

当社の技術員へ連絡して、故障または不良箇所を特定してください。

故障および不良箇所が無い場合は、(原因 c) に該当します。

以下では、原因 a, b, c の 3 つの場合に分けて、対処方法を説明します。


a. (原因 a) に該当する場合

a1) ディスクの交換を行う前と交換後に以下の操作が必要です。運用管理ビューを使ったディスク交換手順については、「ディスク交換」を参照してください。

ディスクを交換する前には、次の操作を行ってください。

(例 A1)

# sdxswap -O -c Class1 -d Object2

この例では、最上位グループ Group1 に接続されているディスク Object2 を交換します。

(例 B1)

# sdxswap -O -c Class1 -d Disk3

この例では、最上位グループ Group1 の下位グループ Object2 に接続されているディスク Disk3 を交換します。

a2) ディスクを交換してください。

a3) 交換が完了した後に、次の操作を行ってください。

(例 A3)

# sdxswap -I -c Class1 -d Object2

または、

(例 B3)

# sdxswap -I -c Class1 -d Disk3

a4) 手順 3) に従って、スライスの状態を確認します。


b. (原因 b) に該当する場合

b1) いったんシステムをシャットダウンして、故障箇所を修復した後にブートしてください。自動的に等価性コピーが行われてミラーリング状態を回復します。

b2) 手順 3) に従って、スライスの状態を確認します。


c. (原因 c) に該当する場合

c1) ミラーボリュームの等価性コピーを実行します。

# sdxcopy -B -c Class1 -v Volume1

c2) 手順 3) に従って、スライスの状態を確認します。

 

3) ボリュームを構成するスライスの状態が復旧できたかどうかは、以下の方法で確認できます。

# sdxinfo -S -o Volume1
OBJ    CLASS   GROUP   DISK    VOLUME  STATUS
------ ------- ------- ------- ------- --------
slice  Class1  Group1  Object1 Volume1 ACTIVE
slice  Class1  Group1  Object2 Volume1 ACTIVE

この例では、Object1 および Object2 内のスライスは、いずれも ACTIVE 状態であり、復旧処理が完了したことを示しています。

 

(2) 等価性コピー処理中にコピー元スライスで I/O エラーが発生して、コピー先スライスが INVALID 状態になった。

[説明]

等価性コピー処理中にコピー元スライスで I/O エラーが発生した場合、コピー元スライスは ACTIVE 状態のまま、コピー先スライスが INVALID 状態になります。

原因として、以下の 2 つが考えられます。

(原因 a)
等価性コピー処理中にコピー元のディスク部品が故障して、コピー元のスライスで I/O エラーが発生した。
(原因 b)
等価性コピー処理中にコピー元のディスク以外の部品 (I/O アダプタ、I/O ケーブル、I/O コントローラ、電源、ファンなど) が故障して、コピー元のスライスで I/O エラーが発生した。

この現象に該当するかどうかを判定し、異常が発生しているディスクの物理ディスク名を特定する方法については、「(1) ミラーボリュームを構成するミラースライスが INVALID 状態である。」の [説明] と [対処] の手順 1) を参照してください。

[対処]

まず、物理ディスクの異常について、ディスクドライバのログメッセージなどをもとにして確認します。当社の技術員へ連絡して、故障または不良箇所を特定してください。

(原因 b) に該当する場合は、いったんシステムをシャットダウンして、故障箇所を修復した後にブートしてください。自動的に等価性回復コピーが行われてミラーリング状態が回復されます。

(原因 a) に該当する場合は、以下の手順で復旧します。次の 3 つの場合に分けて、手順を説明します。

A. / (ルート)、/usr、または /var の場合【Itanium】
B. swap 領域の場合【Itanium】
C. その他 (/ (ルート)、/usr、/var、swap 以外) の場合

以下では、クラス名が Class1、 ボリューム名が Volume1、 故障したコピー元のディスク名が Disk1、 コピー先のディスク名が Disk2 である場合の復旧手順を例として示します。

# sdxinfo -S -o Volume1
OBJ    CLASS   GROUP   DISK    VOLUME  STATUS
------ ------- ------- ------- ------- --------
slice  Class1  Group1  Disk1   Volume1 ACTIVE
slice  Class1  Group1  Disk2   Volume1 INVALID
# sdxinfo -G -o Volume1
OBJ    NAME    CLASS   DISKS               BLKS     FREEBLKS SPARE
------ ------- ------- ------------------- -------- -------- -----
group  Group1  Class1  Disk1:Disk2         17596416 17498112     0
# sdxinfo -D -o Volume1 -e long
OBJ    NAME    TYPE   CLASS   GROUP   DEVNAM  DEVBLKS  FREEBLKS DEVCONNECT       STATUS  E
------ ------- ------ ------- ------- ------- -------- -------- ---------------- ------- -----
disk   Disk1   mirror Class1  Group1   sda    17596416 *        node1:node2      ENABLE  1
disk   Disk2   mirror Class1  Group1   sdb    17596416 *        node1:node2      ENABLE  0

 

A. / (ルート)、/usr、または /var の場合【Itanium】

当社技術員に連絡してください。

 

B. swap 領域の場合【Itanium】

B.1) ボリュームを swap 領域から削除します。

# swapoff /dev/sfdsk/Class1/dsk/Volume1

ボリュームを構成するディスクの故障箇所や故障の程度によっては、I/O エラーのために swapoff(8) コマンドが失敗する場合があります。この場合は、以下の B.1.1)、B.1.2) の手順で、ボリュームを swap 領域から削除します。

B.1.1) システム再起動後にボリュームを swap 領域として使用しないようにするため、/etc/fstab ファイルの /dev/sfdsk/Class1/dsk/Volume1 の行をコメントアウトします。

# vim /etc/fstab
編集前:
/dev/sfdsk/Class1/dsk/Volume1   swap            swap    defaults     0 0

編集後:
#/dev/sfdsk/Class1/dsk/Volume1   swap           swap    defaults     0 0
B.1.2) システムを再起動します。

# shutdown -r now

B.2) ボリュームを停止します。

# sdxvolume -F -c Class1 -v Volume1

B.3) INVALID 状態になったコピー先のスライスの状態を復旧します。

# sdxfix -V -c Class1 -d Disk2 -v Volume1

B.4) 復旧したコピー先のスライスが STOP 状態、コピー元のスライスが INVALID 状態になったことを確認します。

# sdxinfo -S -o Volume1
OBJ    CLASS   GROUP   DISK    VOLUME  STATUS
------ ------- ------- ------- ------- --------
slice  Class1  Group1  Disk1   Volume1 INVALID
slice  Class1  Group1  Disk2   Volume1 STOP

B.5) ボリュームを起動します。

# sdxvolume -N -c Class1 -v Volume1

B.6) ボリュームを再度 swap 領域に追加します。

# swapon /dev/sfdsk/Class1/dsk/Volume1
手順 B.1.1) を実行した場合は、/etc/fstab ファイルの内容を元に戻します。

# vim /etc/fstab
編集前:
#/dev/sfdsk/Class1/dsk/Volume1  swap            swap    defaults     0 0  

編集後:
/dev/sfdsk/Class1/dsk/Volume1  swap            swap    defaults     0 0  

B.7) 故障したコピー元のディスクを GDS の管理から切り離して、交換可能な状態にします。

# sdxswap -O -c Class1 -d Disk1

B.8) 故障したコピー元のディスクを交換します。

B.9) 交換したディスクを GDS の管理下に組み込んで、使用可能な状態に戻します。

# sdxswap -I -c Class1 -d Disk1

 

C. その他(/ (ルート)、/usr、/var、swap 以外) の場合

C.1) ボリュームを使用しているアプリケーションを停止します。

C.2) ボリューム上のファイルシステムがマウントされている場合は、アンマウントします。

ここでは、ボリュームが ext3 ファイルシステムとして使用されている場合の例を示します。

# umount /dev/sfdsk/Class1/dsk/Volume1

ボリュームを構成するディスクの故障箇所や故障の程度によっては、I/O エラーのために umount コマンドが失敗する場合があります。この場合、C.2.1) 〜 C.2.3) 手順を実行することにより、ファイルシステムをアンマウントします。

C.2.1) クラス Class1 がクラスタアプリケーションに登録されている場合は、そのクラスタアプリケーションを削除します。
C.2.2) システム再起動後にボリュームをマウントしないようにするため、/etc/fstab/ ファイルの /dev/sfdsk/Class1/dsk/Volume1 の行をコメントアウトします。
C.2.3) システムを再起動します。

C.3) ボリュームを停止します。

# sdxvolume -F -c Class1 -v Volume1

C.4) INVALID 状態になったコピー先のスライスの状態を復旧します。

# sdxfix -V -c Class1 -d Disk2 -v Volume1

C.5) 復旧したコピー先のスライスが STOP 状態、コピー元のスライスが INVALID 状態になったことを確認します。

# sdxinfo -S -o Volume1
OBJ    CLASS   GROUP   DISK    VOLUME  STATUS
------ ------- ------- ------- ------- --------
slice  Class1  Group1  Disk1   Volume1 INVALID
slice  Class1  Group1  Disk2   Volume1 STOP

C.6) ボリュームを起動します。

# sdxvolume -N -c Class1 -v Volume1

C.7) ボリュームのデータは整合性が失われている可能性があります。必要に応じて、バックアップデータのリストア、または fsck(8) コマンドによる修復を行ってください。



システムダウン後の高速等価性回復コピー処理中にコピー元スライスで I/O エラーが発生した場合は、fsck(8) コマンドで修復できる可能性があります。
手順 C.2.2) を実行した場合は、/etc/fstab ファイルの内容を元に戻します。
手順 C.2.1) を実行した場合は、手順 C.2.1) で削除したクラスタアプリケーションを再度作成します。

C.8) 故障したコピー元ディスクを GDS の管理下から切り離して、交換可能な状態にします。

# sdxswap -O -c Class1 -d Disk1

C.9) 故障したコピー元のディスクを交換します。

C.10) 交換したディスクを GDS の管理下に組み込んで、使用可能な状態に戻します。

# sdxswap -I -c Class1 -d Disk1

 

(3) ボリュームを構成するスライスが TEMP 状態である。

[説明]

sdxslice コマンドにより、スライスの切り離しを行った後、組み込みが行われていないためです。または、運用管理ビューで「スライス切離し」の操作を行った後、「スライス組込み」を行っていないためです。

[対処]

必要に応じて、sdxslice コマンドによるスライスの組み込み、あるいは、運用管理ビューによる「スライス組込み」の操作を行ってください。

 

(4) ボリュームを構成するスライスが TEMP-STOP 状態である。

[説明]

sdxslice コマンドにより、スライスの停止を行った後で起動が行われていないか、または、切離しを行ったノードが自ノードではないためです。あるいは、運用管理ビューで「スライス停止」の操作を行った後、「スライス起動」の操作を行っていないためです。

[対処]

必要に応じて、sdxslice コマンドによるスライスの起動またはスライスの引継ぎ、あるいは運用管理ビューによる「スライス起動」の操作を行ってください。

 

(5) ボリュームを構成するスライスが COPY 状態である。

[説明]

スライスを組み込むために、等価性コピー処理を行っています。または、マスタとプロキシの間で等価性コピー処理を行っています。

[対処]

等価性コピー処理が完了するまで、しばらくお待ちください。なお、等価性コピー処理中のスライスがあった場合でも、ボリュームが起動されていれば、アクセス可能です。

 

(6) ボリュームを構成するスライスが NOUSE 状態である。

[説明]

スライスに関連するディスクの状態が DISABLE または SWAP 状態になると、スライスへの操作を抑止するために NOUSE 状態となります。

[対処]

ディスクの DISABLE または SWAP 状態を復旧させてください。詳しくは、「ディスク状態に関する異常」を参照してください。



目次 前ページ次ページ

All Rights Reserved, Copyright(C) 富士通株式会社 2006, 2007