PRIMECLUSTER Global Disk Services 説明書 4.2 (Linux版)
目次 前ページ次ページ

付録F トラブルシューティング> F.1 トラブルへの対処方法

F.1.4 クラス状態に関する異常

クラスの状態が以下に該当する場合は、それぞれに記載されている対処を行ってください。

(1) 運用中にクラスが閉塞状態となる。

[説明]

クラス内のオブジェクトの構成や状態を格納している構成データベースの数が不足した場合、またはクラスタ環境でノード間の通信処理がエラーとなった場合に、クラスは閉塞状態となります。閉塞状態のクラスに存在しているオブジェクトには、一切アクセスすることができません。

構成データベースの不足は、以下の条件に合致した場合に発生します。

  1. ENABLE状態のディスクが2本以下であれば、正常にアクセス可能なディスクが存在しない場合

  2. ENABLE状態のディスクが3本から5本であれば、正常にアクセス可能なディスクが1本以下になってしまった場合

  3. ENABLE状態のディスクが6本以上であれば、正常にアクセス可能なディスクが2本以下になってしまった場合

ただし、ルートクラスの場合は、正常にアクセス可能なディスクが存在しなくならない限り、閉塞されません。

なお、EMC SymmetrixのBCVデバイスおよびターゲット(R2)デバイスは、コピー元のディスクのデータで上書きされるため、GDSの構成データベースを格納できません。したがって、BCVデバイスおよびターゲット(R2)デバイスは、上記の条件における「正常にアクセス可能なディスク」には該当しません。

 

[対処]

1) 運用中にクラスが閉塞したかどうかは、次の方法で確認できます。リブートあるいはsdxservdデーモンを再起動してしまうと確認できなくなるため注意してください。

 

# /etc/opt/FJSVsdx/bin/sdxdcdown
CLASS   DOWN REASON NDK NEN NDB NLDB DEVNAM
------- ---- ------ --- --- --- ---- --------------------------
Class1  no   -       10  10   8    0 sda:sdb:sdc:sdd:sde:sdf:sdg:sdh
Class2  yes  Comm    10  10   8    0 sdi:sdj:sdk:sdl:sdm:sdn:sdo:sdp
Class3  yes  FewDB   10  10   1    7 sdq
Class4  yes  NoDB    10  10   0    8 -

この例では、DOWNフィールドが yes である、Class2、Class3、および Class4 が閉塞状態で、REASONフィールドに示されている閉塞の原因は次のとおりです。

 

(原因1)
Comm ノード間通信が失敗しました
(原因2)
FewDB 有効な構成データベースの数が不足しています
(原因3)
NoDB 有効な構成データベースがまったくありません

 

2) 詳細原因によっては、復旧が困難となる場合がありますので、まず調査資料を必ず採取してください。

調査資料の採取方法については、「トラブル調査資料の採取方法」を参照してください。

以下では、次の2つの場合に分けて対処方法を説明します。

  1. 通信エラーで閉塞した場合

  2. 構成データベースの不足で閉塞した場合

     

3a) (原因1)に該当する場合、当社の技術員へ連絡してください。

 

3b) (原因2)または(原因3)に該当する場合、クラスに登録されているすべての(あるいは大半の)ディスクが異常となっています。

クラスに登録されているディスクは、以下の方法で確認できます。

# sdxinfo -D -c Class3
OBJ    NAME    TYPE   CLASS   GROUP   DEVNAM  DEVBLKS  DEVCONNECT       STATUS
------ ------- ------ ------- ------- ------- -------- ---------------- -------
disk   Disk31  mirror Class3  Group1   sda     8847360 *                ENABLE
disk   Disk32  mirror Class3  Group1   sdb     8847360 *                ENABLE
disk   Disk33  mirror Class3  Group2   sde     8847360 *                ENABLE
disk   Disk34  mirror Class3  Group2   sdf     8847360 *                ENABLE
disk   Disk35  mirror Class3  Group3   sdc    17793024 *                ENABLE
disk   Disk36  mirror Class3  Group3   sdg    17793024 *                ENABLE
disk   Disk37  mirror Class3  Group4   sdd    17793024 *                ENABLE
disk   Disk38  mirror Class3  Group4   sdh    17793024 *                ENABLE
disk   Disk39  spare  Class3  Group1   sdr    17793024 *                ENABLE
disk   Disk40  spare  Class3  *        sds    17727488 *                ENABLE

 

この例では、クラス Class3 に Disk31 から Disk40 までの10本のディスクが登録されています。DEVNAMフィールドに物理ディスク名が示されているので、これらの物理ディスクで発生している異常原因をディスクドライバのログメッセージなどをもとにして特定してください。異常原因は、次の2つに分けられます。

 

(故障1)
ディスク以外の部品が故障あるいは不良である場合
(故障2)
ディスク部品が故障している場合

 

4b) (故障1) に該当する場合、ディスク以外の部品故障 (I/Oアダプタ、I/Oケーブル、I/Oコントローラ、電源、ファン等の故障および不良) を復旧してください。

 

5b) ローカルクラスまたは共用クラスの場合は、クラスの状態を復旧するために、sdxfix コマンドを実行します。

# sdxfix -C -c Class3
SDX:sdxfix: INFO: Class3: class recovery completed successfully

6b) エディタを使って、GDSの構成パラメタファイルを開きます。

# vim /etc/opt/FJSVsdx/sdx.cf

ファイルの最後に、次の1行を追加します。

SDX_DB_FAIL_NUM=0

 

7b) システムを再起動します。

 

8b) クラス内のオブジェクトがアクセス可能になったことを確認します。

# sdxinfo -c Class3

何も表示されていなければ、復旧できていません。この場合は、当社の技術員へ連絡してください。
正常に表示されていれば、以降の手順を進めてください。

 

9b) (故障2) に該当する場合、すなわちディスク部品が故障している場合は、「ディスク交換」または「sdxswap − ディスクの交換」にしたがって、ディスクを交換します。

 

10b) (故障1) および (故障2) の復旧が完了した時点で、次の方法により有効な構成データベースの数を確認します。

 

# /etc/opt/FJSVsdx/bin/sdxdcdown
CLASS   DOWN REASON NDK NEN NDB NLDB DEVNAM
------- ---- ------ --- --- --- ---- ---------------------------
Class1  no   -       10  10   8    0 sda:sdb:sdc:sdd:sde:sdf:sdg:sdh
Class2  no   -       10  10   8    0 sdi:sdj:sdk:sdl:sdm:sdn:sdo:sdp
Class3  no   -       10  10   8    0 sdq:sdr:sds:sdt:sdu:sdv:sdw:sdx
Class4  no   -       10  10   8    0 sdaa:sdab:sdac:sdad:sdae:sdaf:sdag:sdah

 

NLDBフィールドは、不足している構成データベースの数を示しています。この値が 0 であれば問題ありません。この値が1以上の場合、まだ復旧できていないディスクが存在していることを示しています。上記の例では、すべてのクラスのNLDBフィールドが 0 であり、復旧は完了したことを表しています。
手順6b) を実施していない場合は、以降の手順は不要です。

 

11b) エディタを使って、GDSの構成パラメタファイルを開きます。

# vim /etc/opt/FJSVsdx/sdx.cf

手順6b)で追加した、次の1行を削除してください。

SDX_DB_FAIL_NUM=0

 

12b) システムを再起動します。

 

これまでに説明した手順で復旧できない場合は、当社の技術員へ連絡してください。



目次 前ページ次ページ

All Rights Reserved, Copyright(C) 富士通株式会社 2006