PRIMECLUSTER Global Disk Services 説明書 4.2 (Linux版) |
目次
![]() ![]() |
付録F トラブルシューティング | > F.1 トラブルへの対処方法 |
クラスの状態が以下に該当する場合は、それぞれに記載されている対処を行ってください。
クラス内のオブジェクトの構成や状態を格納している構成データベースの数が不足した場合、またはクラスタ環境でノード間の通信処理がエラーとなった場合に、クラスは閉塞状態となります。閉塞状態のクラスに存在しているオブジェクトには、一切アクセスすることができません。
構成データベースの不足は、以下の条件に合致した場合に発生します。
ENABLE状態のディスクが2本以下であれば、正常にアクセス可能なディスクが存在しない場合
ENABLE状態のディスクが3本から5本であれば、正常にアクセス可能なディスクが1本以下になってしまった場合
ENABLE状態のディスクが6本以上であれば、正常にアクセス可能なディスクが2本以下になってしまった場合
ただし、ルートクラスの場合は、正常にアクセス可能なディスクが存在しなくならない限り、閉塞されません。
なお、EMC SymmetrixのBCVデバイスおよびターゲット(R2)デバイスは、コピー元のディスクのデータで上書きされるため、GDSの構成データベースを格納できません。したがって、BCVデバイスおよびターゲット(R2)デバイスは、上記の条件における「正常にアクセス可能なディスク」には該当しません。
1) 運用中にクラスが閉塞したかどうかは、次の方法で確認できます。リブートあるいはsdxservdデーモンを再起動してしまうと確認できなくなるため注意してください。
# /etc/opt/FJSVsdx/bin/sdxdcdown CLASS DOWN REASON NDK NEN NDB NLDB DEVNAM ------- ---- ------ --- --- --- ---- -------------------------- Class1 no - 10 10 8 0 sda:sdb:sdc:sdd:sde:sdf:sdg:sdh Class2 yes Comm 10 10 8 0 sdi:sdj:sdk:sdl:sdm:sdn:sdo:sdp Class3 yes FewDB 10 10 1 7 sdq Class4 yes NoDB 10 10 0 8 - |
この例では、DOWNフィールドが yes である、Class2、Class3、および Class4 が閉塞状態で、REASONフィールドに示されている閉塞の原因は次のとおりです。
2) 詳細原因によっては、復旧が困難となる場合がありますので、まず調査資料を必ず採取してください。
調査資料の採取方法については、「トラブル調査資料の採取方法」を参照してください。
以下では、次の2つの場合に分けて対処方法を説明します。
通信エラーで閉塞した場合
構成データベースの不足で閉塞した場合
3a) (原因1)に該当する場合、当社の技術員へ連絡してください。
3b) (原因2)または(原因3)に該当する場合、クラスに登録されているすべての(あるいは大半の)ディスクが異常となっています。
クラスに登録されているディスクは、以下の方法で確認できます。
# sdxinfo -D -c Class3 OBJ NAME TYPE CLASS GROUP DEVNAM DEVBLKS DEVCONNECT STATUS ------ ------- ------ ------- ------- ------- -------- ---------------- ------- disk Disk31 mirror Class3 Group1 sda 8847360 * ENABLE disk Disk32 mirror Class3 Group1 sdb 8847360 * ENABLE disk Disk33 mirror Class3 Group2 sde 8847360 * ENABLE disk Disk34 mirror Class3 Group2 sdf 8847360 * ENABLE disk Disk35 mirror Class3 Group3 sdc 17793024 * ENABLE disk Disk36 mirror Class3 Group3 sdg 17793024 * ENABLE disk Disk37 mirror Class3 Group4 sdd 17793024 * ENABLE disk Disk38 mirror Class3 Group4 sdh 17793024 * ENABLE disk Disk39 spare Class3 Group1 sdr 17793024 * ENABLE disk Disk40 spare Class3 * sds 17727488 * ENABLE |
この例では、クラス Class3 に Disk31 から Disk40 までの10本のディスクが登録されています。DEVNAMフィールドに物理ディスク名が示されているので、これらの物理ディスクで発生している異常原因をディスクドライバのログメッセージなどをもとにして特定してください。異常原因は、次の2つに分けられます。
4b) (故障1) に該当する場合、ディスク以外の部品故障 (I/Oアダプタ、I/Oケーブル、I/Oコントローラ、電源、ファン等の故障および不良) を復旧してください。
5b) ローカルクラスまたは共用クラスの場合は、クラスの状態を復旧するために、sdxfix コマンドを実行します。
# sdxfix -C -c Class3 SDX:sdxfix: INFO: Class3: class recovery completed successfully |
sdxfix コマンドが正常終了した場合は、手順 6b)〜9b) は実施せず、手順 10b) を実施します。
sdxfix コマンドが正常終了しなかった場合は、手順 6b) 以降を実施します。
ルートクラスの場合は、手順6b)以降を実施します。
6b) エディタを使って、GDSの構成パラメタファイルを開きます。
# vim /etc/opt/FJSVsdx/sdx.cf |
ファイルの最後に、次の1行を追加します。
SDX_DB_FAIL_NUM=0
7b) システムを再起動します。
8b) クラス内のオブジェクトがアクセス可能になったことを確認します。
# sdxinfo -c Class3 |
何も表示されていなければ、復旧できていません。この場合は、当社の技術員へ連絡してください。
正常に表示されていれば、以降の手順を進めてください。
9b) (故障2) に該当する場合、すなわちディスク部品が故障している場合は、「ディスク交換」または「sdxswap − ディスクの交換」にしたがって、ディスクを交換します。
10b) (故障1) および (故障2) の復旧が完了した時点で、次の方法により有効な構成データベースの数を確認します。
# /etc/opt/FJSVsdx/bin/sdxdcdown CLASS DOWN REASON NDK NEN NDB NLDB DEVNAM ------- ---- ------ --- --- --- ---- --------------------------- Class1 no - 10 10 8 0 sda:sdb:sdc:sdd:sde:sdf:sdg:sdh Class2 no - 10 10 8 0 sdi:sdj:sdk:sdl:sdm:sdn:sdo:sdp Class3 no - 10 10 8 0 sdq:sdr:sds:sdt:sdu:sdv:sdw:sdx Class4 no - 10 10 8 0 sdaa:sdab:sdac:sdad:sdae:sdaf:sdag:sdah |
NLDBフィールドは、不足している構成データベースの数を示しています。この値が 0 であれば問題ありません。この値が1以上の場合、まだ復旧できていないディスクが存在していることを示しています。上記の例では、すべてのクラスのNLDBフィールドが 0 であり、復旧は完了したことを表しています。
手順6b) を実施していない場合は、以降の手順は不要です。
11b) エディタを使って、GDSの構成パラメタファイルを開きます。
# vim /etc/opt/FJSVsdx/sdx.cf |
手順6b)で追加した、次の1行を削除してください。
SDX_DB_FAIL_NUM=0
12b) システムを再起動します。
これまでに説明した手順で復旧できない場合は、当社の技術員へ連絡してください。
目次
![]() ![]() |