PRIMECLUSTER Global Disk Services 説明書 4.1 (Linux版) |
目次
![]() ![]() |
付録F トラブルシューティング | > F.1 トラブルへの対処方法 |
クラス内のオブジェクトの構成や状態を格納している構成データベースの数が不足した場合、またはクラスタ環境でノード間の通信処理がエラーとなった場合に、クラスは閉塞状態となります。閉塞状態のクラスに存在しているオブジェクトには、一切アクセスすることができません。
構成データベースの不足は、以下の条件に合致した場合に発生します。
1) 運用中にクラスが閉塞したかどうかは、次の方法で確認できます。リブートあるいはsdxservdデーモンを再起動してしまうと確認できなくなるため注意してください。
# /etc/opt/FJSVsdx/bin/sdxdcdown CLASS DOWN REASON NDK NEN NDB NLDB DEVNAM ------- ---- ------ --- --- --- ---- -------------------------- Class1 no - 10 10 8 0 sda:sdb:sdc:sdd:sde:sdf:sdg:sdh Class2 yes Comm 10 10 8 0 sdi:sdj:sdk:sdl:sdm:sdn:sdo:sdp Class3 yes FewDB 10 10 1 7 sdq Class4 yes NoDB 10 10 0 8 - |
この例では、DOWNフィールドが yes である、Class2、Class3、および Class4 が閉塞状態で、REASONフィールドに示されている閉塞の原因は次のとおりです。
2) 詳細原因によっては、復旧が困難となる場合がありますので、まず調査資料を必ず採取してください。
調査資料の採取方法については、「トラブル調査資料の採取方法」を参照してください。
以下では、次の2つの場合に分けて対処方法を説明します。
3a) (原因1)に該当する場合、当社の技術員へ連絡してください。
3b) (原因2)または(原因3)に該当する場合、クラスに登録されているすべての(あるいは大半の)ディスクが異常となっています。
クラスに登録されているディスクは、以下の方法で確認できます。
# sdxinfo -D -c Class3 OBJ NAME TYPE CLASS GROUP DEVNAM DEVBLKS DEVCONNECT STATUS ------ ------- ------ ------- ------- ------- -------- ---------------- ------- disk Disk31 mirror Class3 Group1 sda 8847360 * ENABLE disk Disk32 mirror Class3 Group1 sdb 8847360 * ENABLE disk Disk33 mirror Class3 Group2 sde 8847360 * ENABLE disk Disk34 mirror Class3 Group2 sdf 8847360 * ENABLE disk Disk35 mirror Class3 Group3 sdc 17793024 * ENABLE disk Disk36 mirror Class3 Group3 sdg 17793024 * ENABLE disk Disk37 mirror Class3 Group4 sdd 17793024 * ENABLE disk Disk38 mirror Class3 Group4 sdh 17793024 * ENABLE disk Disk39 spare Class3 Group1 sdr 17793024 * ENABLE disk Disk40 spare Class3 * sds 17727488 * ENABLE |
この例では、クラス Class3 に Disk31 から Disk40 までの10本のディスクが登録されています。DEVNAMフィールドに物理ディスク名が示されているので、これらの物理ディスクで発生している異常原因をディスクドライバのログメッセージなどをもとにして特定してください。異常原因は、次の2つに分けられます。
4b) エディタを使って、GDSの構成パラメタファイルを開いてください。
# vi /etc/opt/FJSVsdx/sdx.cf |
ファイルの最後に、次の1行を追加してください。
SDX_DB_FAIL_NUM=0 |
5b) システムをシャットダウンしてください。
6b) (故障1)に該当する場合、ディスク以外の部品故障(I/Oアダプタ、I/Oケーブル、I/Oコントローラ、電源、ファン等の故障および不良)を復旧させてください。
7b) システムをブートしてください。
8b) クラス内のオブジェクトがアクセス可能になったことを確認してください。
# sdxinfo -c Class3 |
何も表示されていなければ、復旧できていません。この場合は、当社の技術員へ連絡してください。正常に表示されていれば、以降の手順を進めてください。
9b) (故障2)に該当する場合、すなわちディスク部品が故障している場合は、「ディスク交換」またはsdxswapコマンドのマニュアルにしたがって、ディスクを交換してください。
10b) (故障1)および故障2の復旧が完了した時点で、次の方法により有効な構成データベースの数を確認してください。
# /etc/opt/FJSVsdx/bin/sdxdcdown CLASS DOWN REASON NDK NEN NDB NLDB DEVNAM ------- ---- ------ --- --- --- ---- --------------------------- Class1 no - 10 10 8 0 sda:sdb:sdc:sdd:sde:sdf:sdg:sdh Class2 no - 10 10 8 0 sdi:sdj:sdk:sdl:sdm:sdn:sdo:sdp Class3 no - 10 10 8 0 sdq:sdr:sds:sdt:sdu:sdv:sdw:sdx Class4 no - 10 10 8 0 sdaa:sdab:sdac:sdad:sdae:sdaf:sdag:sdah |
NLDBフィールドは、不足している構成データベースの数を示しています。この値が0であれば問題ありません。この値が1以上の場合、まだ復旧できていないディスクが存在していることを示しています。上記の例では、すべてのクラスのNLDBフィールドが0であり、復旧は完了したことを表しています。
11b) エディタを使って、GDSの構成パラメタファイルを開いてください。
# vi /etc/opt/FJSVsdx/sdx.cf |
手順5b)で追加した、次の1行を削除してください。
SDX_DB_FAIL_NUM=0
12b) システムをリブートしてください。
これまでに説明した手順で復旧できない場合は、当社の技術員へ連絡してください。
目次
![]() ![]() |