PRIMECLUSTER 活用ガイド <トラブルシューティング編> (Solaris(TM)オペレーティングシステム/Linux版) |
目次
索引
![]() ![]() |
第1部 事象別トラブル | > 第2章 クラスタアプリケーションのトラブル |
userApplication Configuration Wizard(Solaris)または RMS Wizard Tools(Linux)で、クラスタアプリケーションの作成時に起こるトラブルの対処方法を説明します。
No. |
現象 |
Solaris |
Linux |
---|---|---|---|
ファイルシステムのマウントポイントの設定時に、マウントポイントのリストが表示されない |
○ |
○ |
|
RMS Wizard Tools から Activate を実行すると、下記のメッセージが表示され Activate が失敗する |
− |
○ |
|
Configuration-Activate を実行してもコンフィグレーションに失敗する |
− |
○ |
|
Gds リソースを含むクラスタアプリケーションの構成変更時、コンソールにメッセージが出力される |
○ |
○ |
|
登録したプロシジャリソースの起動順序が設定できない |
○ |
○ |
|
ホットスタンバイ運用の設定を行う Cmdline リソースを作成したが、Standby 状態にならない |
○ |
○ |
|
Fsystem リソースを userApplication に登録して OS のリブートを実施したが、エラーが発生しマウントされなかった |
○ |
○ |
|
userApplication Configuration Wizard からリソースを選択できない |
○ |
− |
|
状態遷移プロシジャを登録する際、GUI にて [Resource の作成] の中の [プロシジャのリソースの選択] で、0896 のメッセージが出力されリソースが作成できない |
○ |
− |
|
Cmdline リソースを登録する際に、「実行可能なファイルではありません。」というメッセージが出力されて、登録に失敗する |
○ |
− |
|
共用ディスクをクラスタリソースから削除し、マルチパスディスクを作成した。その後再度クラスタで使用するため、iompadm コマンドでマルチパスを解除し、自動リソース登録を行うと、6905 のエラーメッセージが出力された |
○ |
− |
|
Cmdline リソースの登録時にエラーが出力される |
○ |
− |
|
自動リソース登録を実行すると 6911 番のエラーメッセージが出力される |
○ |
− |
|
2 ノード構成のクラスタにて、1 ノードの PRIMECLUSTER を再インストールし、自動リソース登録を行ったところ 0769 番のエラーメッセージが出力された |
○ |
− |
|
userApplication Configuration Wizard から任意の userApplication を作成した後、hvw コマンドにて Wizard for NAS の userApplication を作成すると、userApplication Configuration Wizard から作成した任意の userApplication が表示されない |
○ |
− |
|
Global Disk Services 管理画面にて、共用ディスククラス構成設定を行ったが、"shared" オプションが選択できない |
○ |
○ |
|
userApplication Configuration Wizard にて、プロセス監視リソース作成時に以下のエラーが表示され、リソース作成が続行できない |
○ |
− |
|
Cmdline リソースの Check スクリプトに、常に exit 0 で終了するよう指定すると、Offline 時にリソース異常となる |
○ |
○ |
|
userApplication Configration Wizard で RMS 構成を作成し起動したところ、claddprocrsc コマンドで設定した起動優先度の順序でプロシジャリソースが起動しない |
○ |
− |
|
userApplication Configuration Wizard から追加した Resource が Cluster Admin 画面に表示されない |
○ |
− |
|
userApplication Configuration Wizard で Interstage のプロシジャリソース作成時に、「プロシジャのクラス」画面でプロシジャクラス選択後「次へ」ボタンを押下すると 0896 番のエラーメッセージが出力される |
○ |
− |
|
userApplication Configuration Wizard でスケーラブルアプリケーションを作成したところ、0888 のエラーメッセージが出力され、その後、削除できないリソース ScalableCtrl_0 が表示される |
○ |
− |
|
userApplication 作成時に、作成済みのリソースが「利用可能な Resourse」に表示されない。 |
○ |
○ |
userApplication Configuration Wizard または RMS Wizard Tools でファイルシステムのマウンポイントの設定時に、マウントポイントのリストが表示されない。
以下の原因が考えられます。
/etc/vfstab (Solaris) あるいは /etc/fstab (Linux) に、使用するマウントポイントを定義しておく必要があります。行の先頭は、必ず #RMS# で始まるようにしてください。
例 : /etc/vfstab (Solaris)
#RMS#/dev/sfdsk/class0001/dsk/volume0001 /dev/sfdsk/class0001/rdsk/volume0001 /disk1 sfxfs - no -
例: /etc/fstab (Linux)
#RMS#/dev/sdd1 /mnt/swdsk1 ext3 defaults 1 2
#RMS# から始まるマウントポイントの設定が、クラスタシステムのノード間で同一になるように修正してください。
cfregd (CF を構成するプロセス)が異常終了している可能性があります。
クラスタシステム構成する各ノードで、ps(1) コマンド等を使用し cfregd プロセスが起動しているか確認してください。
cfregd プロセスが起動していないノードが1つでも存在する場合、クラスタシステムを構成するすべてのノードで CF を再起動してください。
RMS Wizard Tools のウィザードメニューで Configuration-Activate を実行しても以下メッセージが出力されてコンフィグレーションに失敗する。
The current configuration could not be saved. The current configuration could not be restored on all machines. Please care for this manually prior to start RMS. The activation was not done.
両ノードの /etc/default/cluster.config に以下の記述を行った後、再度 Configuration-Activate を実行してください。
CFCP "cfcp"
CFSH "cfsh"
Gds リソースを含むクラスタアプリケーションの構成変更時に以下のいずれかのメッセージがコンソールに出力される。
FJSVcluster: エラー: clrmd: 7516: リソースの非活性処理で異常が発生しました。 (resource:resource rid:rid detail:301990007)
または、
FJSVcluster: ERROR: clrmd: 7516: An error occurred by the resource deactivation processing. (resource:resource rid:rid detail:301990007)
対処の必要はありません。
本メッセージが出力されるだけで動作に問題ありません。リソースの非活性処理は実行されます。
プロシジャリソースの起動停止に優先度を設定する必要があります。
以下のマニュアルを参照して、優先度を設定してください。
■Solaris
"PRIMECLUSTER 導入運用手引書" の "6.6.1.6.2 設定方法" に記載されている "Resource の関連付け"
■Linux
"PRIMECLUSTER 導入運用手引書" の "6.7.3.6 プロシジャリソースの設定"
Cmdline リソースの STANDBYCAPABLE 属性または ALLEXITCODES 属性が有効になっていない可能性があります。
Cmdline リソースの STANDBYCAPABLE 属性および ALLEXITCODES 属性を有効にしてください。詳細は、"PRIMECLUSTER 導入運用手引書 (Solaris(TM)オペーレーティングシステム版)" の "6.6.1.1 Cmdline リソースの作成" または、"PRIMECLUSTER 導入運用手引書(Linux版)" の "6.7.3.1 Cmdline リソースの作成" を参照してください。
複数の userApplication に Fsystemリソースまたは Gds リソースを登録したが、/etc/vfstab (Solaris) または /etc/fstab (Linux) に誤りがあり、それぞれの userApplication のマウントポイント同士が多段マウントになっている可能性があります。
複数の userApplication のマウントポイントを多段マウントとして、関連性を持たせないでください。
マウントするファイルシステムに、GFS ローカルファイルシステムを使用しているが、各ノードで sfxnode コマンドを実行していない可能性があります。
GFS ローカルファイルシステムを使用する場合、各ノードで sfxnode コマンドを実行してください。
リソースの作成で、リソースを作成していない可能性があります。
リソースを作成し、再度 userApplication Configuration Wizard の設定を行ってください。
claddprocrsc コマンドでの設定内容が各ノード間で異なっている可能性があります。
登録されたプロシジャを両ノードで削除した後、再登録してください。
Cmdline リソースのスクリプトに実行権がついていない可能性があります。
Cmdline リソースのスクリプトに、両ノードで実行権をつけてください。
複数のクラスタシステムから、同一の共有ディスクに対して自動リソース登録され、複数の DISK で同じ volumename になっているためです。
複数のクラスタシステムから同一の共用ディスクのリソースを登録しないでください。
Cmdline リソースとして登録するスクリプトをノードに配置せずに、Cmdline リソースの登録を行った可能性があります。
Cmdline リソースとして登録するスクリプトをノードに配置してください。
/etc/name_to_major にて定義されている sfdsk ドライバの major 番号がクラスタを構成するノード間で異なっている可能性があります。
clrsvmajor コマンドにて sfdsk ドライバの major 番号の一致化を実施してください。
クラスタシステムを構成するノードにおいて、機種(モデル)が混在している、または、各ノードにインストールされている OS 世代、パッケージ、パッチの構成が異なる、または、各ノードへの OS、パッケージ、パッチの適用順番が異なる場合は、以下の手順で対処してください。
この例では、sfdsk ドライバのメジャー番号が各ノードで異なっていることが確認できます。
# /etc/opt/FJSVcluster/bin/clrsvmajor
ID NodeName Major sfdsk -------------------------------------- 0 coll2e00 reserve 259 OK 0 coll2e00 real 259 OK -------------------------------------- 1 coll2e04 reserve 262 NG 1 coll2e04 real 262 NG -------------------------------------- NG
# /etc/opt/FJSVcluster/bin/clrsvmajor -M 263 sfdsk
259
↑前回の予約値
# /etc/opt/FJSVcluster/sys/clchkmajor
# echo $?
0
手順 2.で、メジャー番号に 256 以上の値を設定した場合、以下の手順を引き続き実施します。255 以下の値を設定した場合は、ここで作業は完了です。
# /etc/opt/FJSVcluster/bin/clsetacfparam -d none
注)
[設定例]
以下は、c3t4d0〜c3t4d7とc4t14d0〜c4t14d7 のマルチパス環境での例です。
---------------------------------------------------------------------------- # format Searching for disks...done AVAILABLE DISK SELECTIONS: 0. c1t0d0 <SUN36G cyl 24620 alt 2 hd 27 sec 107> 00760001 /pci@9,600000/SUNW,qlc@2/fp@0,0/ssd@w21000004cffd010d,0 1. c1t1d0 <SUN36G cyl 24620 alt 2 hd 27 sec 107> 00760000 /pci@9,600000/SUNW,qlc@2/fp@0,0/ssd@w21000004cffd036c,0 2. c3t4d0 <FUJITSU-GR840-0383 cyl 2741 alt 2 hd 64 sec 256> 00107000 ~~~~~~~~* * 識別情報が、c3t4t0〜c3t4d7 で同じ値。 /pci@8,600000/fibre-channel@1/hddv@4,0 3. c3t4d1 <FUJITSU-GR840-0383 cyl 6123 alt 2 hd 64 sec 256> 00107000 /pci@8,600000/fibre-channel@1/hddv@4,1 ~~~~~~~~* 〜 省略 〜 17. c4t14d7 <FUJITSU-GR840-0366 cyl 326 alt 2 hd 64 sec 256> 000107000 /pci@8,600000/fibre-channel@2/hddv@e,7 ~~~~~~~~~* Specify disk (enter its number): 2 * 2 を選択 selecting c3t4d0: 00107000 [disk formatted] 〜 省略 〜 format> volname * 識別情報を 00107000 から、00107001 に書き換える * Enter 8-character volume name (remember quotes)[""00107000""]:00107001 ~~~~~~~~~~~~~~~~~~~~* Ready to label disk, continue? y format> disk 3 selecting c3t4d1: 00107000 [disk formatted] format> volname * 識別情報を 00107000 から、00107002 に書き換える * Enter 8-character volume name (remember quotes)[""00107000""]:00107002 ~~~~~~~~~~~~~~~~~~~~* Ready to label disk, continue? y 〜 省略 〜 ----------------------------------------------------------------------------
# /etc/opt/FJSVcluster/bin/clsetacfparam -d auto
# /etc/opt/FJSVcluster/bin/clsetacfparam -d
auto
一部のノードにのみ、PRIMECLUSTER の再インストールを行ったためです。
すべてのノードで PRIMECLUSTER の再インストールを行ってください。
userApplication Configuration Wizard から userApplication を作成した場合、RMS Configuration 名は "config"(変更可) が使用されます。
hvw コマンドで Wizard for NAS の userApplication を登録する際に、userApplication Configuration Wizard で使用している定義名:RMSConfiguration 名を指定していない場合、新たな環境が構築されます。
そのため、クラスタの構成情報を確認すると新たな RMS Configuration ファイルが使用されるので、Wizard for NAS の userApplicaton のみが表示され、userApplication Configuration Wizard から作成した userApplication が表示されなくなります。
userApplication Configuration Wizard で "config"(変更可) が使用されている場合、hvw コマンドで指定する定義名は "config" を指定してください。
userApplication Configuration Wizard で使用する RMS Configuration 名を変更する場合は、"PRIMECLUSTER 導入運用手引書" の "6.6.6 RMS Configuration 名の変更" を参照してください。
該当のディスクがクラスタリソース管理機構の共用リソースに登録されていないためと考えられます。
自動リソース登録を実施してください。
クラスタリソース管理機構が動作していないためと考えられます。
/var/adm/messages または /var/log/messages にクラスタリソース管理機構のメッセージが出力されています。出力されたメッセージの対処に従ってください。
片側ノードにおいて、共用ディスクが物理的に正しく認識できていない可能性があります。
当社技術員 (CE) により結線を直し、ディスクを正しく認識させてください。
ディスクが両ノードから同じように見えているか、format コマンドにより確認を行ってください。
プロセス監視リソース作成時に指定する起動/停止コマンドで使用するコマンドが、フルパスで指定されていない可能性があります。
プロセス監視リソース作成時に指定する起動/停止コマンドで使用するコマンドをフルパスで指定してください。
Check スクリプトは、Cmdline リソースから起動するユーザアプリケーションの状態を正しくチェックできる内容のスクリプトである必要があります。常に exit 0 で終了する場合リソース異常となります。
Check スクリプトを見直してください。Check スクリプトの設定方法の詳細は、"PRIMECLUSTER 活用ガイド<クラスタ構築・運用時の留意点>" の "3.2 スクリプト作成時の注意事項" を参照してください。
Web-Based Admin View クライアント (Web ブラウザ) を起動した状態で、claddprocrsc コマンドを使用しプロシジャリソースの登録を行ったため、userApplication Configuration Wizard が持つプロシジャリソースの情報が更新されていない状態でアプリケーションを作成した可能性があります。
以下の対処を実施してください。
なお削除はアプリケーションのみで、配下のリソースを削除する必要はありません。
userApplication の構成変更において、追加した Resource が userApplication に属していません。
userApplication に属さない Resource が存在する場合、RMS は元の構成情報で起動するため、追加した Resource が Cluster Admin 画面に表示(反映)されません。
作成したすべての Resource を userApplication に登録してください。
userApplication Configuration Wizard を起動して、config のアイコンが赤色になっていないか確認してください。config のアイコンが赤色になっている場合、RMS 構成情報が矛盾していることを意味します。
clsetproc コマンドでの状態遷移プロシジャの登録、及び、claddprocrsc コマンドでのアプリケーションリソースの登録が、状態遷移プロシジャを実行する全てのノードにおいて行なわれていないため。
clsetproc コマンドでの状態遷移プロシジャの登録、及び、claddprocrsc コマンドでのアプリケーションリソースの登録は、状態遷移プロシジャを実行する全てのノードにおいて実行してください。
/etc/opt/FJSVcluster/bin/clgettree コマンドを実行し、プロシジャリソースが一部のノードにのみ登録されている場合(★部分)は本現象と判断できます。
# /etc/opt/FJSVcluster/bin/clgettree Cluster 1 SKFTN_CLUSTER Domain 2 SKFTN_CLUSTER (省略) Node 3 skftn101 ON SDX_DC 52 ClassFtn OFF-STOP SDX_DC 55 ClassLog OFF-STOP SDX_DC 58 ClassClu OFF-STOP Ethernet 41 fjgi0 UNKNOWN Ethernet 42 fjqe1 UNKNOWN IP_Address 60 fjqe1:1 UNKNOWN Ethernet 43 fjqe2 UNKNOWN IP_Address 63 fjqe2:1 UNKNOWN SDX_DC 49 RootClass01 UNKNOWN BasicApplication 102 SYSTEMWALKEROM OFF-STOP SystemState3 116 Linkexpress OFF-STOP BasicApplication 118 IS_INTERSTAGE UNKNOWN ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
★IS_INTERSTAGE のリソースが skftn101 ノードしか無い。 DISK 19 c0t0d0 UNKNOWN DISK 20 c1t0d0 UNKNOWN DISK 22 c3t16d0 UNKNOWN DISK 24 c3t16d2 UNKNOWN DISK 26 c3t16d3 UNKNOWN DISK 28 c3t16d14 UNKNOWN DISK 30 c3t16d16 UNKNOWN DISK 32 c3t16d17 UNKNOWN Node 5 skftn201 ON SDX_DC 53 ClassFtn ON SDX_DC 56 ClassLog ON SDX_DC 59 ClassClu ON Ethernet 44 fjgi0 UNKNOWN Ethernet 45 fjqe1 UNKNOWN IP_Address 61 fjqe1:1 UNKNOWN Ethernet 46 fjqe2 UNKNOWN IP_Address 64 fjqe2:1 UNKNOWN SDX_DC 50 RootClass02 UNKNOWN BasicApplication 103 SYSTEMWALKEROM ON SystemState3 117 Linkexpress ON DISK 33 c0t0d0 UNKNOWN DISK 34 c1t0d0 UNKNOWN DISK 35 c3t16d0 UNKNOWN DISK 36 c3t16d2 UNKNOWN DISK 37 c3t16d3 UNKNOWN DISK 38 c3t16d14 UNKNOWN DISK 39 c3t16d16 UNKNOWN DISK 40 c3t16d17 UNKNOWN
PRIMECLUSTER の予約語をアプリケーション名に指定し、スケーラブルアプリケーションを作成している可能性があります。
PRIMECLUSTERの予約語をアプリケーション名に指定し、スケーラブルアプリケーションを作成しないでください。PRIMECLUSTERの予約語については、"PRIMECLUSTER 活用ガイド<クラスタ構築・運用時の留意点>"の"2.1.2 設定時の注意点"を参照してください。
削除できないリソース ScalableCtrl_0は以下の手順で削除してください。
以下のコマンドを実行してください。
# /etc/opt/FJSVwvucw/bin/wgcnfclient -g config-name
実行の結果、何も出力されない場合は "config" が RMS 構成名となります。
出力があった場合は、出力された名前が RMS 構成名となります。
例:何も出力されない場合
# /etc/opt/FJSVwvucw/bin/wgcnfclient -g config-name
#
例:出力がある場合
# /etc/opt/FJSVwvucw/bin/wgcnfclient -g config-name
config2
#
例:
# rm /opt/SMAW/SMAWRrms/build/wizard.d/<RMS構成名>/ScalableCtrl_0.m
userApplication Configuration Wizard が使用する一時ファイルと同名のファイルが既に存在している可能性があります。
以下のファイルが存在するか確認してください。
/tmp/hostcheck
/tmp/sdxinfo
/tmp/work
/tmp/workc
/tmp/workn
/tmp/macaddr
/tmp/wgcnf000.tmp
/tmp/wgcnf001.tmp
/tmp/wgcnf002.tmp
/tmp/wgcnf003.tmp
該当のファイルが存在する場合、削除してください。
目次
索引
![]() ![]() |