フェールオーバのテストを行う場合について
フェールオーバのテストを行う場合、運用系で以下のプロセスにシグナル:SIGTERMを送信して停止させてください。
ジョブスケジューラ:tskwnsrv
複数サブシステム運用を行っており、特定のサブシステムのtskwnsrvに対して、シグナル:SIGTERMを送信したい場合は、以下の手順で対象のtskwnsrvのプロセスIDを特定します。
psコマンドを実行します。
# ps aux | grep tskwnsrv |
注) 上記はLinuxの例です。OSによって以下のコマンドとなります。 Solaris:Solaris10の場合)/usr/ucb/ps -auxww | grep tskwnsrv Solaris11の場合)/usr/bin/ps auxww | grep tskwnsrv HP-UX:ps -aex | grep tskwnsrv AIX :ps auxww | grep tskwnsrv なお、マシン環境によってコマンドが異なります。コマンドの詳細は、各OSのマニュアルを 参照してください。
表示されたpsコマンドの結果から、該当のサブシステムのtskwnsrvのプロセスIDを求めます。
サブシステム0の場合のpsコマンド出力例
root 6944 0.0 0.0 155408 2484 ? S 8月31 0:00 /opt/FJSVJOBSC/bin/tskwnsrv 229380 /var/opt/FJSVJOBSC 0 -1 |
この場合のプロセスIDは「6944」となります。
サブシステムn(1~9)の場合のpsコマンド出力例(下記の例はサブシステム1の場合)
root 7250 0.0 0.0 153324 2452 ? S 8月31 0:00 /opt/FJSVJOBSC/bin/tskwnsrv 327687 /var/opt/FJSVJOBSC/JOBDB1 1 -1 |
この場合のプロセスIDは「7250」となります。
poperationmgrコマンドでデーモンを停止しても、フェールオーバは発生しません。
これは、クラスタ構築時にpoperationmgrコマンドで停止するサービスの自動起動・停止の対象から、クラスタに登録するデーモン(ジョブスケジューラ、ジョブ実行制御)をはずしているためです。
フェールオーバの発生契機について
フェールオーバの発生契機は多数ありますが、共有ディスクを強制的にアンマウントさせて、フェールオーバさせないでください。
Systemwalker Operation Managerでは、ジョブスケジューラデーモンの停止処理において、共有ディスクの情報を参照します。このため、共有ディスクが強制的にアンマウントされた後では、ジョブスケジューラデーモンの停止処理が正常に実施できなくなります。(フェールオーバは完了します。)
共有ディスクのアンマウントによりフェールオーバが発生した場合、共有ディスクがアンマウントされたノードのtskwnsrvプロセスに、シグナル:SIGTERMを送信してください。なお、シグナル:SIGKILLは送信しないでください。