スケジュールサーバと実行サーバがともに同じクラスタシステム上で運用されている場合、フェールオーバ時に実行中だったジョブネットおよびジョブは、フェールオーバ完了後に異常終了(実行中断状態:終了コード=239)として表示されます。
フェールオーバ時に実行中断されたジョブネットやジョブの再実行などのリカバリ処理は、自動的には行われません。異常終了を確認後、再起動などの対処を行ってください。
フェールオーバ後も運用を継続するためには、以下のような動作を行うジョブを作成し、このジョブを、サーバ起動時に実行するジョブネットとして登録してください。登録するジョブネットには、必ず起動日を設定してください。起動日を設定していない場合、ジョブネットはフェールオーバ後に起動しません。
jobschprint -n コマンドでジョブネット状態一覧を出力する。出力結果をファイルにリダイレクトして保存する。
1.で保存したファイルを読み込み、ジョブネットの状態が実行中断かどうかをチェックする。実行中断かどうかは、終了コードが239かどうかで判断する。
実行中断ジョブネットの場合、そのジョブネットをjobschcontrol rerun コマンドで再起動する。
ジョブネット一覧の数だけ、2.3.を繰り返す。
この処理のサンプルソースは以下に格納されています。
PRIMECLUSTER(Solaris版、Linux版)、Oracle Solaris Clusterの場合
/opt/FJSVJOBSC/sample/abendrerun.c
MC/ServiceGuardの場合
/opt/FHPJOBSCH/sample/abendrerun.c
HACMPの場合
/opt/FAIXJOBSC/sample/abendrerun.c
jobschprintコマンド、jobschcontrolコマンドの詳細は、“Systemwalker Operation Manager リファレンス集”を参照してください。