Interstage Job Workload Server 運用ガイド
目次 前ページ次ページ

第3章 異常時の対処> 3.1 バッチシステムの異常

3.1.1 ジョブの実行環境が異常停止した場合

ジョブの実行環境内で致命的な異常が発生した場合や、外的要因などにより、1つのジョブの実行環境だけが停止する事態が想定されます。
ジョブの実行環境が停止すると、対象のジョブキューからジョブの実行ができなくなります。
バッチ業務運用中に、ジョブの実行環境が停止した場合の対処と再開方法を説明します。

■ジョブの実行環境の停止の確認

ジョブの実行環境が異常停止する要因として以下が考えられます。

イベントチャネル(メッセージ番号がesで始まるメッセージ)、またはバッチワークユニット(メッセージ番号がEXTPやtdで始まるエラーメッセージ)のエラーメッセージとともに、異常の原因となった部分のエラーメッセージがシステムログに出力されます。
イニシエータが異常停止した場合、即座にエラーメッセージがシステムログに出力されない場合がありますが、ジョブの実行開始や終了、ジョブステップの開始や終了などで、エラーメッセージが出力されます。

イベントチャネルを停止操作した場合、バッチワークユニットのエラーメッセージや、イニシエータのメッセージなどがシステムログに出力され、イニシエータは停止、または強制停止中の状態になります。
バッチワークユニットを停止/強制停止操作した場合には、イニシエータのメッセージがシステムログに出力され、イニシエータは停止、または強制停止中の状態になります。


イベントチャネル(メッセージ番号がesで始まるメッセージ)、バッチワークユニット(メッセージ番号がEXTPやtdで始まるエラーメッセージ)のエラーメッセージについては、“Interstage Application Server メッセージ集”を参照してください。
イニシエータのエラーメッセージについては、“Interstage Job Workload Server メッセージ集”の“BTFW50000番台”を参照してください。

出力されたエラーメッセージの情報には、異常が発生したイベントチャネル、バッチワークユニット、またはイニシエータの名前が出力されます。
停止や強制停止時のメッセージには、対象のイベントチャネル、バッチワークユニット、またはイニシエータの名前が出力されます。
イベントチャネルやバッチワークユニットの名前の先頭には、イニシエータ名が付いているので、その情報をもとに、対象のイニシエータを明確にしてください。
定義済のすべてのイニシエータの状態を表示し、対象のイニシエータの状態を確認してください。
定義済のすべてのイニシエータの状態表示をするには、以下のコマンドで行います。

btfwiniinfo



btfwiniinfoコマンドの詳細については、“Interstage Job Workload Server リファレンス”を参照してください。

イニシエータの状態情報の表示例を、以下に示します。

InitiatorName   State              NumberOfJobs   MaxJob
---------------------------------------------------------------------------------
que001          active                        0       20
que002          inactive                      -        0

イニシエータの状態情報より、"State" が "active" 以外になっており、"NumberOfJobs"が "-" になっていることを確認してください。

■ジョブの実行環境の対処と再開

ジョブの実行環境の対処と再開は、以下の手順で行ってください。

◆イベントチャネルの状態確認と対処

以下に示す項目に該当するものがないかどうかを、確認してください。

ジョブの実行環境で使用するイベントチャネルの状態の確認を行い、異常停止したイベントチャネルに対して、対応するエラーメッセージの対処を行ってください。
ジョブの実行環境で使用するイベントチャネルには以下があります。

資源名

イベントチャネルグループ名

イベントチャネル名

ジョブステップ用イベントチャネル

ジョブキュー名_ChannelGR

ジョブキュー名_CSTEPchnl

エラー用イベントチャネル

ジョブキュー名_ERRORchnl

ジョブ終了用イベントチャネル

ジョブキュー名_JobCOMPchnlGR

ジョブキュー名_JobCOMPchnl

※ジョブキュー名 : 停止したジョブの実行環境内のジョブキューの名前です。

イベントチャネルの状態を確認するには、以下のesmonitorコマンドで行います。

esmonitor


esmonitorコマンドの詳細については、“Interstage Application Server リファレンスマニュアル(コマンド編)”を参照してください。

◆イベントチャネルの起動

停止操作または、異常によりイベントチャネルが停止した場合には、先に状態確認を行ったジョブの実行環境で使用しているイベントチャネルを起動してください。

イベントチャネルの起動は、イベントチャネルグループ単位に行います。
ジョブステップ用イベントチャネルと、エラー用イベントチャネルは、1つのイベントチャネルグループ内に存在するため、1回で2つのイベントチャネルが起動されます。
イベントチャネルを起動する、esstartchnlコマンドの形式を以下に示します。

esstartchnl -g イベントチャネルグループ名


esstartchnlコマンドの詳細については、“Interstage Application Server リファレンスマニュアル(コマンド編)”を参照してください。

◆バッチワークユニットの状態確認と対処

対象のバッチワークユニットの状態を確認してください。
バッチワークユニットの状態確認は、以下のislistwuコマンドで行います。

islistwu -a -e


islistwuコマンドの詳細については、“Interstage Application Server リファレンスマニュアル(コマンド編)”を参照してください。

システムログにバッチワークユニットに対応するエラーメッセージがあった場合、対象のバッチワークユニットに対して、エラーメッセージの対処を行ってください。


バッチワークユニットで異常が発生した場合、バッチワークユニットの以下の設定により、ジョブの実行環境の停止や、バッチワークユニットの縮退運用になる場合があります。

プロセス縮退運用については、“Interstage Job Workload Server セットアップガイド”の“Process Degeneracy:プロセス縮退運用”を参照してください。

バッチワークユニットが縮退運用中状態の場合、islistwuコマンドでは対象のバッチワークユニットの"status"が"degenerate"(縮退運用中状態) 表示されます。
縮退運用中状態のバッチワークユニットは、isrecoverwuコマンドにより復元することができます。(ジョブの多重度が元にもどります。)
isrecoverwuコマンドの形式を以下に示します。

isrecoverwu ワークユニット名

※ワークユニット名 : ジョブキュー名_CWU
 ジョブキュー名 : 停止したジョブの実行環境内のジョブキューの名前です。

isrecoverwuコマンドの詳細については、“Interstage Application Server リファレンスマニュアル (コマンド編)”を参照してください。

バッチワークユニット内の実行プロセスが異常停止した場合や、バッチワークユニットが停止した場合も、その旨のエラーメッセージがシステムログに出力されます。

◆バッチワークユニットの起動

停止操作または、異常によりバッチワークユニットが停止した場合には、ジョブの実行環境で使用する対象のバッチワークユニットを起動してください。
バッチワークユニットの起動は、isstartwuコマンドで行います。
isstartwuコマンドの形式を以下に示します。

isstartwu ワークユニット名

※ワークユニット名 : ジョブキュー名_CWU
 ジョブキュー名 : 停止したジョブの実行環境内のジョブキューの名前です。

isstartwuコマンドの詳細については、“Interstage Application Server リファレンスマニュアル (コマンド編)”を参照してください。

◆イニシエータの状態確認と対処

対象のイニシエータの状態を確認してください。
イニシエータの状態確認は、以下のbtfwiniinfoコマンドで行います。

btfwiniinfo


btfwiniinfoコマンドの詳細については、“Interstage Job Workload Server リファレンス”を参照してください。

btfwiniinfoコマンドで表示された情報をもとに、対象のイニシエータが停止していること(対象のイニシエータの "State"が "inactive"になっていること)を確認してください。
イニシエータが停止していない場合には、イニシエータが停止するまで待ってください。

システムログにイニシエータに対応するエラーメッセージがあった場合、対象のイニシエータに対して、エラーメッセージの対処を行ってください。

◆イニシエータの開始

異常によりイニシエータが停止した場合には、ジョブの実行環境で使用する対象のイニシエータを開始してください。
イニシエータの開始”の手順に従って行ってください。

◆ジョブの実行環境の稼働状態確認

運用を再開するジョブの実行環境の稼働状態を確認します。
ジョブの実行環境の稼働状態の確認は、“バッチ実行基盤の稼働状態確認”の手順に従って行ってください。


下へ3.1.1.1 ジョブの扱い

目次 前ページ次ページ

All Rights Reserved, Copyright(C) 富士通株式会社 2006