ページの先頭行へ戻る
Systemwalker Operation Manager トラブルシューティングガイド
FUJITSU Software

4.2.2 意図した時間にジョブネット/ジョブが起動しない

対象バージョンレベル

対処1

確認ポイント

システムの時間を変更していませんか

原因・対処方法は、“4.2.1 意図しない時間にジョブネットが起動した”の対処2を参照してください。

対処2

確認ポイント

日変わり時刻の変更を実施していませんか

原因

当日分のジョブネットがすでに起動された後に、日変わり時刻を変更した場合、1日の範囲が伸び、ジョブネットが起動しない状態となる場合があります。

例を以下の図に示します。

対処3

確認ポイント

対処方法

対処4

確認ポイント

“停止”操作を実施していませんか。または、“無効”操作を実施していませんか

原因

“停止”操作または、“無効”操作を実施した場合、ジョブネットは、起動されません。

対処方法

“停止”操作を実施している場合(停止中の状態)は、“停止解除”操作を実施してください。“無効”操作を実施している場合(無効状態)は、“無効解除”操作を実施してください。

なお、起動予定時刻の到来や待ち合わせているメッセージ事象の発生など、ジョブネットの起動条件が整っている場合、“停止解除”操作を行った時点でジョブネットは起動します。

対処5

確認ポイント

前回異常終了または強制終了していませんか。その場合、ジョブネットに対して、確認操作を実施していますか

原因

[ジョブスケジューラ起動パラメタの定義]ウィンドウ-[利用機能1]シートの[異常時の確認操作]の[詳細設定]ボタンを押下して表示された[確認操作の詳細設定]ウィンドウで、[ジョブネットの確認操作を有効とする](注)を指定している場合、ジョブネットが異常終了すると“確認”操作を実施するまで、次回起動されません。[強制終了を確認操作の対象とする](注)を指定している場合は、強制終了した場合も“確認”操作を実施するまで、次回起動されません。

注) V13.2.0以前の場合は、[ジョブスケジューラ起動パラメタの定義]ウィンドウ-[利用機能1]シート上で指定します。

ポイント

[ジョブネットの確認操作を有効とする]オプションについて

[ジョブネットの確認操作を有効とする]オプションの出荷時の状態は以下のとおりです。

  • UNIX版    :  確認操作が有効

  • Windows版 :  確認操作が有効でない

確認操作が有効でない場合、Systemwalker Operation Managerクライアントで、ジョブネットの操作の[確認]がグレーアウトされ、選択できない状態となります。

対処6

確認ポイント

プロジェクトに登録されているジョブネット数が多くないですか

原因

プロジェクトに登録されるジョブネット数が増えるとジョブネットの起動性能に影響を与えます。

以下の目安を参考にしてください。

SE版:

最大255個までを制限としています。

EE/GEE版:

制限はありませんが、以下の登録数を目安としてください。

  • Windows版:最大300個

  • UNIX版:最大500個

以下に示すマニュアルも併せて参照してください。

対処方法

大量に登録されているジョブネットを複数のプロジェクトに分割することで、起動性能の改善ができます。

1プロジェクトあたりのジョブネット数はjobschprint -nコマンドで表示されるジョブネット数をカウントすることで確認できます。

対処7

確認ポイント

原因

ジョブネットの起動予定時刻が到来した時点で、ジョブスケジューラサービス/デーモンが動作している必要があります。

[ジョブネットのプロパティ]ウィンドウの[基本情報]シートで、[電源未投入時の処置として電源投入時に起動]チェックボックスにチェックがない場合、電源投入後の次回の起動予定がスケジュールされます。

対処方法

サーバ機能の起動を確認するためには、起動時の初期化処理が完了した時点で記録される以下のメッセージを確認してください。

対処8

確認ポイント

同時に大量のジョブネットを起動していませんか

原因

同時に大量のジョブネットを起動した場合、ジョブスケジューラはそれらを1つずつ起動するため、起動予定時刻より遅れて起動する場合があります。

対処方法

ジョブネットの起動予定時刻を分散して、同時に処理を集中させないような運用が可能かを検討してください。

対処9

確認ポイント

jobschprintコマンドの出力をmoreコマンドで止めていませんか

以下の方法で確認できます。

【UNIX版】

psコマンドを利用して、jobschprint プロセスが存在するかを確認します。

[確認例]

ps -ef | grep jobschprint
【Windows版】

サーバ機能がインストールされているサーバで、タスクマネージャを利用して、jobschprint プロセスが存在するかを確認します。

原因

jobschprintコマンドの出力をmoreコマンドで止めた場合、スケジュール情報ファイルのロックが長時間発生し、ジョブネットの起動処理がスケジュール情報ファイルのロック解除を待つ状態となります。

対処方法

jobschprintコマンドの出力結果をファイルなどへリダイレクションし、テキストエディタで参照するようにしてください。

[確認例]

jobschprint -n > printn.txt

対処10

確認ポイント

原因

Systemwalker Operation Managerクライアントは、定期的にジョブネットの情報を取得し、画面のリフレッシュを行います。その際、Systemwalker Operation Managerサーバのスケジュール情報ファイルの読み込みが発生します。

Systemwalker Operation Managerクライアントの接続台数が増加すると、画面リフレッシュ処理の回数が増加し、サーバでスケジュール情報ファイルのロックが発生します。

また、1台のSystemwalker Operation Managerクライアントで[F5]キーを連打した場合もSystemwalker Operation Managerクライアントの接続台数が多い状態と同じことが起こります。

対処方法

Systemwalker Operation Managerクライアントの同時接続台数は、できるだけ最小限に抑えてください。

また、Systemwalker Operation Managerクライアントの[F5]キー押下についても、できるだけ最小限に抑えてください。

接続台数については十分な検証を実施した上で決定してください。

対処11

確認ポイント

ジョブスケジューラのデータベースディレクトリをアクセス速度が遅いディスク装置に配置していませんか

原因

ジョブスケジューラのデータベースディレクトリをアクセス速度が遅いディスク装置に配置した場合、ファイルアクセスのパフォーマンスが低下し、ジョブスケジューラ本来の性能を発揮できない場合があります。

特に、ジョブネットの起動数が多い場合、同時にジョブネットを起動した際の遅延が顕著に表れます。

対処方法

ジョブスケジューラデータベースディレクトリは、ディスクI/Oの負荷を分散し、高性能な(アクセス速度が速い)ディスク装置に配置することを推奨します。

対処12

確認ポイント

ジョブネット/ジョブの終了出口に時間のかかる処理を追加していませんか

原因

ジョブスケジューラは出口の終了を待ち合わせ、それらが終了すると、次の要求を受け付ける動作をします。

したがって、ジョブネット/ジョブの終了出口に時間のかかる処理を実装すると、次のジョブネット/ジョブの起動が遅延する可能性があります。

対処方法

ジョブネット/ジョブ終了出口に時間のかかる処理を実装しないでください。または、各出口からバックグラウンドで処理を実行するようにしてください。

対処13

確認ポイント

テストモードで仮想時間を設定していませんか

対処方法

[Systemwalker Operation Manager環境設定]ウィンドウで、[起動パラメタ]をクリックすると表示される[ジョブスケジューラ起動パラメタの定義]ウィンドウ-[テストモード]シートで、[仮想時間の解除]を選択してください。その後、ジョブスケジューラのサービス/デーモンを再起動してください。

対処14

確認ポイント

[起動時刻の到来を待つ]にチェックがあるジョブネットでメッセージ事象が発生していない状態ではありませんか

原因

[起動時刻の到来を待つ]にチェックがある場合、起動時刻が到来してもメッセージ事象が発生していないとジョブネットは起動されません。

対処15

(V11.0L10/11.0以降)

確認ポイント

ジョブネットが“持ち越し”状態ではありませんか

原因

ジョブネットが“持ち越し”状態のまま本日の起動予定時刻が到来した場合、ジョブネットは、起動しません。本日の起動予定のジョブネットは実行拒否となります。

対処16

確認ポイント

メッセージキューが枯渇していませんか。ipcsコマンドなどで確認してください。

確認例

# ipcs -aq
IPC status from <running system> as of 2005年08月08日 (月) 11時26分23秒 JST
T         ID      KEY        MODE        OWNER    GROUP  CREATOR   CGROUP CBYTES  QNUM QBYTES LSPID LRPID   STIME    RTIME    CTIME
Message Queues:
q       8300   0x2006528  -Rrw-rw-rw-     root    other     root    other      0     0   4096  7529  7528 11:22:19 11:22:19 11:14:06
q       3551   0x3006528  --rw-rw-rw-     root    other     root   other    560    40   4096  7449  7530 11:22:49 11:21:44 11:14:07
q       2102   0x5006528  -Rrw-rw-rw-     root    other     root    other      0     0   4096  7529  7531 11:22:19 11:22:19 11:14:07
q       2053   0x7006528  -Rrw-rw-rw-     root    other     root    other      0     0   4096  7355  7532 11:15:06 11:15:06 11:14:07

CBYTES、QNUMのフィールドを確認し、この値の総計が大きい場合、メッセージキューが枯渇していると判断できます。

原因

ジョブスケジューラデーモンは、複数のデーモンプロセスで構成されており、メッセージキュー(IPC資源)を利用して互いに同期をとりながら動作しています。ジョブスケジューラデーモンが、プロセス間通信の失敗により、リトライ処理を行っていると、ジョブの状態を正しく表示できない場合があります。

対処方法

メッセージキューをチューニングしてください。または、メッセージキューを異常に消費しているアプリケーションが存在しないか確認してください。

メッセージキューのチューニングについては、“4.13.4 ジョブスケジューラサーバの処理がハングアップしてしまう【UNIX版】”を参照してください。

対処17

確認ポイント

休日カレンダの変更を大量に行っていませんか

原因

カレンダを大量に修正し、保存した場合、起動日の再作成に時間がかかる場合があります。

対処方法

休日カレンダは数個ずつ時間を空けて変更してください。

対処18

確認ポイント

ジョブネット/ジョブの終了出口の処理は終了していますか

[Windows版の場合]

タスクマネージャで出口のプロセスが終了しているか確認してください。

[UNIX版の場合]

psコマンドなどで出口のプロセスが終了しているか確認してください。

原因

ジョブスケジューラは出口の終了を待ち合わせ、それらが終了すると、次の要求を受け付けます。したがって、ジョブネット/ジョブの終了出口で処理が止まっている場合、ジョブネットやジョブの起動処理ができません。

対処方法

出口が終了しない状態の場合は、ジョブスケジューラのサービスまたはデーモンを再起動してください。またジョブネット/ジョブ終了出口の処理を修正してください。

対処19

確認ポイント

運用ノードと待機ノードで異なる日変わり時刻が設定されていませんか

対処方法

運用ノードと待機ノードの日変わり時刻を同一時刻に設定してください。