対象バージョンレベル
Windows版:V5.0L10以降
Solaris版:5.0以降
Linux版:5.2、V10.0L10以降
Linux for Itanium版:V12.0L10以降
HP-UX版:5.1以降
AIX版:5.1以降
DS版:V20L10
対処1
確認ポイント
システムの時間を変更していませんか
原因・対処方法は、“4.2.1 意図しない時間にジョブネットが起動した”の対処2を参照してください。
対処2
確認ポイント
日変わり時刻の変更を実施していませんか
原因
当日分のジョブネットがすでに起動された後に、日変わり時刻を変更した場合、1日の範囲が伸び、ジョブネットが起動しない状態となる場合があります。
例を以下の図に示します。
対処3
確認ポイント
休日カレンダまたは起動日雛形を変更していませんか
起動日は、設定されていますか
運用期間の設定で“無効期間”として設定されていませんか
対処方法
休日カレンダまたは起動日雛形を変更した場合
必要に応じて、[起動日]ウィンドウまたは[運用予定]ウィンドウで起動日を再設定してください。
V5.0L20以前またはV5.1以前では、休日カレンダまたは起動日雛形を変更すると起動日が再作成されます。
V5.0L30以降またはV5.2以降では、[ジョブスケジューラ起動パラメタの定義]ウィンドウ-[利用機能2]シートで[休日カレンダ/起動日雛形を使用しているジョブネットの起動日再作成を抑止する]チェックボックスをチェックしていない場合に、休日カレンダまたは起動日雛形を変更すると、起動日が再作成されます。
起動日を再作成すると、起動日が変更となる場合があります。
起動日が設定されていない場合
起動日を設定してください。
無効期間として設定されている場合
必要に応じて[無効期間]の設定を変更してください。[無効期間]は、以下の画面で変更できます。
【V13.3.1以前の場合】
[ジョブネットのプロパティ]ウィンドウ-[運用期間]シート
【V13.4.0以降の場合】
[ジョブネットのプロパティ]ウィンドウ-[起動日]シート
対処4
確認ポイント
“停止”操作を実施していませんか。または、“無効”操作を実施していませんか
原因
“停止”操作または、“無効”操作を実施した場合、ジョブネットは、起動されません。
対処方法
“停止”操作を実施している場合(停止中の状態)は、“停止解除”操作を実施してください。“無効”操作を実施している場合(無効状態)は、“無効解除”操作を実施してください。
なお、起動予定時刻の到来や待ち合わせているメッセージ事象の発生など、ジョブネットの起動条件が整っている場合、“停止解除”操作を行った時点でジョブネットは起動します。
対処5
確認ポイント
前回異常終了または強制終了していませんか。その場合、ジョブネットに対して、確認操作を実施していますか
原因
[ジョブスケジューラ起動パラメタの定義]ウィンドウ-[利用機能1]シートの[異常時の確認操作]の[詳細設定]ボタンを押下して表示された[確認操作の詳細設定]ウィンドウで、[ジョブネットの確認操作を有効とする](注)を指定している場合、ジョブネットが異常終了すると“確認”操作を実施するまで、次回起動されません。[強制終了を確認操作の対象とする](注)を指定している場合は、強制終了した場合も“確認”操作を実施するまで、次回起動されません。
注) V13.2.0以前の場合は、[ジョブスケジューラ起動パラメタの定義]ウィンドウ-[利用機能1]シート上で指定します。
ポイント
[ジョブネットの確認操作を有効とする]オプションについて
[ジョブネットの確認操作を有効とする]オプションの出荷時の状態は以下のとおりです。
UNIX版 : 確認操作が有効
Windows版 : 確認操作が有効でない
確認操作が有効でない場合、Systemwalker Operation Managerクライアントで、ジョブネットの操作の[確認]がグレーアウトされ、選択できない状態となります。
対処6
確認ポイント
プロジェクトに登録されているジョブネット数が多くないですか
原因
プロジェクトに登録されるジョブネット数が増えるとジョブネットの起動性能に影響を与えます。
以下の目安を参考にしてください。
最大255個までを制限としています。
制限はありませんが、以下の登録数を目安としてください。
Windows版:最大300個
UNIX版:最大500個
以下に示すマニュアルも併せて参照してください。
V10.0L20/10.1以降の場合
“解説書”の“ジョブのスケジューリングに関する制限値”
“使用手引書”または“運用ガイド”の“大量のジョブネットを登録する場合の留意事項”
V10.0L10/10.0の場合
“解説書”の“ジョブのスケジューリングに関する制限値”
対処方法
大量に登録されているジョブネットを複数のプロジェクトに分割することで、起動性能の改善ができます。
1プロジェクトあたりのジョブネット数はjobschprint -nコマンドで表示されるジョブネット数をカウントすることで確認できます。
対処7
確認ポイント
ジョブスケジューラのサービス/デーモンは、動作していますか
起動したジョブで、ジョブスケジューラのサービス/デーモンを止めるような動作は、していませんか
原因
ジョブネットの起動予定時刻が到来した時点で、ジョブスケジューラサービス/デーモンが動作している必要があります。
[ジョブネットのプロパティ]ウィンドウの[基本情報]シートで、[電源未投入時の処置として電源投入時に起動]チェックボックスにチェックがない場合、電源投入後の次回の起動予定がスケジュールされます。
対処方法
ジョブスケジューラのサービス/デーモンが停止していた場合は、起動させてください。
ジョブにより、ジョブスケジューラのサービス/デーモンを停止させている場合は、運用を見直してください。
[ジョブネットのプロパティ]ウィンドウの[基本情報]シートで、[電源未投入時の処置として電源投入時に起動]チェックボックスをチェックすると、電源投入後の次回のジョブスケジューラ起動時にジョブネットを起動することができます。
サーバ機能の起動を確認するためには、起動時の初期化処理が完了した時点で記録される以下のメッセージを確認してください。
syslog[UNIX版の場合]
MpJobsch: INFO: 0272: The jobscheduler daemon has been started.(注)
/etc/syslog.confにuser.infoの情報を記録するよう設定されている必要があります。
イベントログ[Windows版の場合]
MpJobsch:情報:1308:Systemwalker MpJobschサービスの起動が完了しました
対処8
確認ポイント
同時に大量のジョブネットを起動していませんか
原因
同時に大量のジョブネットを起動した場合、ジョブスケジューラはそれらを1つずつ起動するため、起動予定時刻より遅れて起動する場合があります。
対処方法
ジョブネットの起動予定時刻を分散して、同時に処理を集中させないような運用が可能かを検討してください。
対処9
確認ポイント
jobschprintコマンドの出力をmoreコマンドで止めていませんか
以下の方法で確認できます。
psコマンドを利用して、jobschprint プロセスが存在するかを確認します。
[確認例]
ps -ef | grep jobschprint
サーバ機能がインストールされているサーバで、タスクマネージャを利用して、jobschprint プロセスが存在するかを確認します。
原因
jobschprintコマンドの出力をmoreコマンドで止めた場合、スケジュール情報ファイルのロックが長時間発生し、ジョブネットの起動処理がスケジュール情報ファイルのロック解除を待つ状態となります。
対処方法
jobschprintコマンドの出力結果をファイルなどへリダイレクションし、テキストエディタで参照するようにしてください。
[確認例]
jobschprint -n > printn.txt
対処10
確認ポイント
Systemwalker Operation Managerクライアントの接続台数が多くありませんか
接続台数は、jobschprint -uコマンドを実施することで確認できます。
[確認例]
# jobschprint -u Jobsch User List date: YYYY/MM/DD time: HH:MM User Name Client Name Administrator CL1(XXX.XXX.XXX.XXX) Administrator CL2(xxx.xxx.xxx.xxx)
XXX.XXX.XXX.XXX、xxx.xxx.xxx.xxxはクライアントマシンのIPアドレス
Systemwalker Operation Managerクライアントで[F5]キー(画面のリフレッシュ)を連打していませんか
原因
Systemwalker Operation Managerクライアントは、定期的にジョブネットの情報を取得し、画面のリフレッシュを行います。その際、Systemwalker Operation Managerサーバのスケジュール情報ファイルの読み込みが発生します。
Systemwalker Operation Managerクライアントの接続台数が増加すると、画面リフレッシュ処理の回数が増加し、サーバでスケジュール情報ファイルのロックが発生します。
また、1台のSystemwalker Operation Managerクライアントで[F5]キーを連打した場合もSystemwalker Operation Managerクライアントの接続台数が多い状態と同じことが起こります。
対処方法
Systemwalker Operation Managerクライアントの同時接続台数は、できるだけ最小限に抑えてください。
また、Systemwalker Operation Managerクライアントの[F5]キー押下についても、できるだけ最小限に抑えてください。
接続台数については十分な検証を実施した上で決定してください。
対処11
確認ポイント
ジョブスケジューラのデータベースディレクトリをアクセス速度が遅いディスク装置に配置していませんか
原因
ジョブスケジューラのデータベースディレクトリをアクセス速度が遅いディスク装置に配置した場合、ファイルアクセスのパフォーマンスが低下し、ジョブスケジューラ本来の性能を発揮できない場合があります。
特に、ジョブネットの起動数が多い場合、同時にジョブネットを起動した際の遅延が顕著に表れます。
対処方法
ジョブスケジューラデータベースディレクトリは、ディスクI/Oの負荷を分散し、高性能な(アクセス速度が速い)ディスク装置に配置することを推奨します。
対処12
確認ポイント
ジョブネット/ジョブの終了出口に時間のかかる処理を追加していませんか
原因
ジョブスケジューラは出口の終了を待ち合わせ、それらが終了すると、次の要求を受け付ける動作をします。
したがって、ジョブネット/ジョブの終了出口に時間のかかる処理を実装すると、次のジョブネット/ジョブの起動が遅延する可能性があります。
対処方法
ジョブネット/ジョブ終了出口に時間のかかる処理を実装しないでください。または、各出口からバックグラウンドで処理を実行するようにしてください。
対処13
確認ポイント
テストモードで仮想時間を設定していませんか
対処方法
[Systemwalker Operation Manager環境設定]ウィンドウで、[起動パラメタ]をクリックすると表示される[ジョブスケジューラ起動パラメタの定義]ウィンドウ-[テストモード]シートで、[仮想時間の解除]を選択してください。その後、ジョブスケジューラのサービス/デーモンを再起動してください。
対処14
確認ポイント
[起動時刻の到来を待つ]にチェックがあるジョブネットでメッセージ事象が発生していない状態ではありませんか
原因
[起動時刻の到来を待つ]にチェックがある場合、起動時刻が到来してもメッセージ事象が発生していないとジョブネットは起動されません。
対処15
(V11.0L10/11.0以降)
確認ポイント
ジョブネットが“持ち越し”状態ではありませんか
原因
ジョブネットが“持ち越し”状態のまま本日の起動予定時刻が到来した場合、ジョブネットは、起動しません。本日の起動予定のジョブネットは実行拒否となります。
対処16
確認ポイント
メッセージキューが枯渇していませんか。ipcsコマンドなどで確認してください。
確認例
# ipcs -aq IPC status from <running system> as of 2005年08月08日 (月) 11時26分23秒 JST T ID KEY MODE OWNER GROUP CREATOR CGROUP CBYTES QNUM QBYTES LSPID LRPID STIME RTIME CTIME Message Queues: q 8300 0x2006528 -Rrw-rw-rw- root other root other 0 0 4096 7529 7528 11:22:19 11:22:19 11:14:06 q 3551 0x3006528 --rw-rw-rw- root other root other 560 40 4096 7449 7530 11:22:49 11:21:44 11:14:07 q 2102 0x5006528 -Rrw-rw-rw- root other root other 0 0 4096 7529 7531 11:22:19 11:22:19 11:14:07 q 2053 0x7006528 -Rrw-rw-rw- root other root other 0 0 4096 7355 7532 11:15:06 11:15:06 11:14:07
CBYTES、QNUMのフィールドを確認し、この値の総計が大きい場合、メッセージキューが枯渇していると判断できます。
原因
ジョブスケジューラデーモンは、複数のデーモンプロセスで構成されており、メッセージキュー(IPC資源)を利用して互いに同期をとりながら動作しています。ジョブスケジューラデーモンが、プロセス間通信の失敗により、リトライ処理を行っていると、ジョブの状態を正しく表示できない場合があります。
対処方法
メッセージキューをチューニングしてください。または、メッセージキューを異常に消費しているアプリケーションが存在しないか確認してください。
メッセージキューのチューニングについては、“4.13.4 ジョブスケジューラサーバの処理がハングアップしてしまう【UNIX版】”を参照してください。
対処17
確認ポイント
休日カレンダの変更を大量に行っていませんか
原因
カレンダを大量に修正し、保存した場合、起動日の再作成に時間がかかる場合があります。
対処方法
休日カレンダは数個ずつ時間を空けて変更してください。
対処18
確認ポイント
ジョブネット/ジョブの終了出口の処理は終了していますか
タスクマネージャで出口のプロセスが終了しているか確認してください。
psコマンドなどで出口のプロセスが終了しているか確認してください。
原因
ジョブスケジューラは出口の終了を待ち合わせ、それらが終了すると、次の要求を受け付けます。したがって、ジョブネット/ジョブの終了出口で処理が止まっている場合、ジョブネットやジョブの起動処理ができません。
対処方法
出口が終了しない状態の場合は、ジョブスケジューラのサービスまたはデーモンを再起動してください。またジョブネット/ジョブ終了出口の処理を修正してください。
対処19
確認ポイント
運用ノードと待機ノードで異なる日変わり時刻が設定されていませんか
対処方法
運用ノードと待機ノードの日変わり時刻を同一時刻に設定してください。