障害対策の1つに、システムや定義情報などを二重化しておく方法があります。
万一のトラブルに備えて、システムや定義情報などを二重化をしておくことで、バックアップ同様、トラブルによる影響を少なくおさえることができます。
以下に、Systemwalker Operation Managerで対応できる二重化について説明します。
クラスタシステム
Systemwalker Operation Managerはクラスタシステムに対応しています。
クラスタシステムは、連携された複数のサーバを全体で1つのサーバとして運用するもので、あるサーバで障害が発生しても、別のサーバで処理を引き継ぐため、単体サーバで運用するシステムに比べて、高い可用性を実現できます。
クラスタシステムの詳細については、“Systemwalker Operation Manager クラスタ適用ガイド Windows編”または“Systemwalker Operation Manager クラスタ適用ガイド UNIX編”を参照してください。
実行サーバの二重化
ネットワークジョブの実行サーバがシステムダウンした場合に備えて、実行サーバを二重化できます。
実行サーバとして第1候補(実行サーバA)、第2候補(実行サーバB)を指定しておくことで、第1候補の実行サーバがダウンしていた場合に、第2候補の実行サーバへ自動的にジョブの実行が依頼されます。詳細については、“8.4.2 実行サーバのトラブル発生時に業務を継続する方法(ネットワークジョブの実行サーバの二重化)”を参照してください。
また、サーバのシステムダウン時に自動的に別のサーバでジョブを実行させる方法として、分散実行があります。分散実行は、本来、複数の実行サーバをグループ化し、負荷の低い実行サーバに自動的にジョブを割り振る機能ですが、グループ内の実行サーバがシステムダウンした場合には、グループ内の負荷の低い実行サーバに自動的に割り振られるので、実行サーバの二重化としても利用できます。
それぞれのメリット、デメリットがあるため、以下を参考に検討してください。
メリット | デメリット | |
実行サーバの二重化 | 通常第1候補のサーバで実行。第1候補のサーバがダウンしている場合だけ、第2候補で実行。異常時だけ代替サーバで実行するという運用が可能。 | 第1候補のサーバがダウンした場合、まずは第1候補のサ-バに投入を試みてから第2候補に遷移するため、投入に時間がかかる。 |
分散実行 | 最大100台まで分散先サーバを設定可能。特定のサーバがダウンした場合、最大10分間該当サーバがダウンしたと認識し、該当サーバへの投入を行わないようにできる(ダウンしているサーバへの投入を試みることはない)。 | ジョブがどのサーバで実行されるか予測が出来ない。 |
スケジュール情報ファイルの二重化
jmmodeコマンドでバックアップファイルへの書き込みを有効化しておくことで、スケジュール情報を格納したファイル(スケジュール情報ファイルと呼びます)を二重化できます。
二重化を指定した場合、スケジュール情報ファイルとバックアップファイルの書込みを同期書込みで行います。同期書込みにより、スケジュール情報ファイルの不整合が発生しにくくなります。ただし、グループ、ジョブネット、ジョブのスケジュール性能・起動性能は劣化します。スケジュールどおりに問題なくジョブネットが起動されるか、十分に性能検証を行った後に運用してください。二重化を指定した場合においても、OSがディスクに書込んでいる途中に電源切断が起きた場合などでは、スケジュール情報ファイルの不整合が発生するおそれがあります。このような場合に備えて、定期的にバックアップをする運用を検討してください。
二重化を指定しない場合は、スケジュール性能・起動性能の劣化は避けられます。ただし、予定外の電源切断などによりスケジュール情報ファイルの不整合が発生する可能性が高くなりますので、定期的にバックアップを実施し、障害発生時にはリストアをする運用を検討してください。
コマンドの詳細については、“Systemwalker Operation Manager リファレンスマニュアル”の“jmmode 実行継続モード切り替えコマンド”を参照してください。