ページの先頭行へ戻る
Systemwalker Software Configuration Manager トラブルシューティングガイド
FUJITSU Software

3.4.1 ジョブの動作中に管理サーバがダウンした場合の対処

対象バージョンレベル

3.4.1.1 対処

対処方法(V15.3.0~V15.4.0)

パッチ配付・適用、パラメーター設定、スクリプト実行、または、構成変更のジョブの動作中に、管理サーバにシステムダウンなどの異常が発生した場合、管理サーバを復旧後、動作中であったジョブが以下の状態となり正常に動作しなくなる場合があります。

swrba_recoverprocess(プロセスリカバリコマンド)またはswcfmg_job(ジョブ情報管理コマンド)で、上記のジョブを中止し、必要に応じて再度依頼を行ってください。

操作

  1. 管理サーバを復旧し、管理サーバにログインします。

  2. 以下のコマンドを実行して、Systemwalker Runbook Automationが正常に起動していることを確認します。

    Windows

    %SWRBA_HOME%\bin\swrba_status

    Linux

    /opt/FJSVswrbam/bin/swrba_status

  3. 状態が実行中のまま処理が進まなくなったジョブを中止します。

    1. swrba_recoverprocessコマンドを実行して、処理が進まなくなったジョブを中止します。

      Windows

      %SWRBA_HOME%\bin\swrba_recoverprocess

      Linux

      /opt/FJSVswrbam/bin/swrba_recoverprocess

      コマンド実行時の出力例を以下に示します。

      例)

      PROCESSID:1599523(ACTIVITYID:1599525) is recovered
      PROCESSID:1600057(ACTIVITYID:1600059) is recovered
      PROCESSID:1600595(ACTIVITYID:1600600) is recovered
      PROCESSID:1600595(ACTIVITYID:1600601) is recovered
      PROCESSID:1600595(ACTIVITYID:1600602) is recovered

      例)

      PROCESSID:1600071(ACTIVITYID:1600073) recovery failed
      FSP_SW/RB-A_BASE: ERROR: 03013: I/O error. : PROCESSID='1600071' ACTIVITYID='160
      0073' PATH='C:\Fujitsu\Systemwalker\SWRBAM\etc\share\rbaope\opeparts\output\1600
      071_1600073\status.dat' DETAIL='invalid stream header'
    2. swrba_admin(プロセス状態確認コマンド)を実行して、中止されたジョブを確認します。プロセスインスタンスID は、swrba_recoverprocessコマンドの出力に表示されたPROCESSIDの値です。プロセス制御用のユーザーの初期値は"swrbaadmin"、パスワードの初期値は"systemwalker#1"です。

      Windows】

      %SWRBA_HOME%\bin\swrba_admin pi-list -user <プロセス制御用のユーザー> -password <パスワード> -piid <プロセスインスタンスID> -appid cfmgApplication

      Linux】

      /opt/FJSVswrbam/bin/swrba_admin pi-list -user <プロセス制御用のユーザー> -password <パスワード> -piid <プロセスインスタンスID> -appid cfmgApplication

      コマンド実行時の出力例を以下に示します。ProcessInstanceNameに中止されたジョブのジョブIDが表示されます。

      例)

      ProcessInstanceID       ProcessInstanceName     Status  Initiator
      1599525          000000500        aborted         manage
      1件検索しました。
      FSP_SW/RB-A_BASE: INFO: 02001: pi-listが正常終了しました。  Option:pi-list -piid 1599525 -appid cfmgApplication Code:0
  4. 状態が選択中(異常)となったジョブを中止します。

    1. swcfmg_jobコマンドで状態が選択中(異常)のジョブを確認します。

      Windows】

      [Systemwalker Software Configuration Managerインストールディレクトリ]\SWCFMGM\bin\swcfmg_job -list -status selecting_abnormal

      【Linux】

      /opt/FJSVcfmgm/bin/swcfmg_job -list -status selecting_abnormal

    2. swcfmg_jobコマンドでジョブの詳細情報を取得します。

      Windows】

      [Systemwalker Software Configuration Managerインストールディレクトリ]\SWCFMGM\bin\swcfmg_job -get -id <ジョブID>

      Linux】

      /opt/FJSVcfmgm/bin/swcfmg_job -get -id <ジョブID>

      構成変更のスクリプト実行またはコマンド実行の処理中に管理サーバがダウンした場合、処理結果にCFMGP20008のメッセージが表示され復帰値と詳細に以下のメッセージが出力されます。

      • 復帰値

        189
      • 詳細

        [LinkExpRBA] CategoryCode : 40
        [LinkExpRBA] ErrorCode    : 10
        [LinkExpRBA] DetailCode   : 100
    3. swcfmg_jobコマンドでジョブを中止します。

      Windows】

      [Systemwalker Software Configuration Managerインストールディレクトリ]\SWCFMGM\bin\swcfmg_job -select -id <ジョブID> -action cancel

      Linux】

      /opt/FJSVcfmgm/bin/swcfmg_job -select -id <ジョブID> -action cancel

  5. 管理サーバを復旧したインフラ管理者は、中止したジョブの管理者に中止したジョブを通知します。

  6. ジョブの管理者は、管理コンソールの[ジョブ管理]画面から、最後に異常終了した処理または予期しないエラーとなっている処理の内容を確認後、対象の業務サーバに乗り込むなどして処理の実行結果を手動で確認してください。その後、必要に応じて再度パッチ配付・適用、パラメーター設定、スクリプト実行、または、構成変更の依頼を行ってください。構成変更の依頼を再度行う場合、以前の構成変更テンプレートをそのまま使用できない場合があります。必要に応じて構成変更テンプレートを修正または新規作成してください。

対処方法(V15.5.0以降)

パッチ配付・適用、パラメーター設定、スクリプト実行、または構成変更のジョブの動作中に、管理サーバにシステムダウンなどの異常が発生した場合、管理サーバを復旧後、動作中であったジョブが以下の状態となり、正常に動作しなくなる場合があります。

swcfmg_job(ジョブ情報管理コマンド)で後者のジョブを中止した後、必要に応じて上記のジョブを再度依頼してください。

操作

  1. 管理サーバを復旧し、管理サーバにログインします。

  2. 以下のコマンドを実行して、製品が正常に起動していることを確認します。

    Windows】

    [Systemwalker Software Configuration Managerインストールディレクトリ]\SWCFMGM\bin\swcfmg_status

    Linux】

    /opt/FJSVcfmgm/bin/swcfmg_status
  3. 状態が完了(異常)となったジョブを確認します。

    Windows】

    [Systemwalker Software Configuration Managerインストールディレクトリ]\SWCFMGM\bin\swcfmg_job -status completed_abnormal

    Linux】

    /opt/FJSVcfmgm/bin/swcfmg_job -status completed_abnormal
  4. 状態が選択中(異常)となったジョブを中止します。

    1. swcfmg_jobコマンドで状態が選択中(異常)のジョブを確認します。

      Windows】

      [Systemwalker Software Configuration Managerインストールディレクトリ]\SWCFMGM\bin\swcfmg_job -list -status selecting_abnormal

      Linux】

      /opt/FJSVcfmgm/bin/swcfmg_job -list -status selecting_abnormal
    2. swcfmg_jobコマンドでジョブの詳細情報を取得します。

      Windows】

      [Systemwalker Software Configuration Managerインストールディレクトリ]\SWCFMGM\bin\swcfmg_job -get -id <ジョブID>

      Linux】

      /opt/FJSVcfmgm/bin/swcfmg_job -get -id <ジョブID>

      構成変更のスクリプト実行またはコマンド実行の処理中に管理サーバがダウンした場合、処理結果にCFMGP20008のメッセージが表示され復帰値と詳細に以下のどちらかのメッセージが出力されます。

      復帰値

      詳細

      0

      The operation component was successful.

      189

      parts00041: The state of the process was not able to be confirmed.

      parts00002: The communication method with the business server was not able to be decided.

      parts00074: It is not possible to connect to the server. type=(LinkExpRBA) detail=(CategoryCode : 40 ErrorCode : 10 DetailCode : 100)

      parts00074: It is not possible to connect to the server. type=(SSH) detail=(Connection refused - Connection refused)

      parts00074: It is not possible to connect to the server. type=(Telnet) detail=(Connection refused - Connection refused)

    3. swcfmg_jobコマンドでジョブを中止します。

      Windows】

      [Systemwalker Software Configuration Managerインストールディレクトリ]\SWCFMGM\bin\swcfmg_job -select -id <ジョブID> -action cancel

      Linux】

      /opt/FJSVcfmgm/bin/swcfmg_job -select -id <ジョブID> -action cancel
  5. 管理サーバを復旧したインフラ管理者は、手順3および手順4のジョブの管理者にジョブIDを通知します。

  6. ジョブの管理者は以下の作業を実施してください。

    1. 管理コンソールの[ジョブ管理]画面から、通知されたジョブの最後に異常終了した処理または予期しないエラーとなっている処理の内容を確認します。

    2. 対象の業務サーバに乗り込むなどして処理の実行結果を手動で確認します。

    3. 必要に応じて再度パッチ配付・適用、パラメーター設定、スクリプト実行、または構成変更の依頼を行ってください。

      構成変更の依頼を再度行う場合、以前の構成変更テンプレートをそのまま使用できない場合があります。必要に応じて構成変更テンプレートを修正または新規作成してください