ページの先頭行へ戻る
Symfoware Analytics Server(Operational Data Store編) 運用ガイド
FUJITSU Software

2.9.1 ロードコマンド異常終了時のリカバリ

ロードコマンド(dlofentry)が異常終了した場合は、次の作業が必要です。

これらの作業を行わなかった場合、dlofentryコマンドを再実行すると異常終了することがあります。

以降では、dlofentryコマンドが異常終了したときのリカバリ手順について説明します。


2.9.1.1 エラー原因の除去

dlofentryコマンドが異常終了した原因を資源管理ログから判断して、対処します。

dlofentryコマンド実行時に発生する代表的なトラブルは、“トラブルシューティング集“の“データ格納時の異常”を参照してください。

また、出力されたメッセージの詳細は“メッセージ集”を参照してください。


2.9.1.2 格納途中のファイルの削除

dlofentryコマンドは、データ格納時にエラーが発生すると、格納途中の蓄積データファイルを削除します。

ただし、プロセスダウンや強制終了などにより削除できなかった場合、格納途中の蓄積データファイルが残存することがあります。

格納途中のファイルが抽出対象となることはありませんが、ディスク容量の枯渇を防ぐため、削除してください。

格納途中のファイルがあるかどうかは、dcccheckコマンドを使用して確認します。dcccheckコマンドを使用した不整合の検出と検出したあとの対処は、“3.6 不整合の検出”を参照してください。


2.9.1.3 作成中状態の管理レコードの削除

dlofentryコマンドは、データ格納時にエラーが発生すると、資源管理上の管理レコードを削除します。

しかし、プロセスダウン、ロードコマンドの強制終了、資源管理に異常が発生した場合は、資源管理上の管理レコードは“作成中”状態のまま残ってしまいます。“作成中”状態の管理レコードは、蓄積データファイル作成中状態解除コマンド(dccunlock)と資源管理状態変更コマンド(dccres)を使用して削除します。

管理レコードの削除手順を以下に示します。

注意

“作成中”状態の管理レコードが存在しても、運用は継続できます。

ただし、異常終了したときと同じ蓄積データファイル名を使用すると、データ格納は行えません。


  1. 排他獲得番号の確認

    dlofentryコマンドが管理レコードを登録するときに資源管理から排他獲得番号が払い出されます。払い出された排他獲得番号は、資源管理ログファイルにメッセージID“dcr04021-i”のログとして出力されます。

    排他獲得番号は、ローダを実行した時間とログに出力されているプロセスIDから特定します。

    入力データファイルの形式に誤りがあったときのログ出力例

    [日時] FSP_INTS-IS_IIS: INFO: dcr04021-i: (001709) 排他獲得番号=6837  ファイル登録日時=2009/11/16/16:52:31.852
    [日時] FSP_INTS-IS_IIS: ERROR: dlx00021-e: (001709) in_fileパラメタに指定したファイルに誤りがあります。(エラーレコード=1)
    [日時] FSP_INTS-IS_IIS: INFO: dla00004-i: (001709) 蓄積データファイル作成・登録処理は異常終了しました。

    ロードコマンド異常終了時に出力されたメッセージID“dla00004-i”のログからプロセスIDが“001709”であることがわかります。

    同じプロセスID“001709”を持つメッセージID“dcr04021-i”のログから、排他獲得番号“6837”、ファイル登録日時が“2009/11/16/16:52:31.852”であることがわかります。

    ロードコマンドを強制終了した場合はメッセージID“dla00004-i”のログが出力されないため、ロードコマンドを実行した時間からメッセージID“dcr04021-i”のログを探してください。

    資源管理ログファイルにメッセージID“dcr04021-i”のログが出力されていない場合は、資源管理に管理レコードが作成されていないため、以降の作業は不要です。障害の原因を取り除いてロードコマンドを再実行してください。

    ポイント

    排他獲得番号とファイル登録日時は、資源管理情報の表示コマンド(iiscat)または不整合検出コマンド(dcccheck)でも参照できます。

    • 資源管理情報の表示コマンド(iiscat)を使用すると、資源管理に登録されている蓄積データファイルの情報を出力できます。レコードの状態(Record)、蓄積データファイルを更新した日時(UpdateDate)、蓄積データファイルを格納した日時(RegistDate)から、目的の排他獲得番号を特定します。詳細は“4.2.4 資源管理の運用情報のモニタリング”を参照してください。

    • 不整合検出コマンド(dcccheck)を使用すると、カテゴリごとに対処が必要な管理レコードと排他獲得番号の一覧を出力できます。詳細は“3.6.2 不整合検出後の対処について”を参照してください。
      ただし、dcccheckコマンドを実行中は、対象となるカテゴリへのデータの格納および抽出が行えません。dcccheckコマンドを使用する場合は、事前に運用状況を確認してください。


  2. dccunlockコマンドの実行

    dccunlockコマンドにより管理レコードを無効化します。dccunlockコマンドは、排他獲得番号と排他獲得日時をもとに“作成中”状態の管理レコードを“無効”状態に変更します。

    蓄積データファイル作成中状態解除コマンドにより管理レコードを無効化する

    dccunlock mode=cf cat_name=cat exc_num=6837 exc_date=2011/05/25/16:52:31.852 <Enter>
    FSP_INTS-IS_IIS: INFO: dcx00122-i: プログラムを開始します。(dccunlock)

    カテゴリ名 : cat
    排他獲得番号 : 6837
    排他獲得日時 : 2011/05/25/16:52:31.852
    解除状態 : 解除しました

    FSP_INTS-IS_IIS: INFO: dcc09200-i: コマンドが終了しました。(dccunlock 終了コード=1)


    実行時に以下のメッセージが表示された場合、該当レコードはすでに無効化されています。

    問題はないため、次の手順に進んでください。

    カテゴリ名 : cat
    排他獲得番号 : 6837
    排他獲得日時 : 2009/11/16/16:52:31.852
    解除状態 : すでに解除済です

    参照

    dccunlockコマンドの詳細は“コマンドリファレンス”を参照してください。


  3. dccresコマンド実行

    dccresコマンドにより、資源管理から手順2で“無効”状態に変更された管理レコードを削除します。

    資源管理状態変更コマンドにより無効レコードを削除する

    dccres mode=dri cat_name=CSVCPM regi_date=2011/05/25/12:00:00.000<Enter>
    FSP_INTS-IS_IIS: INFO: dcx00122-i: プログラムを開始します。(dccres)
    FSP_INTS-IS_IIS: INFO: dcc09200-i: コマンドが終了しました。(dccres 終了コード=0)

    参照

    dccresコマンドの詳細は“コマンドリファレンス”を参照してください。