データ抽出セルおよび実行クラスは、以下の観点で定義する数を検討します。
データ抽出セルと抽出対象となる蓄積データファイルの関係
抽出処理は、データ抽出セルに抽出対象となる蓄積データファイルをファイル単位で割り当てて並列に実行します。このため、1つのデータ抽出セルに対する抽出対象となる蓄積データファイル数とデータ量により、抽出処理時間が変わります。
データ抽出セルと使用するCPUのコア数の関係
データ抽出セルは、蓄積データファイルの解凍処理と抽出処理を同時に実行します。このため、同時に最大で2コアを使用します。
抽出要求の目的(バッチ業務なのか、即時実行させたいのか)
実行クラスは、実行クラスごとに相乗り待ち合わせ時間を割り当てることで、定期的な抽出と非定期的な抽出のそれぞれを効率よく実行できます。
実行クラスで使用するデータ抽出セルは、業務特性に合わせて分けることもできます。
データ抽出セルは、抽出制御動作環境定義ファイルのDECellパラメタで定義します。
実行クラスは、抽出制御動作環境定義ファイルのClassパラメタで定義します。
ポイント
データ抽出セルは、運用中に追加、削除、変更できます。 そのため、運用開始後にデータ量の増加や性能要件の変化があった場合も、データ抽出セルを追加することで対応できます。
参照
実行クラスの概要については、“解説書”の“実行クラス制御”を参照してください。
抽出制御動作環境定義ファイルの詳細については、“導入ガイド”の“抽出制御動作環境定義ファイルのパラメタ”を参照してください。
相乗り待ち合わせ時間の設計
相乗り待ち合わせ時間は、実行クラスごとに設定できます。相乗り待ち合わせ時間は、その実行クラスで行う、抽出要求の種類によって設定します。
定期的な抽出要求(バッチ業務など)
なるべく多くの抽出要求を相乗りさせて、1回の抽出処理で、多くの抽出要求を処理させる方が効果的であるため、相乗り待ち合わせ時間として大きな値を指定します。
非定期的な抽出要求
即時実行性を高めるため、相乗り待ち合わせ時間として小さな値を指定します。0を指定した場合は、相乗り待ち合わせを行わず即時実行されます。
相乗り待ち合わせ時間は、抽出制御動作環境定義ファイルのClassパラメタで定義します。
参照
相乗り待ち合わせ時間の概要については、“解説書”の“相乗り制御・相乗り待ち制御”を参照してください。
出力先ディレクトリの設計
データ抽出セルで抽出処理を行った抽出結果中間ファイルを出力するディレクトリについて検討します。 出力先ディレクトリとしては、以下の観点で決定します。
I/Oが競合しないようにするため、出力先ディレクトリは別ディスクに配置することを推奨
出力先ディレクトリを複数の実行クラスで共用するときは、同時に実行される頻度が低い実行クラスとする
データ抽出セルの数分、出力先ディレクトリを用意することを推奨
出力先ディレクトリは、抽出制御動作環境定義ファイルのOutFolderパラメタで定義します。
ポイント
参照
抽出制御プロセスのパラメタの詳細については、“B.2 抽出制御動作環境定義ファイルのパラメタ”を参照してください。
また、データ抽出セルのパラメタの詳細については、“B.3 データ抽出エージェント動作環境定義ファイルのパラメタ”を参照してください。