データ抽出セルの数は、実行する抽出処理の、同時に抽出を行う蓄積データファイルの数によって決定します。
データ抽出セルの最大数は、抽出サーバセットを配置するサーバマシンのコア数の合計以下にするようにしてください。
ポイント
データ抽出セルは運用中に追加、削除、変更することができます。 そのため、設計時の見積もりより同時に抽出を行う蓄積データファイル数が増加しても、データ抽出セルを追加することで、データ量の増加に伴う、抽出時間の増加を抑えることができます。
実行クラスを決定します。実行クラスは、抽出要求の目的によって、以下の観点で定義する実行クラスの数を検討してください。
対象となる蓄積データファイル数に対してデータ抽出セルが少ないと、抽出時間が長くなる場合があります。
バッチ業務なのか、即時実行させたいのか
実行クラスごとに相乗り待ち合わせ時間を割り当てることで、定期的な抽出と非定期的な抽出それぞれを効率よく実行させることが出来ます。
業務特性に合わせて使用するデータ抽出セルを分けます。
実行クラスは、抽出制御動作環境定義ファイルのClassパラメタで定義します。
参照
実行クラスの概要については、“解説書”の“3.4.2.4 実行クラス制御”を参照してください。
相乗り待ち合わせ時間の設計
相乗り待ち合わせ時間は、実行クラス毎に設定できます。相乗り待ち合わせ時間は、その実行クラスで行う、抽出要求の種類によって設定します。
定期的な抽出要求(バッチ業務など)
なるべく多くの抽出要求を相乗りさせて、1回の抽出処理で、多くの抽出要求を処理させる方が効果的であるため、相乗り待ち合わせ時間として大きな値を指定します。
非定期的な抽出要求
即時実行性を高めるため、相乗り待ち合わせ時間として小さな値を指定します。0を指定した場合は、相乗り待ち合わせを行わず即時実行されます。
相乗り待ち合わせ時間は、抽出制御動作環境定義ファイルのClassパラメタで定義します。
参照
相乗り待ち合わせ時間の概要については、“解説書”の“3.4.2.2 相乗り制御・相乗り待ち制御”を参照してください。
出力先ディレクトリの設計
データ抽出セルで抽出処理を行った抽出結果中間ファイルを出力するディレクトリについて検討します。 出力先ディレクトリとしては、以下の観点で決定します。
I/Oが競合しないようにするため、出力先ディレクトリは別ディスクに配置することを推奨
出力先ディレクトリを複数の実行クラスで共用するときは、同時に実行される頻度が低い実行クラスとする
データ抽出セルの数分、出力先ディレクトリを用意することを推奨
出力先ディレクトリは、抽出制御動作環境定義ファイルのOutFolderパラメタで定義します。
ポイント
参照
抽出制御プロセスのパラメタの詳細については、“B.2 抽出制御動作環境定義ファイルのパラメタ”を参照してください。
また、データ抽出セルのパラメタの詳細については、“B.3 データ抽出エージェント動作環境定義ファイルのパラメタ”を参照してください。