分析サーバに必要となる資源
Hadoop連携構成を使用する場合、分析サーバ上にHadoopのクライアントもしくはInterstage Big Data Parallel Processing Server開発実行環境サーバをインストールします。したがって、分析サーバには、“4.2 分析サーバの基本構成の資源見積り”に加え、HadoopのクライアントもしくはInterstage Big Data Parallel Processing Server開発実行環境サーバの資源が必要になります。
Interstage Big Data Parallel Processing Server開発実行環境サーバに必要な資源見積もりについての詳細は、“Interstage Big Data Parallel Processing Server ユーザーズガイド”を参照してください。
Hadoop上に必要となる資源
HadoopもしくはInterstage Big Data Parallel Processing Serverのストレージ上にInterstage Business Analytics Modeling Server分析サーバと連携するための“Hadoop上の作業用ディレクトリ”を確保する必要があります。Hadoop連携を行う分析フローにおいて、Hadoop上の作業用ディレクトリに必要となる容量は、以下の式で概算を算出することができます。
Hadoop上の実行時容量=Hadoop上の入力データ(※1)×分析フローに配置されている部品のうち中間データをHadoop上の作業用ディレクトリに出力する部品数
※1:Hadoop上に管理している大規模なデータは、分析サーバ上にコピーせず、Hadoop上の作業ディレクトリで処理を行うことを想定しています。
必要なディスク容量=同時実行させるフロー数分の“Hadoop上の実行時容量”の総和(※2)
※2:レプリケーション数が1、圧縮無しの場合の概算を算出する式です。Hadoopでは、HDFSのレプリケーション数や圧縮の有無などの設定により、必要なディスク容量は変わります。設定に応じて見積もりを行ってください。
Interstage Big Data Parallel Processing Serverのストレージ上に必要な資源見積もりについての詳細は、“Interstage Big Data Parallel Processing Server ユーザーズガイド”を参照してください。