本付録では、本製品で提供する Hadoop に関する設定パラメーターについて説明します。
本製品のセットアップ時に、Hadoop から DFS を使用するためのパラメーターや Hadoop ジョブの並列分散処理の最適化を行うパラメーターが自動的に設定されます。
ここでは、オープンソフトウェア Apache Hadoop で提供される設定ファイル(pdfs-site.xml を除く)において初期値から変更されるパラメーターと OS の設定ファイルに追加するパラメーターを示します。
設定ファイル | 説明 | 配置ディレクトリ |
---|---|---|
Hadoop で使用する環境変数を定義する設定ファイルです。 | /etc/hadoop | |
Hadoop の共通的な設定ファイルです。 | /etc/hadoop | |
MapReduce に関する設定ファイルです。 | /etc/hadoop | |
DFS に関する設定ファイルです。 | /etc/hadoop | |
カーネルパラメーターを記述する OS の設定ファイルです。 | /etc | |
システムのリソースを制限する OS の設定ファイルです。 | /etc/security |
注意
設定ファイルの各パラメーターの詳細については、本書では説明しません。必要に応じて、Apache Hadoop プロジェクトの Web ページ等を参照してください。
構成設定をチューニングする場合は、スレーブサーバ数の変更に伴う設定変更(「13.1.7 Hadoop 設定パラメーターの変更」を参照)を除き、セットアップ直後に変更することを推奨します。
なお、運用を開始した以降で Hadoop 設定パラメーターを変更する必要が生じた場合には、マスタサーバ、スレーブサーバおよび開発実行環境サーバ毎に設定を見直してください。