ページの先頭行へ戻る
Interstage Big Data Parallel Processing Server V1.2.0 ユーザーズガイド
FUJITSU Software

11.6.2 Hadoop入力データファイルの準備

Hadoop入力データファイルは、Hadoopジョブの実行前にあらかじめDFSに格納しておく必要があります。

Hadoop入力データファイルのDFS上のパスをMapReduce設定ファイルに指定します。Hadoop入力データファイルのパスにディレクトリを指定した場合、そのディレクトリ内のすべてのファイルが読み込まれます。


レコードのレイアウトが異なる複数のファイルをHadoop入力データファイルとして指定することも可能です。

図11.1 複数のディレクトリ(input01、input02)を指定する例


注意

Hadoop入力データファイルにディレクトリを指定する場合、ディレクトリ内のファイルのレコードレイアウトは同一である必要があります。