ページの先頭行へ戻る
Interstage Big DataParallel Processing Server V1.2.2 ユーザーズガイド
FUJITSU Software

11.6.2 Hadoop入力データファイルの準備

Hadoop入力データファイルは、Hadoopジョブの実行前にあらかじめDFSに格納しておく必要があります。
Hadoop入力データファイルのDFS上のパスをMapReduce設定ファイルに指定します。Hadoop入力データファイルのパスにディレクトリを指定した場合、そのディレクトリ内のすべてのファイルが読み込まれます。


レコードのレイアウトが異なる複数のファイルをHadoop入力データファイルとして指定することも可能です。

図11.1 複数のディレクトリ(input01、input02)を指定する例


注意

Hadoop入力データファイルにディレクトリを指定する場合、ディレクトリ内のファイルのレコードレイアウトは同一である必要があります。