Hadoop入力データファイルは、Hadoopジョブの実行前にあらかじめDFSに格納しておく必要があります。
Hadoop入力データファイルのDFS上のパスをMapReduce設定ファイルに指定します。Hadoop入力データファイルのパスにディレクトリを指定した場合、そのディレクトリ内のすべてのファイルが読み込まれます。
レコードのレイアウトが異なる複数のファイルをHadoop入力データファイルとして指定することも可能です。
図11.1 複数のディレクトリ(input01、input02)を指定する例
注意
Hadoop入力データファイルにディレクトリを指定する場合、ディレクトリ内のファイルのレコードレイアウトは同一である必要があります。