Hadoop入力データファイルは、Hadoopジョブの実行前にあらかじめDFSに格納しておく必要があります。
Hadoop入力データファイルのDFS上のパスを「MapReduce設定ファイル」に指定します。Hadoop入力データファイルのパスにディレクトリを指定した場合、そのディレクトリ内のすべてのファイルが読み込まれます。
ファイル編成やレコードのレイアウトが異なる複数のファイルをHadoop入力ファイルにすることもできます。
図2.1 複数のディレクトリ(input01、input02)を指定する例
注意
Hadoop入力データファイルにディレクトリを指定する場合、ディレクトリ内のファイルのファイル編成、レコード長形式(固定長または可変長)、レコード長は同一でなければなりません。