Hadoop入力データファイルは、Hadoopジョブの実行前にあらかじめDFSに格納しておく必要があります。
Hadoop入力データファイルのDFS上のパスをMapReduce設定ファイルに指定します。Hadoop入力データファイルのパスにディレクトリを指定した場合、そのディレクトリ内のすべてのファイルが読み込まれます。
レコードのレイアウトが異なる複数のファイルをHadoop入力データファイルとして指定することも可能です。
注意
Hadoop入力データファイルにディレクトリを指定する場合、ディレクトリ内のファイルのレコードレイアウトは同一である必要があります。