Mapタスクで使用するMap入力データファイルおよびMap出力データファイルは、外部プログラム実行コマンドラインの引数として指定します。外部プログラム実行コマンドラインはMapReduce設定ファイルで記述します。
Mapタスクの外部プログラムは、Map入力データファイルとMap出力データファイルをそれぞれ1つオープンできます。
以下の例では、異なる2つのHadoop入力データファイルを2つの外部プログラムに割り当ててMapタスクを実行しています。
Hadoop入力データファイル(1)を外部プログラム(1)に割り当て Hadoop入力データファイル(2)を外部プログラム(2)に割り当て
注意
Map入力データファイルおよびMap出力データファイルは、一般ファイルではなく名前付きパイプとなります。
そのため、外部プログラム内でファイルに対して、シーク(seek)やJavaのisFile()メソッドなどを使用することはできません。