以下に、外部プログラム並列実行機能を利用する際の作業手順を示します。
外部プログラムの開発
MapタスクおよびReduceタスクとしてHadoop上で実行する外部プログラムを開発します。詳細は「11.4 外部プログラムの開発」を参照してください。
MapReduce設定ファイルの記述
Hadoop上で外部プログラムを実行するために必要な情報をMapReduce設定ファイルに記述します。詳細は「11.5 MapReduce設定ファイル」を参照してください。
Hadoopジョブの実行
外部プログラム並列実行コマンドを利用して、外部プログラムを並列実行するためのHadoopジョブを実行します。詳細は「11.6 Hadoopジョブの実行」を参照してください。