Hadoopジョブの実行はJobClientを介してJobTrackerに依頼します。もっとも一般的なJobClientの利用方法は、hadoop jarコマンドを実行することです。
これによりJobTrackerにHadoopジョブの実行が依頼され、(スロットに空きがあれば)即時に実行が開始されます。その後、JobClientは定期的にJobTrackerにHadoopジョブの進行状況を問い合わせ、上記のコマンドを実行した端末に状況を通知します。ここでJobClientが接続しているのはJobTrackerであり、Hadoopジョブを直接制御してはいないことに注意してください。たとえば上記のhadoop jarコマンドをCtrl+Cなどにより停止しても、通常はJobTrackerから切断されるだけでHadoopジョブは停止しません。
Hadoopジョブを確実に停止するには、hadoop job コマンドの-killオプションにジョブIDを指定して実行します。ジョブIDはJobClientの端末に表示される他、hadoop jobコマンドの-listオプションでも確認することができます。
参考
ジョブIDは以下の形式にとなっています。
job_YYYYMMDDhhmm_NNNN
YYYYMMDDhhmm = JobTrackerの起動時刻 NNNN = JobTrackerの起動以降に依頼されたHadoopジョブの通番
bdpp_submitjobコマンドをCtrl+Cなどにより停止した場合には、Hadoopジョブも停止します。
参照
Hadoopジョブの起動・停止の方法については、「第10章 ジョブの実行・停止」を参照してください。