ページの先頭行へ戻る
NetCOBOL V11.1 ユーザーズガイドHadoop連携機能編
FUJITSU Software

1.3.4 Reduceタスク

Reduceタスクでは、キー単位にグループ化されたレコードをCOBOLファイルとして読み込むことができます。この読み込むファイルのことを「Reduce入力データファイル」といいます。

そして必要に応じてレコードを加工したあと、COBOLファイルとして出力します。この出力するファイルのことを「Reduce出力データファイル」といいます。

Reduceタスクには、Shuffle&sortによって主キー単位にグループ化されたレコードが渡されます。また、レコードは主キーおよび副キーで整列済になっています。このため、Reduceタスクではデータを集計したり、突き合わせたりする処理などを実装します。

参考

Reduceタスクは省略することもできます。省略した場合、Reduce入力データファイルがそのままReduce出力データファイルとしてファイルに出力されます。

Reduceタスクを省略する場合、Hadoopのプロパティ「mapred.reduce.tasks」に「0」を指定してください。