ページの先頭行へ戻る
Interstage Big Data Parallel Processing Server V1.2.0 ユーザーズガイド
FUJITSU Software

11.7.1 ハッシュ値により振り分ける

デフォルトの振り分け方法です。主キーからハッシュ値を求めて、実行可能なReduceタスク数(mapred.reduce.tasks)にレコードを振り分けます。

注意

ハッシュ値の重複によって複数の主キーが同一のReduceタスクに振り分けられる場合があります。このため、主キーが異なるレコードが同一のReduceタスクに渡される場合を考慮し、Reduceアプリケーションを作成してください。