サンプル1-ファイルの突合せ処理は、Mapタスク・Reduceタスクで実行する外部プログラムでそれぞれ以下の処理を行います。
Mapタスクで実行する外部プログラム
ありません
Reduceタスクで実行する外部プログラム
トランザクションファイルとマスタファイルを読み込み、商品IDごとの合計個数と小計を求める
実行方法
# Hadoop入力データをDFSにコピー $ hadoop dfs -put ./sample1_input sample1_input # Hadoopジョブの実行 $ /opt/FJSVbdpp/bin/bdpp_submitjob -conf ./conf/configuration.conf -files ./lib/sample1.jar # 実行結果をローカルにコピー $ hadoop dfs -copyToLocal sample1_output ./sample1_output