ページの先頭行へ戻る
Interstage Big Data Parallel Processing Server V1.2.0 ユーザーズガイド
FUJITSU Software

11.1 概要

2.4 外部プログラムの並列実行」で述べたように、Hadoopで並列処理を行うには、Hadoop固有の機能やAPIを理解し、Mapタスク、Reduceタスクで動作するMapReduceアプリケーション(Javaプログラム)を作成する必要があります。


本機能では、Hadoop固有の機能やAPIを使用しない外部プログラム(任意のプログラミング言語を使用して作成したプログラムやスクリプトなど)を、Mapタスク、Reduceタスクとして実行することができます。通常、外部プログラムをHadoopで利用するには、Hadoopに標準で搭載されているHadoop Streaming機能を利用しますが、その場合と比較して本機能には以下のような特徴があります。

参考

MapReduce処理やアプリケーション、Hadoop Streamingの詳細は、以下を参照してください。

  • http://hadoop.apache.org/docs/r1.2.1/mapred_tutorial.html

  • http://hadoop.apache.org/docs/r1.2.1/streaming.html

MapタスクやReduceタスク、MapReduce処理の流れについては、「17.5.1 Hadoopジョブとタスク」もあわせて参照してください。