ページの先頭行へ戻る
NetCOBOL V11.1 ユーザーズガイドHadoop連携機能編
FUJITSU Software

1.3.1 Hadoop入力データファイル

Hadoopによって分割され各Mapタスクに渡されるファイルを「Hadoop入力データファイル」と呼びます。Hadoop入力データファイルは分割可能なデータファイルである必要があり、トランザクションファイルやマスタファイルなどをHadoop入力データファイルに使用します。

Hadoop入力データファイルはレコード単位に分割されるため、レコードどうしが依存関係をもつようなファイルは使用できません。

図1.3 Hadoop入力データファイルに利用可能なレコード定義

参考

Mapタスクに渡されるファイルは自動的に分割されますが、レコードの途中で分割されることはありません。