Hadoopによって分割され各Mapタスクに渡されるファイルを「Hadoop入力データファイル」と呼びます。Hadoop入力データファイルは分割可能なデータファイルである必要があり、トランザクションファイルやマスタファイルなどをHadoop入力データファイルに使用します。
Hadoop入力データファイルはレコード単位に分割されるため、レコードどうしが依存関係をもつようなファイルは使用できません。
図1.3 Hadoop入力データファイルに利用可能なレコード定義

参考
Mapタスクに渡されるファイルは自動的に分割されますが、レコードの途中で分割されることはありません。