第1章概要

基幹バッチ処理では、近年データ量の増大によりバッチ処理に時間がかかる問題が起きています。このため、バッチ処理時間の短縮のためにサーバの性能を増強したり、データを分割して多重処理したりするなどの対応が取られています。しかし、そのようなアプローチでは高価なハードウェアが必要になったり、多重処理のために新たに処理が必要になったりするなどコスト上の問題があります。

Hadoop連携機能を使用すると、逐次処理を行っていた従来のバッチ処理を、データを分割して複数のサーバで並列処理することでバッチ処理を高速化できます。既存アプリケーションを利用できるため、高い移行性が確保されます。

これにより、高速化以外にも以下のメリットがあります。

低コスト
比較的安価なサーバを多数使用して並列処理することで、経済的なシステムを構成できます。
高可用性
分割されたデータは2重化されることによって信頼性が向上します。また並列処理を実行するサーバ(スレーブサーバ)が停止しても、他のスレーブサーバが処理を代替して続行することができます。
スケールアウト
スレーブサーバの追加により、容易にスケールアウトできます。

Hadoop連携機能では、HadoopのMapReduceと呼ばれる機能を使って分散処理を行います。

第1章 概要

第1章概要