ページの先頭行へ戻る
Enterprise Postgres 10 解説書
FUJITSU Software

1.12 高速データロード機能によるデータロード処理の高速化

高速データロード機能は、与えられたCOPY FROMコマンドを複数の並列ワーカで並列実行します。これにより、外部データに対する適切な内部形式への変換処理、テーブルの作成処理およびインデックスの作成処理が並列で行われるため、大量データの高速投入が可能となります。

注意

本機能は、Advanced Editionのみで使用できます。

高速データロード機能のアーキテクチャ

パラメータ設定やリソース見積りに必要となるため、高速データロード機能のアーキテクチャを簡単に解説します。

高速データロード機能は、1つのバックエンドプロセスと複数の並列ワーカが協調してデータロード処理を並列実行します。バックエンドプロセスと並列ワーカ間のデータの授受は共有メモリメッセージキューを介して行われます。バックエンドプロセスは、読み込んだ外部ファイルのデータを複数の並列ワーカへ分散します。それぞれの並列ワーカは、共有メモリメッセージキューから読み込んだデータを適切な内部形式へ変換し、テーブルへ挿入します。テーブルにインデックスが作成されている場合は、インデックスのキーを抽出し、インデックスページへキーを挿入します。

参照

高速データロード機能についての詳細は、“運用ガイド”の“高速データロード機能”を参照してください。