ページの先頭行へ戻る
Data Analytics Smarter Hub V1.1.0 導入・運用・保守ガイド
FUJITSU Software

1.2 ストレージ構成の設計

本製品を利用するには、以下のストレージ領域が必要です。

表 1.1 本製品を利用する場合に必要なストレージ領域
領域名 VMware 環境 KVM環境 Amazon EC2環境 容量 説明
システム領域 VMDK qcow2 Amazon EBS 60GB 本製品をデプロイするストレージプール領域です。
ユーザーデータ領域 VMDK raw(VirtIO) Amazon EBS 200GB以上推奨 ユーザーデータ領域として必要なストレージ容量の算出方法」を参照してください。
プロジェクト領域 VMDK raw(VirtIO) Amazon EFS 100GB以上推奨

プロジェクトに含まれるデータを格納するストレージプール領域です。

VMware環境、およびKVM環境では、ユーザーデータ領域と同じ領域内に配置されます。

Amazon EC2環境では、専用の領域が必要です。

プロジェクト領域として必要なストレージ容量の算出方法」を参照してください。

ユーザーデータ領域として必要なストレージ容量の算出方法

以下の総容量

  • 製品のメタデータ格納用(100MB)
  • データレイクからプロジェクトにcopyモードでインポートするデータ量(重複排除後)(注)
  • ベースレシピ(3GB)
  • コンテナ/タスクノードでのベースレシピに対するライブラリーなどの追加分

注: 重複排除実現のため、本領域を利用

プロジェクト領域として必要なストレージ容量の算出方法

  • 全プロジェクトの以下の総容量
    • プロジェクト内に格納するデータ・分析スクリプト
    • フロー用のメタデータ、概要、アウトカム
  • 上記の世代管理分(差分データ)

参考

機械学習のプロジェクトの場合、入力データの10倍程度の容量を準備します、

  • 例: 入力データが1MBの場合、10MB

参照

Amazon EBS

  • ボリュームタイプ: 汎用SSD(gp2)以上
  • ボリュームの暗号化: 任意

Amazon EFS

  • VPC: 本製品を配置するVPCを決定します。
  • マウントターゲット: Amazon EKS、ノードグループ作成時に使用するサブネットを決定します。
  • 暗号化: 任意