CSVファイルに記載されたデータ、またはデータベースのテーブルに格納されたデータをカラムナテーブルに格納する方法を説明します。
テンプレートの構成
テンプレートを構成するノードを説明します。
ノード名 | ノードの役割 | ユーザーの操作 |
---|---|---|
テーブル抽出 | 入力データストアの種類がデータベースの場合、本ノードでデータを抽出します。 | データベースのテーブルから抽出する場合は、必要なパラメーターを入力します。 |
CSV抽出 | 入力データストアの種類がCSVファイルの場合、本ノードでデータを抽出します。 | ありません。 |
格納先データ削除 | カラムナテーブル内のデータを削除します。 | 必要なパラメーターを入力します。 |
カラムナテーブル格納 | カラムナテーブルにデータを格納します。 | 必要なパラメーターを入力します。 |
処理結果格納(ビルトイン) | 処理を終了します。 | ありません。 |
参考
データを格納する前にカラムナテーブル内のデータを削除したくない場合、以下の手順で[格納先データ削除]ノードを削除してください。
[格納先データ削除]ノードを選択し、右クリックメニューから[削除]を選択してノードを削除します。
[CSV抽出]ノードまたは[テーブル抽出]ノードの出力コネクターと[カラムナテーブル格納]ノードの入力コネクターを接続します。
利用手順
手順は以下のとおりです。
テンプレートのコピーの作成
以下の手順でテンプレートをコピーします。
[分析フロー一覧パネル]の[テンプレート]-[02_データ操作]-[01_カラムナテーブル格納]を選択します。
右クリックメニューから[開く]を選択します。
メニューバーの[プロジェクト]-[名前を付けて保存]を選択します。
表示された画面で、「分析フロー名」と「保存先フォルダー」を指定して、[OK]ボタンをクリックし、コピーを作成します。
入力データストアの定義
既に使用したい入力データストアが存在する場合は、この手順は不要です。
以下の手順で入力データストアを定義します。
[データストア一覧パネル]の[入力データストア]フォルダー配下で、入力データストアの定義を作成したいフォルダーを選択します。
フォルダーがない場合には、作成してください。一つ上のフォルダーを選択し、右クリックメニューの[フォルダーの新規作成]を選択します。
右クリックメニューの[入力データストアの定義の新規作成]を選択します。または、メニューバーの[定義]-[入力データストアの定義の新規作成]を選択します。
[入力データストアの種類選択]画面が表示されるので、[ファイル]を選択します。
[入力データストアの定義]画面が表示されるので、以下の情報を設定します。
[格納先情報]タブ
[分析サーバ上のファイルパス] にDWHサーバ上のファイルパスを絶対パスで指定します。
[データ形式]タブ
「テキストデータ」を選択します。
入力ファイルの文字コードに合わせた文字コードおよび区切り文字を指定します。
[データ構成]タブ
[データ構成]に、入力ファイルに合わせたヘッダー情報を入力し、項目名情報には入力ファイルに存在する全項目名を入力します。ヘッダーが存在する場合、入力するヘッダー名をCSVファイルのヘッダー名と一致させる必要があります。ヘッダー名に使用できる文字は、“A.1 データベースサーバ機能”を参照してください。
参考
「入力データストアの種類選択」画面で[データベース]を選択した場合は、“Symfoware Analytics Serverのテーブルを入力データストアに利用する場合”を参照してください。
[名前を付けて保存]ボタンをクリックします。
[データストア一覧パネル]で、作成した入力データストアを選択し、右クリックメニューの[配備]を選択して配備します。
出力データストアの定義
[処理結果格納(ビルトイン)]ノードに対して出力データストアを定義します。手順は、“E.5.1 カラムナテーブル作成”の“利用手順”の“2. 出力データストアの定義”を参照してください。
ノードのパラメーターの設定
以下のノードをダブルクリックし、ノードのプロパティを開きます。[パラメーター]タブで必要なパラメーターの値を設定し、[OK]ボタンをクリックします。CSVファイルからデータを抽出する場合は、[テーブル抽出]ノードのパラメーターの値の設定は不要です。
パラメーター名 | 必須/任意 | 値の説明 |
---|---|---|
JDBCパス | 必須 | [DWHサーバのインストールディレクトリ]\symfoclient64\jdbc\lib\postgresql-jdbc4.jar /opt/symfoclient64/jdbc/lib/postgresql-jdbc4.jar |
抽出条件 | 任意 | 入力データストアからデータを抽出するための抽出条件を、SQL文で指定します。 |
変数名 | パラメーター名 | 必須/任意 | 値の説明 |
---|---|---|---|
DB | データベース名 | 必須 | データを格納するカラムナテーブルがあるデータベース名を指定します。 |
SCM | スキーマ名 | 必須 | データを格納するカラムナテーブルのスキーマ名を指定します。 |
TBL | テーブル名 | 必須 | データを格納するカラムナテーブルの名前を指定します。 |
UserName | ユーザー名 | 必須 | データベースのユーザー名を指定します。 |
Password | パスワード | 必須 | ユーザーのパスワードを指定します。 |
InstallPath | SymfowareAnalyticsServerインストールパス | 必須 | DWHサーバのインストールディレクトリを絶対パスで指定します。 |
変数名 | パラメーター名 | 必須/任意 | 値の説明 |
---|---|---|---|
DB | データベース名 | 必須 | [格納先データ削除]ノードで指定したデータベース名を指定します。 |
SCM | スキーマ名 | 必須 | [格納先データ削除]ノードで指定したスキーマ名を指定します。 |
TBL | テーブル名 | 必須 | [格納先データ削除]ノードで指定したカラムナテーブルの名前を指定します。 |
UserName | ユーザー名 | 必須 | データベースのユーザー名を指定します。 |
Password | パスワード | 必須 | ユーザーのパスワードを指定します。 |
InstallPath | SymfowareAnalyticsServerインストールパス | 必須 | DWHサーバのインストールディレクトリを絶対パスで指定します。 |
注意
値には1023文字まで入力できます。
テンプレートの接続
手順は、“E.5.1 カラムナテーブル作成”の“利用手順”の“4. テンプレートとの接続”を参考に、作成した入力データストアと出力データストアをテンプレートのノードと接続してください。
CSVファイルに記載されたデータから抽出する場合は、[CSV抽出]ノードと入力データストアを接続してください。
データベースのテーブルデータから抽出する場合は、[テーブル抽出]ノードと入力データストアを接続してください。
参考
CSVファイルに記載されたデータ、またはテーブルのデータに対して、行絞込や結合などのデータ加工を行ってからカラムナテーブルに格納する場合、[CSV抽出]ノードまたは[テーブル抽出]と[格納先データ削除]ノードの間に追加することができます。“Interstage Business Analytics Modeling Server 分析フロー設計・開発ガイド”の“部品を使う”を参考に追加してください。
なお、ノードを追加することで出力項目に違いが生じる場合、加工後の出力項目に応じたカラムナテーブルを事前に作成し、[カラムナテーブル格納]ノードに指定する必要があります。
データ加工フローの実行
手順は、“E.5.1 カラムナテーブル作成”の“利用手順”の“5. データ加工フローの実行”を参照してください。