ページの先頭行へ戻る
Big Data Integration ServerV1.3.0 加工編導入・運用ガイド
FUJITSU Software

5.2.2 抽出コマンドの実行例

shunselectコマンドの実行例を以下に示します。

  1. select用動作環境ファイルの定義

  2. 入力定義ファイルの記述

  3. 検索定義ファイルの記述

  4. 出力定義ファイルの記述

  5. shunselectコマンドの実行

(1) select用動作環境ファイルの定義

抽出コマンドが動作するための環境ファイル(例:Select.cfg)を定義します。並列数を指定して、同時に4つの入力ファイルを処理します。

# 文字コード
CharacterCode  EUC
# 入力ファイルタイプ
InFileType     XML
# スキップキャラクタ
SkipChar       "\s,\n,\t,\S"
# 区切り文字
SeparateChar   "\s,\n,\t"
# 半角英字の大文字・小文字の区別
ANKmix         0
# 全角英字の大文字・小文字の区別
KNJmix         0
# ログファイル
LogFile        /home/shunsaku/log/Select.log
# 並列数
ParallelNum   4

(2) 入力定義ファイルの記述

データを抽出する入力対象のファイル(例:SelInput.cfg)を定義します。

ファイル指定の例

DataFile    /home/shunsaku/indata/data1.xml
DataFile    /home/shunsaku/indata/data2.xml
DataFile    /home/shunsaku/indata/data3.xml
DataFile    /home/shunsaku/indata/data4.xml

ディレクトリ指定の例

DataFile    /home/shunsaku/indata/

参考

DataFileパラメタを省略した場合には、標準入力よりデータを読み込みます。


(3) 検索定義ファイルの記述

データを抽出する条件として、検索番号と検索式を検索定義ファイル(例:SelQuery.cfg)に記載します。

1    /root/head/kbn == '001' AND /root/body// = 'データウェアハウス'
2    /root/head/kbn == '001' AND /root/body// = 'データ管理'
3    %2  AND /root/body// = 'データベース'
4    ~(%2)  AND /root/body// = 'データベース'
5     %1  AND  %2

(4) 出力定義ファイルの記述

抽出結果を出力するファイルを、出力定義ファイル(例:SelOutput.cfg)に指定します。
検索定義ファイルに書いた検索番号の数分の出力ファイルを用意する必要があります。


1> /home/shunsaku/outdata/kekka1.xml
2> /home/shunsaku/outdata/kekka2.xml
3> /home/shunsaku/outdata/kekka3.xml
4> /home/shunsaku/outdata/kekka4.xml
5> /home/shunsaku/outdata/kekka5.xml

参考

出力定義ファイルを省略した場合には、標準出力に結果を出力します。
ただし、検索定義ファイルに検索式を1つだけ記載した場合に限ります。

抽出の出力結果を別処理の入力ファイルとする場合、出力ファイルに名前付きパイプを使用すると便利です。名前付きパイプの指定例については、“7.4 名前付きパイプを指定する例”を参照してください。


(5) shunselectコマンドの実行

以下に、shunselectコマンドの指定例を示します。

shunselect -s /home/Shunsaku/cfg/Select.cfg
           -i /home/Shunsaku/cfg/SelInput.cfg
           -q /home/Shunsaku/cfg/SelQuery.cfg
           -o /home/Shunsaku/cfg/SelOutput.cfg