ページの先頭行へ戻る
Big Data Integration ServerV1.0.0 加工編QA集
FUJITSU Software

1.1.3 データの種類

入力ファイルがたくさんあります。すべてのファイル名を定義しないといけませんか?

すべての入力ファイルを定義する必要はありません。
入力ファイルが配置されたディレクトリの指定が可能です。また、ファイルとディレクトリの混在指定も可能です。


対応する文字コードは何ですか?

扱えるファイルの文字コードは、以下の3つです。

  • UTF-8

  • Shift-JIS

  • EUC-JP

処理対象の入力ファイルは、すべて同一の文字コードで作成してください。


半角空白で区切られたファイルは扱えますか?

扱えます。
区切り文字として扱えるファイルの形式は、以下の3つです。

  • カンマ

  • 水平タブ

  • 半角空白

Data Effectorでは、上記の区切り文字で区切って並べたファイル形式をまとめて、CSV形式と定義します。


フォーマットが揃っていないデータも扱えますか?

項目の並びや長さの異なる不揃いなデータでもそのまま扱うことができます。


処理対象の文字コード種別(CharacterCodeパラメタ)にUTF-8を設定しているにもかかわらず、Shift-JIS 出力されました。なぜでか?

Data Effectorでは、UTF-8で出力する場合、BOM(Byte Order Mark)なしの形式で出力します。
シングルバイト文字だけの出力ファイルを、テキストエディタなどで開くと、BOMなしのUTF-8とShift-JISは区別することができないため、文字コードがShift-JISと判断される場合があります。


二重引用符(")が無いデータを処理したら、結果データに二重引用符が付加されました。結果データの二重引用符を除去する方法はありませんか?

Data Effectorでは、基本的にすべてのデータを文字列として処理します。
処理結果をCSV形式で出力する場合、その出力結果の項目が文字列、または、日時データのとき(数値として処理したとき以外)は、二重引用符(")で括られます。

CSV形式の二重引用符(")を取り除いて出力したい場合、以下の方法があります。

  • 結果データに付加される二重引用符をすべて取り除きたい場合

    • 基本コマンド利用時は、各動作環境ファイルのQuotationMarkModeパラメタを指定します。

    • C API利用時は、AsisSetEnvironment関数の環境パラメタQuotationMarkMode属性を指定します。

    • 統合コマンド利用時は、統合定義ファイルのQuotationMarkMode属性を指定します。

  • 結果の数値データに付加される二重引用符だけを取り除きたい場合

    • リターン式の項目にval関数を指定します。

詳細については、“導入・運用ガイド”の“CSV形式の二重引用符を取り除く”を参照してください。


文字列以外のデータも処理できますか?

処理できます。
文字や数値だけでなく、日付、時刻など、さまざまな種類のデータが扱えます。
Data Effectorが扱えるデータの例と、Data Effectorで定義しているデータ型を以下に示します。


日付データの「2010/04/01」を「20100401」で出力できますか?

日付関数を使って、表示形式を変換できます。
例を以下に示します。

  • 例1 : $出勤日「2010/04/01」を「20100401」に変換したい場合

    手順1 : 標準日付形式に変換

    $V出勤日 := convert_date($出勤日, "YYYY/MM/DD")

    手順2 : 希望の形式に変換

    date_to_string($V出勤日, "YYYYMMDD")

    文字列として「20100401」を出力します。


  • 例2 : $出勤日「2010-04-01」を「月/日 曜日」に変換したい場合

    date_to_string($出勤日, "MM/DD Dy")

    文字列として「04/01 Thu」を出力します。