Information Integratorで収集できるCSVファイルの形式は、以下のとおりです。
利用可能な形式
項目 | 利用可能な範囲 | 備考 |
---|---|---|
区切り文字 | カンマ、半角空白、タブ | |
囲み文字 | なし、ダブルクォーテーション | |
囲み文字をデータとして扱う場合 | 囲み文字をエスケープ文字とします。 例)"aaa","b""bb","ccc" | |
区切り文字、囲み文字、改行コードをデータ内に含む場合 | 囲み文字で括る必要があります。 | |
項目数とデータの数が一致しない場合 | エラー(強制終了) | |
空白のみのデータの場合 | 空白データとして扱います。 | |
1レコード | 改行コードまで (囲み文字で括られている改行を除く) | |
1レコードの制限 | 32000バイト | 以下の制限があります。
なお、データ変換定義を利用しない場合、上記のSQL_LONGVARBINARY型のデータは、2Gバイトまで可能です。 |
1項目の制限 | 1レコードの制限に準拠 | |
項目名の文字数制限 | 128バイト | |
項目数の制限 | 1024項目 | |
複数区切り文字の指定 | 指定可能 (連続した区切り文字を1つの区切り文字として扱います。) | |
区切り文字前後の空白指定 | 不可 | 囲み文字を指定しなければ可能です。 |
最大ファイルサイズ | 2Gバイト以上 |
データ形式について
1行分のデータは、列に対応するデータ項目の集まりで構成します。1つの列のデータ型に対応する各データ項目の間は、区切り文字(省略値はカンマ)で区切ります。
データ項目には、文字項目と数値項目があり、文字項目は囲み文字(ダブルクォーテーション(")のみサポート)で文字列を囲み、数値項目は、数値定数の文字列をそのまま指定します。また、1行分のデータの終了は、改行記号を指定します。
改行記号はデータ項目中に含めることはできません。
データ項目にNULL値を指定する場合は、区切り文字の間に何も指定しない形で指定します。また、データ項目が1行の最後の列である場合は、直前のデータ項目との区切り文字を指定した後に改行記号が続くことになります。なお、NULL値のデータ項目は、NULL値識別フィールドを持ったバイナリファイル形式を使用する場合のみ扱うことが可能です。
空行の扱い
改行記号のみが存在する行は、すべての列にNULLが指定されたものと見なします。
0行ファイルの扱い
ファイルに行が存在しない場合は、0件のデータとして扱います。
入力のCSVファイルは実データのみを用意してください。CSVファイルの先頭行に項目名情報を入れないでください。
項目数の最大は1024です。また、項目名の文字列長は半角36文字以下、全角18文字以下です。
項目名は、制御文字および半角空白を指定することはできません。
項目数とCSVファイル内のデータ数が一致しない場合、以下の動作となります。
項目数 > データ数・・・正常に動作します。不足項目は、NULL扱いで処理を継続します。
項目数 < データ数・・・エラーとなります。
区切り文字について
連続した区切り文字を1つの区切り文字として扱うことはできません。
区切り文字に半角空白を指定した場合、NULL値を含めることは出来ません。
半角空白およびタブ以外の区切り文字を指定した場合、区切り文字間および囲み文字の外側と区切り文字の間にある半角空白およびタブは扱えません。
半角空白以外の区切り文字が連続する場合、それぞれの区切り文字の間にNULL値のデータが1個あるものとして扱います。
あるデータ項目以降がすべてNULL値であっても、最後の項目まで区切り文字を指定する必要があります。
文字属性以外の項目データに区切り文字が存在する場合、囲み文字で囲むことはできません。
囲み文字について
囲み文字は、ダブルクォーテーションのみサポートします。
囲み文字で囲まれた文字列データ内に、囲み文字と同じ文字を使用する場合連続する囲み文字を2つ指定することにより、1つの文字データと見なします。
例:囲み文字にダブルクォーテーションを指定した場合
テキストの指定 :~ ,"A""BC", ~
データの値 :A"BC
連続2つの囲み文字の最初の文字(エスケープコード)は、文字数として計算しません。
囲み文字で囲まれた文字列データ内に、改行文字「\n」と空文字「\0」以外の制御文字が指定された場合、これらはデータとして扱います。
区切り文字を含む文字列データは囲み文字で囲む必要があります。
改行記号の扱いについて
WindowsとUNIXでは、改行の認識が異なります。
システム | 出力時に設定する改行 | 読み込み可能な改行 |
---|---|---|
Windows | 0x0d0a | 0x0d0a、0x0a |
UNIX | 0x0a | 0x0d0a, 0x0a |
内部10進数について
有効な桁数が偶数の場合、先頭4ビットに設定されている値は無視します。
利用可能な文字コード
Information Integratorのデータ収集で利用可能な文字コードは、以下のとおりです。データチェック機能の利用有無により、利用可能な文字コードは異なります。
利用可能な文字コード | |
---|---|
Shift-JIS | |
Unicode | UTF8 |
UTF8-4(注1) | |
CFSD(注1) | |
EUC | U90(注1) |
S90(注2) | |
JEF-EBCDIC | カナ |
ASCII |
注1)以下の形式の場合、利用できません。
伝票形式
一般(繰り返しあり)で、「項目繰り返し(可変)」が設定されている場合
いずれもCSVファイルの場合は、プラグイン機能により「ificnvdat」コマンドを実行し、利用可能な文字コード(Shift-JISなど)にコード変換することで利用することができます。
注2)Windowsの場合、かつ、以下の形式の場合は、利用できません。
伝票形式
一般(繰り返しあり)で、「項目繰り返し(可変)」が設定されている場合
いずれもCSVファイルの場合は、プラグイン機能により「ificnvdat」コマンドを実行し、利用可能な文字コード(Shift-JISなど)にコード変換することで利用することができます。
利用可能な文字コード | |
---|---|
Shift-JIS | |
Unicode | UCS2(注1) |
UTF8 | |
UTF8-4(注1) | |
UCS2(MS)(注1) | |
UTF16(注1) | |
UTF16(MS)(注1) | |
EUC | U90(注1) |
S90(注2) | |
HP(注1) | |
JEF-EBCDIC | カナ |
ASCII | |
IBM日本語文字セット | カナ |
英小文字 |
注1)以下の形式の場合、利用できません。
伝票形式
一般(繰り返しあり)で、「項目繰り返し(可変)」が設定されている場合
いずれもCSVファイルの場合は、プラグイン機能により「ificnvdat」コマンドを実行し、利用可能な文字コード(Shift-JISなど)にコード変換することで利用することができます。
注2)Windowsの場合、かつ、以下の形式の場合は、利用できません。
伝票形式
一般(繰り返しあり)で、「項目繰り返し(可変)」が設定されている場合
いずれもCSVファイルの場合は、プラグイン機能により「ificnvdat」コマンドを実行し、利用可能な文字コード(Shift-JISなど)にコード変換することで利用することができます。