ページの先頭行へ戻る
Interstage Information IntegratorV10.1.0 システム設計ガイド

1.4.2 文字コード変換

指定された文字コードから、別の文字コードに変換する機能です。

収集したデータ全体を対象に変換します。

Information Integratorでは、文字コード変換の標準機能としてJIS第一水準、JIS第二水準の文字コード変換が可能です。変換可能な組合せは、以下のとおりです。

表1.2 文字コード変換可能な組合せ

出力文字コード

入力文字コード

Shift-JIS

EUC

JEF-EBCDIC

Unicode

U90

S90

HP

カナ
(字形重視)

カナ
(領域重視)

ASCII
(字形重視)

ASCII
(領域重視)

UCS2

UCS2(MS)

CFSD
(注2)

UTF8

UTF8-4

UTF16

UTF16(MS)

Shift-JIS


(注1)

EUC

U90

S90


(注1)

HP

JEF-EBCDIC

カナ
(字形重視)

カナ
(領域重視)

ASCII
(字形重視)

ASCII
(領域重視)

Unicode

UCS2


(注1)

UCS2(MS)


(注1)

CFSD
(注2)


(注1)

UTF8


(注1)

UTF8-4


(注1)

UTF16


(注1)

UTF16(MS)


(注1)

IBM日本語
文字セット

カナ

英小文字

○:変換可能です。-:変換不可能な組み合わせ

注1)数値の表現形式を変更する場合に指定できます。

注2)ificnvdatコマンドでは指定できません。

ポイント

JEFの旧字体(「塚」の旧字など)やベンダ固有文字(「」など)は、文字コード変換テーブルを切り替えることで、文字コード変換できます。また、外字の文字コード変換については、文字コード変換テーブルをカスタマイズすることで、文字コード変換できます。

文字コード変換テーブルの切替え、およびカスタマイズ方法については、“第8章 文字コード変換の準備”を参照してください。

注意

Information Integratorが動作するシステムにCharset Managerが導入されている場合で、Charset Managerの文字コード変換表をカスタマイズしている場合は、この文字コード変換表をInformation Integratorの文字コード変換テーブルに取り込んでください。詳細は、“第8章 文字コード変換の準備”、および“コマンドリファレンス”を参照してください。

データ変換時のエラー処理について

ファイル形式変換、文字コード変換の場合、データ変換時のエラー後の動作を選択することができます。

以下に、それぞれ選択できる範囲を示します。

表1.3 データ変換時のエラー原因とエラー後の動作

属性

エラー原因

動作

エラー後の動作(メッセージ)

文字列演算

文字コード変換

中断

中断(エラー)

継続

代替文字を入れて処理継続(警告)

文字あふれ

中断

中断(エラー)

継続

あふれた文字を削除して処理継続(警告)

内部10進

先頭4bitが0以外

中断

中断(エラー)

継続

先頭4bitを「0」にして処理継続(警告)

数値演算

桁あふれ

中断

中断(エラー)

0除算

中断

中断(エラー)