文字コード項目を、変換元コード系で指定されたコード系の文字コードから、変換先コード系で指定されたコード系の文字コードへ変換します。
変換元と変換先に指定できるコード系の組み合わせを、“表1.6 変換可能な文字コード系”に示します。
変換元の文字コード系 | 変換先の文字コード系 | ||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
J | EUC | シ | UNICODE | C | C | ||||||||
U | S | E | U | U | U | U T F | 8 | U | ||||||
JEF (注1) | - | ○ | ○* | ○ | ○ | ○* | ○ | ○ | ○ | ○ | - | - | |
EUC | U90 | ○ | - | - | - | - | ○* | ○ | ○ | ○ | ○ | - | - |
S90 | ○ | - | - | - | - | ○ | ○ | ○ | ○ | ○ | - | - | |
EUCCOBOL | ○ | - | - | - | - | ○ | ○ | ○ | ○ | ○ | - | - | |
U90COBOL | ○ | - | - | - | - | ○ | ○ | ○ | ○ | ○ | - | - | |
シフトJIS | ○ | ○ | ○ | ○ | ○ | - | ○ | ○ | ○ | ○ | - | - | |
Unicode | UCS2 | ○ | ○ | ○ | ○ | ○ | ○ | - | ○ | ○ | ○ | - | - |
UCS2LE | ○ | ○ | ○ | ○ | ○ | ○ | ○ | - | ○ | ○ | - | - | |
UTF-8 | ○ | ○ | ○ | ○ | ○ | ○ | ○ | ○ | - | ○ | - | - | |
UNICOBOL | ○ | ○ | ○ | ○ | ○ | ○ | ○ | ○ | ○ | - | - | - | |
CDS_USR1 | - | - | - | - | - | - | - | - | - | - | - | ○ | |
CDS_USR2 | - | - | - | - | - | - | - | - | - | - | ○ | - |
○:サポート -:サポートなし *:縮退変換可能な組み合わせ
注1)JEFは、以下に示す二つのコード体系を総括しています。
JEF | EBCDIC(カナ) |
EBCDIC(ASCII) |
CDS_USR1/CDS_USR2は、他社ベンダ文字コード系の変換に使用します。
詳細は、“付録B 他社ベンダ文字コード系の変換”を参照してください。
注意
縮退変換とは、新字体と旧字体の両方を持っているコード系(JEFコード系とEUC(U90)コード系)から、新字体しか持っていないコード系(JIS、シフトJIS(R90、SJISMS)コード系とEUC(S90)コード系)へ変換することです。時に、新字体と旧字体の両方を、新字体へ変換する場合もあります。詳細については、“Charset Manager使用手引書 標準コード変換機能編”を参照してください。また、拡張データ変換における各文字コード系の扱いは、“2.2 文字コードの種類”を参照してください。
文字コード項目のデータ型
1文字を表すために必要なバイト数は、文字種や文字コード系ごとに異なります。
文字コード項目のデータ型は、 1バイト文字のみの項目、2バイト文字のみの項目、1バイト/2バイト/3バイト文字の混在する項目のいずれかで指定します。
各コード系および文字種別ごとに必要なバイト数を“表1.7 各コード系の文字種別のバイト数”に示します。
文字コード系→ 文字種別↓ | JEF | EUC | シフトJIS | UNICODE | ||||
---|---|---|---|---|---|---|---|---|
U90 | S90 | EUCCOBOL | UCS2 | UCS2LE | UTF8 | |||
英数字・記号 | 1 | 1 | 1 | 1 | 1 | 2 | 2 | 1 |
半角カナ | 1 | 2 | 2 | 2 | 1 | 2 | 2 | 3 |
日本語(JIS文字) | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 3 |
日本語(拡張文字) | 2 | 3 | - | - | - | 2 | 2 | 3 |
-:文字がない