Linkexpress 運用ガイド
目次 索引 前ページ次ページ

第5章 コード変換機能(ユーティリティ)

5.3 各システムが扱う文字コード系の概要

Linkexpressがコード変換機能でサポートしている各種文字コード系の概要を以下に示します。

[EUC系]

EUC系はUNIX系のオペレーティングシステムを中心に使用されている文字コード系です。EUC系では1文字を1バイトから3バイトで表現します。LinkexpressがサポートするEUC系の種類と特徴を下表に示します。

(EUC系の種類と特徴)

[シフトJIS系]

シフトJIS系はパーソナル・コンピュータを中心に使用されている文字コード系です。シフトJIS系では1文字を1バイトおよび2バイトで表現します。

[EBCDIC系]

EBCDIC系はグローバルサーバ/PRIMEFORCEを中心に使用されている文字コード系です。EBCDIC系では1文字を1バイトで表現します。LinkexpressがサポートするEBCDIC系の種類と特徴を下表に示します。

(EBCDIC系の種類と特徴)

○ : サポートしています。

− : サポートしていません。

[JEF系]

JEF系はホスト・コンピュータを中心に使用されている文字コード系です。JEF系では1文字を2バイトで表現します。JEF系の文字とEBCDIC系の文字が混在する場合、JEF系の文字の前後にシフト・コードが付加されます。なお、Linkexpressのコード変換ではシフトコードを意識することなくJEF系のデータを扱えます。

他のコード系が1983年以降のJISに準拠しているのに対し、JEF系は1978年版JISに準拠しています。このため、JEF系から他のコード系に変換した場合、旧字体が新字体に変化する文字があります。

LinkexpressはJEF系からEUC(U90)系に変換する場合の変換方法を提供していますので、利用者は字体を変えないコード変換を選択することができます。

[Unicode系]

Unicode系は全世界の主要な文字を同時に表現する事を目的に作成された文字コード系です。Linkexpressでは、UCS-2系とUTF-8系、およびWindowsシステムのUCS-2系を扱います。

UCS系はすべての文字を固定のバイト数で文字を表現し、UCS-2は2バイトで1文字を表現します。また、UTF系はUCS系の文字をテキストデータの伝送路や処理系で扱えるように一部の文字に変更を加えて表現(エンコード)しています。UTF-8は1〜6バイトで1文字を表現します。

なお、LinkexpressではUCS2のコードについて第1バイトを"区(row)"、第2バイトを"点(cell)"と表現することがあります。(注)

注) 複数バイトで構成される文字コードのデータ位置を表現する用語です。文字コードの第1バイトを区(row)、第2バイトを点(cell)と呼びます。なお、Windowsシステムで使用されるUCS-2系では、第1バイトと第2バイトの順序が逆になります。

[IBM日本語文字セット系]

IBM日本語文字セット系はMVSシリーズの文字です。IBM日本語文字セット系では1文字を2バイトで表現します。IBM日本語文字セット系の文字とEBCDIC系の文字が混在する場合、IBM日本語文字セット系の文字の前後にシフト・コードが付加されます。


目次 索引 前ページ次ページ

All Rights Reserved, Copyright(C) 富士通株式会社 1997-2007