Symfoware(R) Server 概説書 - FUJITSU - |
目次 索引 |
Symfoware Serverで利用できる文字コードについて説明します。
Symfoware Serverでは、以下の文字コード系が使用できます。
EUCコード
シフトJISコード
UNICODE
システムの文字コード系とデータベースの文字コード系について、以下に示します。
システムの文字コード系 |
対象OS |
データベースの文字コード系 |
||
---|---|---|---|---|
EUCコード |
シフト |
UNICODE |
||
EUCコード |
|
○ |
○ |
○ |
シフト |
|
× |
○ |
○ |
○:組み合わせて運用することができます。
×:組み合わせて運用することはできません。
EUCコードには、以下の2つのコードがあります。
EUCコード
EUCコードは、UNIX系システムの標準文字コード体系です。
拡張漢字および利用者定義文字は、3バイトで表現されます。その他の日本語文字は2バイトで表現されます。
COBOL_EUCコード
Symfoware Serverに使用される各国語文字列型のデータ文字コード体系です。このコード体系は、COBOLの内部表現形式である16ビットワイドキャラクタ表現に準拠しています。
拡張漢字および利用者定義文字を含むすべての日本語文字は、2バイトで表現されます。
シフトJISコードは、主にWindowsで使用されている文字コードです。
英数字および制御文字は1バイトで表現されます。各国語文字は、1文字が2バイトで表現されます。
UNICODEは、世界各国の各国語文字を統一的に扱うことを目的とした、マルチバイトの文字コード系です。そのため、UNICODEを使っている限り、言語種別を意識する必要がありません。
また、現存する十分な文字を含んでおり、日本語の地名や人名などに使用されている特殊な文字も含んでいます。従来のコードには、このような文字は含まれておらず、各処理系においてコードの拡張を行っていました。このような、非常にまれな文字をも網羅しているという特色を持っています。
UNICODEには、以下の2つの形式があります。
UCS2形式 (固定長形式)
すべての文字が2バイトの固定長形式です。ASCII文字も2バイトで表現されています。
すべてが2バイトであるため、文字列長を意識しなくてもよいという利点があります。しかし、制御文字やASCII文字と混在しているような場合に区別がつかないという欠点もあります。
UTF8形式 (可変長形式)
可変長形式で、ASCII文字が1バイトのまま埋め込まれています。制御文字やASCII文字と混在したままで制御できるという利点があります。
データベースの文字コードとアプリケーションの文字コードは、同一にすることをお勧めします。文字コードが異なると、データベースへのデータの格納時または取出し時にコード変換が発生し、処理が遅くなることがあります。
目次 索引 |