ページの先頭行へ戻る
Interstage Charset Manager Standard Edition V9 システム構築ガイド コンバータ編
FUJITSU Software

用語集

Charset Converter

コード変換ポリシーをあらかじめ作成し、それに従ったコード変換を行う機能全般を指します。

Converterキーワード

コード系種別と文字セットの組合せを既定したキーワードです。コード変換ポリシーでは、変換元、変換先それぞれにConverterキーワードを定義します。

Converter設定ファイル

コード変換ポリシー生成コマンドや、コード変換ポリシー対応定義出力コマンド、C言語Converterライブラリの動作に必要な設定ファイルです。

Converterライブラリ

コード変換ポリシーに従ってコード変換を行うライブラリを指します。C言語インタフェースとJavaインタフェースがあります。

C言語Converterライブラリ

C言語インタフェースのConverterライブラリです。

IVS

「Ideographic Variation Sequence(漢字字形指示列)」のことです。「基底文字」の直後に「VS」を付加した結合文字列の形で、特定の字形を指定する際に使用します。

Java Converterライブラリ

JavaインタフェースのConverterライブラリです。

Java Converter設定ファイル

Java Converterライブラリの動作に必要な設定ファイルです。

VS

「Variation Selector(字形選択子、俗に異体字セレクタともいいます)」のことです。IVSを表現する際には、U+E0100~U+E01EFが使用されます。

エンコーディング

エンコードの変換方式のことです。

例えば「UTF-8エンコーディングに従って、UnicodeコードポイントU+XXXXの文字をエンコードするとXX,XX,XXとなる」といった表現に使われます。

エンコーディング形式

コード変換時に指定できるエンコーディングの種類を表します。

エンコード

コードポイントから文字のバイト列に変換することです。

拡張対応定義ファイル

製品に添付されているカスタマイズ用の対応定義ファイルです。コード変換ポリシーに指定することで、製品既定の対応定義に対してカスタマイズを行うことができます。主に、字形に厳密な対応定義を行う場合に使用されます。

コード系種別

エンコーディングや、文字集合の範囲に依存しない、文字コード系の種別を表します。ただし、同じコードポイントの文字の意味が異なるような場合は異なる種別とします。例えば、Unicode, SJIS, EUC@EUC_JP, JEF_ASCII, JEF_KANAなど。

コード変換ポリシー

コード変換に必要となる以下の情報を集約した実体です。

  • 変換に必要な情報

    • 変換元、変換先についてのコード系種別と文字セット

    • 変換のカスタマイズ情報

  • エラー時の動作指定

    • 変換できないデータの扱いと動作

    • 文字を代替する場合の代替文字コード

コード変換ポリシー格納域

コード変換ポリシーを格納するためのディレクトリです。Converter設定ファイル、またはJava Converter設定ファイルにこの場所を記述します。

コード変換ポリシー生成コマンドは、この場所にコード変換ポリシーを出力します。また、コード変換ポリシー対応定義コマンド、Converterライブラリでは、この場所にあるコード変換ポリシーを入力とします。

コード変換ポリシー定義ファイル

コード変換ポリシーを作成するために、ユーザが定義するファイルです。

コードポイント

一文字を特定する一意の番号を表します。ただし、合字などは例外的に一文字で2つのコードポイントを持ちます。コード系種別ごとの番号付けの方式はCharset Converterで規定したものとします。

製品既定の対応定義

製品であらかじめ決められているコードの対応関係のことです。

対応定義ファイル

変換元コードと変換先コードの対応関係が定義されたファイルです。

デコード

文字のバイト列から、一文字を表すコードポイントに変換することです。

バリデーション

入力データの判定を行うことです。

不正エンコーディング

不正なエンコーディングのことです。

変換可能文字

変換先の文字コードが存在する文字のことです。

変換不能文字

文字セット範囲内だが、変換先の文字コードに変換できない文字のことです。

ポリシーセット

同一サーバに配付するコード変換ポリシーのセットのことです。

無効文字

文字セット範囲外の文字のことです。文字のバリデーションでエラーとなる文字です。

文字コード系

文字セット、コード系、エンコーディングなどの要素をすべて含めた、文字表現形態を表します。

文字コード変換ID

文字コード変換ポリシーを特定するためのID文字列です。

文字セット

コード系種別毎に決められた文字集合の範囲です。

ユーザ対応定義ファイル

ユーザが作成する対応定義ファイルです。