“Charset Manager 使用手引書 標準コード変換機能編”の参照先
Charset Converterの機能を利用する場合、“Charset Manager 使用手引書 標準コード変換機能編”の以下の箇所も併せて参照してください。なお、Charset Converterと標準コード変換では、コード系の表記が異なっていますので、適切に読み替えてください。
サンプルの制御文ファイルは Charset Converter では提供していません。標準コード変換の制御文ファイルを参考にして、Charset Converter のユーザ対応定義ファイルを作成する必要があります。
サンプルの制御文ファイルは Charset Converter では提供していません。標準コード変換の制御文ファイルを参考にして、Charset Converter のユーザ対応定義ファイルを作成する必要があります。
表C.1の下の備考の内容は、次のように読み替えてください。
「対応関係のない制御コードは、無効文字または変換不能文字として扱われます。」
Charset Converter では、iconv_ext関数は使用できません。対応を変更するには、コード変換ポリシー定義ファイルで定義を行ってください。
JIPSの字形重視の拡張対応定義ファイルを使用した場合、およびJIPSとUnicodeの間の変換の場合に適用されます。
標準コード変換との差異について
JEFとSJIS、JEFとEUC間の変換について、デフォルトの変換タイプが異なります。標準コード変換では「字形重視」がデフォルトですが、Charset Converterでは「領域重視」がデフォルトになります。
Charset Converterでは、変換元、変換先の文字セット(文字集合)を意識した変換を行います。例えば、JEFからUnicodeへの変換で、変換先の文字セットとしてMS932(マイクロソフト標準キャラクタセット)を指定した場合、MS932範囲外の文字に対応定義されているJEF文字はすべて変換できない文字として扱われます。
Charset Converterでは、片方向のコード変換毎にコード変換ポリシーを策定します。従って、双方向の変換を行う場合には、行き帰り別々のコード変換ポリシーを作成する必要があります。
部門サーバへの配付について
コード変換ポリシー配付コマンドで配付する場合、“Charset Manager 使用手引書 日本語資源管理編”および“Charset Manager 使用手引書 日本語資源適用編”に従って、資源管理サーバと部門サーバの配付環境を設定する必要があります。
コード変換ポリシーを日本語資源管理の資源配付機能で部門サーバに配付することはできません。コード変換ポリシー配付コマンドで配付してください。
サポート範囲について
Unicode関連の入力/出力エンコーディング形式を指定した場合、次表の範囲のUnicodeをサポートします。
Converterキーワード→ ↓Unicodeの面 | Unicode (MS932) | Unicode (MS932ex) | Unicode (UCS2) | Unicode (2004MS) | Unicode (UCS4) | Unicode (UCS4_IVS) |
---|---|---|---|---|---|---|
0面 | △(*1) | △(*1) | ○ | △(*1) | ○ | ○ |
1面 | - | - | - | - | ○ | ○ |
2面 | - | - | - | △(*2) | ○ | ○ |
3面 ~ 16面 | - | - | - | - | ○ | ○ |
結合文字 (合字、リガチャー) | - | - | - | - | - | - |
IVS (異体字シーケンス) | - | - | - | - | - | ○ |
【表中の記号の意味】 ○:全文字サポート、△:一部文字をサポート、-:未サポート
(*1)マニュアルの“表2.1 コード系種別一覧”、“表2.2 文字セット一覧”および“表3.1 Converterキーワードとコードポイントの表記方法”を参照してください。
(*2)JK統合漢字拡張B集合の内のJIS X 0213:2004のJIS第3・4水準の一部の漢字(304字)