バリデーションポリシーとは、システムで運用している文字コード系および文字の集合(運用文字コード)と、どの文字を有効/無効とするかを定義したものです。
バリデーションポリシーを保存したファイルをバリデーションポリシーファイルといいます。バリデーションポリシーファイルは、バリデーションライブラリの入力となり、それに従ってデータのバリデーションを行います。
バリデーションポリシーファイルは、Charset Manager-Mがインストールされている資源管理サーバで作成してください。バリデーションポリシーファイルの作成方法は以下のとおりです。
運用文字コードを決めます。運用文字コードについては、“運用文字コードについて”を参照してください。
運用文字コードの各文字の扱い(有効/無効)を決めます。
バリデーションポリシー定義ファイルを作成します。
バリデーションポリシー定義ファイルはテキストファイルで作成します。バリデーションポリシー定義ファイルの記述方法については、“3.1.2 バリデーションポリシー定義ファイル”を参照してください。
バリデーションポリシー生成コマンドを実行します。
バリデーションポリシー生成コマンドは、C言語用とJava用の2種類があります。アプリケーションのプログラム言語に応じて選択してください。バリデーションポリシー生成コマンドについては、“3.1 バリデーションポリシー生成コマンド”を参照してください。
運用文字コードとは、システムで運用している文字コード系と文字の集合を組み合わせたものです。例えば、文字コード系としてはUnicodeを使用しているが、システムとして入力できる範囲は、シフトJISの範囲の文字のみという場合もあります。このため、文字コード系と文字の集合を組み合わせて考える必要があります。
運用文字コードは、“表2.1 運用文字コード一覧”の中からシステムに合った運用文字コードを選んでください。
運用文字コード | 文字コード系 | 文字の集合 | 備考 |
---|---|---|---|
Unicode(MS932) | Unicode | - マイクロソフト標準キャラクタセット | Windowsで使われているシフトJISの文字セット。「」や「」などのようなNEC/IBM拡張漢字が含まれる。 |
Unicode(MS932ex) | - マイクロソフト標準キャラクタセット SUPPLEMENT(追加非漢字集合)等 | JIS90ベースのMS 明朝(Version2.31)で使用されている文字セット。 | |
Unicode(2004MS) | - マイクロソフト標準キャラクタセット | JIS2004ベースのMS 明朝(Version5.30)で使用されている文字セット。 | |
Unicode(UCS2) | UCS-2すべて | Unicodeの2バイト範囲すべて。Unicodeにおいて、使用できる文字を2バイト範囲だけに抑えたい場合に有効な運用文字コード。 ・サロゲート文字(U+D800~U+DFFF)は無効として扱う。 | |
Unicode(UCS4_IVS) | UCS-4(0~16面) UCS-4(0~16面)+VS(Variation Selector) | 基底文字の有効範囲は、U+0000~U+FFFD、U+10000~10FFFF。 サロゲート文字(U+D800~U+DFFF)は無効として扱う。 VSの有効範囲は「U+E0100~U+E01EF」 |
参考
各運用文字コードに定義されている文字コードは、バリデーションポリシー確認コマンドで確認することが可能です。
IVSの利用方法については、"The Unicode Standard"の"Variation Selectors"および"Unicode Technical Standard #37"を参照してください。