類義語検索機能を使用するためには、類義語ファイルを用意する必要があります。
類義語ファイルは、類義語検索機能を使用するマシンと同一筐体内に任意のパスに任意の名前で配置してください。
文字コード
類義語ファイルの文字コードはShift-JIS,EUC,UTF-8とします。
類義語ファイルの先頭行に半角文字で、以下の文字コードの種別を指定できます。
Shift-JISの場合
"encode=SJIS" を指定します。
EUCの場合
"encode=EUC-JP" を指定します。
UTF-8の場合
"encode=UTF-8" を指定します。指定されていない場合は、EUCとなります。
ファイル書式
類義語ファイルは、以下の書式に沿って記述してください。
1行に類義語の1グループを記述します。1グループに記述可能な長さは1MB(改行含まず)までとします。1グループに登録可能な単語数には制限はありません。
1グループに記述する類義語の単語はダブルクォーテーションで括り、単語間はカンマで結合します。1単語の長さは可変で50バイト以内(ダブルクォーテーションを含まず)とします。
単語中にダブルクォーテーション、カンマ、バックスラッシュを記述したい場合は'\’の後に記述します。
同じ単語を複数グループに登録しないでください。複数のグループに登録した場合、最初に記述したグループが検索対象となります。
以下に類義語ファイルの例を示します。
図L.2 類義語ファイル