Text アダプタ定義の記述形式について説明します。Textアダプタ定義は、タグ付きのデータとして記述します。
以下にTextアダプタ定義の記述形式と各タグの意味を説明します。
<TextAdapterDef> <ReplicationDef> <!--抽出定義名規定部--> <REPNAME>抽出定義名</REPNAME> … </ReplicationDef> <DocumentTypeDef> <!--文書種別規定部--> <TypeColumn name = '列名'> <DocumentType value = '列値'>文書種別名</DocumentType> … <TargetColumn>対象列名</TargetColumn> … </TypeColumn> </DocumentTypeDef> <MappingDef dbinfo = 'yes' > <!-- マッピングルール規定部 --> <TargetSearchDBname host = 'localhost' port = '0' > 検索データベース名</TargetSearchDBname> … <Column name = '対象列名' search = 'yes' >フィールド名</Column> … </MappingDef> </TextAdapterDef>
タグの表記内容について説明します。
<a>は、タグ名aの開始を示します。
</a>は、タグ名aの終了を示します。
<!-- ~ -->は、コメント行を示します。
<a b='値1’>は、タグaがその属性として、‘値1’のb属性をもつことを示します。
以下では、各タグについて説明します。
Textアダプタ定義全体を規定するタグです。
タグで囲む範囲内に、Textアダプタ定義の本文を記述します。
Textアダプタ定義で、1つだけ記述できます。
構成要素として、以下のタグをもちます。
ReplicationDef
DocumentTypeDef
MappingDef
インデックス対象のデータベースを特定する、抽出定義との対応関係を規定するタグです。
TextAdapterDefタグで囲む範囲内で、1つだけ記述できます。
構成要素として、REPNAMEタグをもちます。
インデックス対象のデータベースを特定する抽出定義の抽出定義名を規定するタグです。
ReplicationDefタグで囲む範囲内で、複数指定できます。複数指定する場合の条件は以下のとおりです。
Textアダプタ定義に指定したすべての抽出定義で、DSIパラメタを除くすべてのパラメタの情報が一致している。
各抽出定義に指定したDSIパラメタの値は、一意性が保証されている。
1つの抽出定義を複数のTextアダプタ定義で共用して使用することはできません。
Linkexpress Replication optionの抽出定義コマンドで指定した抽出定義名を指定します。
全文検索の対象となる文書データの文書種別に関する情報を規定するタグです。
TextAdapterDefタグで囲む範囲内で、1つだけ記述できます。
タグに内容が存在しない場合は、省略することができます。
構成要素として、TypeColumnタグを複数もちます。
以下の情報を規定するタグです。
全文検索の対象となる文書データの文書種別
文書データを格納する列と文書種別の情報を格納する列の対応関係
文書データを格納する列のデータ型が、BLOB型の場合だけ意味をもちます。BLOB型でない場合、タグを記述する必要はありません。
文書種別を規定する列は、name属性として規定します。
name属性で規定した列に格納した値と、文書種別の対応関係は、DocumentTypeタグで規定します。
name属性で規定した列が示す文書種別の適用される文書データを格納した列は、TargetColumnタグで規定します。
DocumentTypeDefタグで囲む範囲内で、複数のTypeColumnタグを記述することができます。TypeColumnタグを指定するのは、以下の場合です。
全文検索の対象とする文書データが複数種ある。
各文書データがBLOB型の列に格納される。
各文書データの文書種別を規定する列が複数ある。
TypeColumnタグで囲む範囲内に、それぞれ複数のタグを記述することができます。構成要素として、以下のタグをもちます。
DocumentType
TargetColumn
以下の属性のどちらかをもちます。
name属性
インデックス対象のデータベースの表で、文書種別を規定する列の列名を指定します。
name属性に指定できる列名は、以下のデータ型をもつ列です。
INT型
SMALLINT型
default属性
全文検索の対象とする文書データの文書種別が1種類の場合、文書種別の規定を省略して記述することができます。
文書種別の規定を省略する場合、<TypeColumn default=‘文書種別’>と指定します。文書種別には、DocumentTypeタグで説明している文書種別文字のどれか1つを指定します。
default属性を指定した場合、DocumentTypeタグを規定する必要はありません。
default属性を指定した場合の記述例を以下に示します。
~
<DocumentTypeDef>
<!--文書種別規定部-->
<TypeColumn default = 'txt'>
<TargetColumn>対象列名</TargetColumn>
</TypeColumn>
</DocumentTypeDef>
~
TypeColumnタグのname属性で規定した列に格納した値と、文書種別の対応関係を規定します。
文書種別を規定する列に格納している値は、value属性に規定します。
value属性で規定した値と、本タグの文書種別名が対応関係をもつと解釈します。
TypeColumnタグで囲む範囲内で、複数のタグを記述することができます。
TypeColumnタグで、default属性を規定した場合、指定できません。
文書種別としてAccela BizSearchが規定する収集対象の文書タイプ名を指定します。指定する文書タイプ名の概要を以下に示します。
参照
文書タイプ名の詳細は、“Accela BizSearch プログラマーズガイド”、“Accela BizSearch アドミニストレーターズガイド”を参照してください。
対象文書 | 文書タイプ名 |
---|---|
テキスト文書 | txt |
HTML文書 | htm |
Word文書 | doc |
OASYS for Windows文書 | oas |
一太郎文書 | jsy |
Excel文書 | xls |
PowerPoint文書 | ppt |
PDF文書 |
以下の属性をもちます。
value属性
文書種別を規定する列に格納した値を指定します。
格納する値の種別ごとに規定してください。
文書種別を規定する列に本属性で指定された値以外の値が格納されていた場合、rdbtaisコマンドの-gオプションを指定すると、対象のレコードは収集文書リストファイルへの書出し対象になりません。
参照
rdbtaisコマンドについては“コマンドリファレンス”を参照してください。
文書種別を適用する文書データを格納する列を規定します。ここでの文書種別は、TypeColumnタグのname属性で規定した列で示しています。
TypeColumnタグで囲む範囲内で、複数のタグを記述することができます。複数指定することで、文書種別を適用する文書データを格納する列を複数指定できます。ここで、指定する文書データは、文書種別が同じものを指定します。
文書データを格納する列の列名を指定します。列名を指定する列のデータ型はBLOB型です。BLOB型以外の列を指定することはできません。
インデックス対象の表と、インデックスとの対応関係を規定するタグです。
TextAdapterタグで囲む範囲内で、1つだけ記述することができます。
構成要素として、以下のタグをもちます。
TargetSearchDBname
Column
以下の属性を持ちます。
dbinfo属性
インデックスの検索フィールドとして、データベースに関する情報(「database」フィールド、「schema」フィールド、「table」フィールド)が必要かどうかを指定します。データベースに関する情報をインデックスの検索フィールドに持つ場合、dbinfo属性に'yes'を指定します。データベースに関する情報をインデックスの検索フィールドに持たない場合、dbinfo属性に'no'を指定します。
本属性は、省略することができます。省略した場合、'yes'を指定したとみなします。
インデックスを含むAccela BizSearchの検索データベースを、規定するタグです。
MappingDefタグで囲む範囲内で、複数指定できます。
インデックスを含む検索データベースの検索データベース名を指定します。この検索データベース名は、Accela BizSearchの検索サーバ設定ファイルで定義した名前です。
参照
検索データベースとインデックスの関係については、“Accela BizSearch アドミニストレーターズガイド”を参照してください。
以下の属性を持ちます。
host属性
検索サーバを配置するマシンのホスト名を指定します。検索アプリケーションプログラムを実行するマシンと同じマシン上に検索サーバを配置する場合は、host属性に’localhost'を指定します。検索アプリケーションプログラムを実行するマシンとは異なるマシン上に検索サーバを配置する場合は、host属性に検索サーバを配置するマシンのホスト名を指定します。
本属性は、省略することができます。省略した場合、'localhost'が指定されたものとみなします。
port属性
検索サーバを配置するマシンに接続するためのポート番号を指定します。本属性は、検索アプリケーションプログラムを実行するマシンとは異なるマシン上に検索サーバを配置する場合に指定します。検索アプリケーションプログラムと同一のマシンに検索サーバを配置する場合は、本属性に'0'を指定します。
本属性は、省略することができます。省略した場合、'0'が指定されたものとみなします。
インデックス対象とするデータベースの表の列と、インデックスのフィールド名との対応関係を規定するタグです。
name属性で指定した列名とタグの内容のフィールド名を、1対1に対応付けます。
MappingDefタグで囲む範囲内で、複数のタグを記述することができます。
インデックスのフィールド名を指定します。フィールド名は、インデックス定義ファイルのフィールドに指定した名前です。
以下の属性をもちます。
name属性
インデックスのフィールド名と対応付ける列の列名を指定します。name属性に指定できる列名は、以下のデータ型をもつ列です。
BLOB型
CHAR型
VARCHAR型
DATE型
TIME型
TIMESTAMP型
NUMERIC型
DECIMAL型
search属性
列指定のCONTAINS関数を実行する場合、検索を行うフィールド名を記述しているColumnタグのsearch属性に'yes'を指定します。本属性は、省略することができます。本属性を省略した場合、name属性値が同じColumnタグのうち、最初に記述したColumnタグに'yes'が指定されたものとみなします。