本節では、抽出プロパティファイルの各項目について説明します。
項目名 | 必須 | 意味 |
---|---|---|
必須 | 抽出対象ファイルの文字コード | |
- | 抽出プロパティファイルのコメント | |
必須 | 抽出対象となるカテゴリ名 | |
必須 | 抽出対象となるファイルのデータ形式 | |
必須 | 抽出時の半角英字大小区別の有無 | |
必須 | 抽出時の全角英字大小区別の有無 | |
- | 抽出時の見出し行出力の有無 | |
- | 検索対象外文字列の指定 | |
- | ワード検索区切り文字の指定 | |
必須 | 抽出条件式 | |
- | 返却項目の指定 |
characterCode(必須)
蓄積データファイルの文字コードを指定します。“characterCode=UTF-8”を指定します。
抽出プロパティファイルの項目の一番初めに記述してください。
comment
コメントを記述します。複数コメントを複数行に記述できます。5120バイト以内で設定します。
項目の開始に[commentStart]、終了に[commentEnd]を記述します。
categoryName(必須)
抽出対象となるカテゴリ名を指定します。
fileType(必須)
データの形式を指定します。“XML”または“CSV”を指定します。
ANKmix(必須)
抽出条件式に指定している半角英字の大文字、小文字を区別するか、区別しないかを指定します。
0:区別する
1:区別しない
“区別する”とは、抽出条件式では大文字と小文字を区別して書き分けているという意味で、同じ英字でも大文字と小文字が異なれば一致しません。
“区別しない”とは、抽出条件式では大文字と小文字を区別して書き分けていないという意味で、同じ英字なら大文字と小文字が異なっていても一致します。
KNJmix(必須)
抽出条件式の指定している全角英字の大文字、小文字を区別するか、区別しないかを指定します。
0:区別する
1:区別しない
“区別する”とは、抽出条件式では大文字と小文字を区別して書き分けているという意味で、同じ英字でも大文字と小文字が異なれば一致しません。
“区別しない”とは、抽出条件式では大文字と小文字を区別して書き分けていないという意味で、同じ英字なら大文字と小文字が異なっていても一致します。
labelLine
fileType にCSVを指定した場合だけ、指定必須です。抽出結果ファイルの見出行を出力するか、しないかを指定します。
0:出力する
2:出力しない
fileTypeに“XML”を指定した場合、labelLineに値を設定しても無視されます。
skipCharacter
検索対象外となる文字列を指定します。250バイト以内で設定します。
検索対象外文字は複数指定可能です。複数指定する場合は、個々の文字列をカンマ(,)で区切って指定します。
検索対象外文字を省略した場合、すべての文字が抽出対象となります。
CPMキー値にskipCharacterに指定した文字が含まれる場合、CPMキーに対する抽出条件式はskipCharacterを含めて記述してください。
下記の文字以外をskipCharacterに指定する場合は、characterCodeで定義した文字コードでskipCharacterを表現してください。なお、大文字と小文字は区別されます。
半角空白、全角空白、改行、および水平タブの指定方法を以下に示します。
文字 | 指定方法 |
---|---|
半角空白 | ¥s |
全角空白 | ¥S |
改行 | ¥n |
水平タブ | ¥t |
例
以下の文字をskipCharacterに指定する場合の例を示します。
指定する文字:半角空白、全角空白、水平タブ、@(半角文字)、@(全角文字)、および改行
文字 | 指定方法 |
---|---|
半角空白 | \s |
全角空白 | \S |
水平タブ | \t |
@(全角文字) | \EF \BC \A0 |
@(半角文字) | \40 |
改行 | \n |
記述例は以下のようになります。
¥s,¥S,¥t,¥EF ¥BC ¥A0,¥40,¥n
fileTypeで設定したデータ形式によって、以下の文字は指定できません。
データ形式 | 入力パラメタに指定できない文字 |
---|---|
CSVの場合 | " |
, | |
¥n | |
XMLの場合 | < |
> | |
] | |
" | |
' |
separateCharacter
ワード検索区切り文字を指定します。250バイト以内で設定します。
ワード検索区切り文字は複数指定可能です。複数指定する場合は、個々の文字列をカンマ(,)で区切って指定します。
以下の文字を指定する場合は、エスケープ文字を付加してください。エスケープ文字は“¥”です。
文字 | 指定方法 |
---|---|
半角空白 | \s |
改行 | \n |
水平タブ | \t |
カンマ | \, |
二重引用符 | \" |
\マーク | \\ |
ワード検索区切り文字を省略した場合、以下の“区切り文字”を指定したとみなされます。区切り文字はfileTypeに指定したデータ形式によって異なります。
CSVの場合
¥t | ¥s | ! | $ | % | & |
' | ( | ) | * | + | ¥, |
- | . | / | : | ; | < |
= | > | ? | @ | [ | ¥¥ |
] | ^ | _ | ` | { | | |
} | ~ |
XMLの場合
¥t | \n | ¥s | \" | ! | $ |
% | & | ' | ( | ) | * |
+ | ¥, | - | . | / | : |
; | = | ? | @ | { | | |
[ | ¥¥ | ^ | _ | ` | |
} | ~ |
fileTypeに指定したデータ形式別に、指定できない文字を示します。
データ形式 | 入力パラメタに指定できない文字 |
---|---|
CSVの場合 | " |
, | |
¥n | |
XMLの場合 | < |
> | |
] | |
" | |
' |
convertQuery(必須)
convertReturnItem