shunselectコマンドの動作環境を記述します。
select用動作環境ファイルの内容は、システムロケールの文字コードで記述してください。
以下に、select用動作環境ファイルの実行パラメタを示します。
パラメタ | 省略 | 説明 |
---|---|---|
可 | 検索対象となる文字列の文字コードを指定します。 | |
可 | 入力ファイルタイプを指定します。 | |
可 | 文字列検索を行う場合に検索対象外として取り扱う文字列(スキップキャラクタ)を指定します。 | |
可 | ワード検索を行う場合のワード区切り文字(セパレートキャラクタ)を指定します。 | |
可 | 検索対象文字列の半角英字について大文字・小文字の取扱いを指定します。 | |
可 | 検索対象文字列の全角英字について大文字・小文字の取扱いを指定します。 | |
LogFile | 可 | ログファイルを指定します。 |
可 | 複数の入力ファイルを同時に処理するための並列数を指定します。 | |
可 | 入力ファイルタイプがCSVの場合、項目間の区切り文字を二重引用符(")で囲んで指定します。 | |
可 | 入力ファイルタイプがCSVの場合、2つ以上の連続した区切り文字の扱いを指定します。 | |
可 | 入力ファイル中にエラーデータを検出したときの、エラーデータ出力ファイルを指定します。 | |
PathNameCompatibility | 可 | 出力ファイルの出力方法を指定します。 |
可 | 入力ファイルに特殊なデータを含む場合の抽出処理の扱いを指定します。 |
文字列検索を行う場合は、検索対象外として取り扱う文字列(スキップキャラクタ)を二重引用符(")で囲んで指定します。
SkipCharには、制御文字を除く文字、改行および水平タブを指定します。
本パラメタを省略した場合、または空文字("")を指定した場合は、すべての文字が検索対象となります。
SkipCharに指定する文字は複数指定可能です。複数指定する場合は、個々の文字列をカンマ(,)で区切って指定します。
注意
本パラメタは、パターンの文字列検索および文字列の完全一致で有効です。
下記の文字以外をSkipCharに指定する場合は、CharacterCodeで定義した文字コードでSkipCharを表現してください。なお、大文字と小文字は区別されます。
文字 | 指定方法 |
---|---|
半角空白 | ¥s |
全角空白 | ¥S |
改行 | ¥n |
水平タブ | ¥t |
以下の文字をSkipCharに指定する場合の例を示します。
指定する文字:半角空白、全角空白、水平タブ、@(半角文字)、@(全角文字)および改行
CharacterCodeで定義した文字コード | UTF-8 | SHIFT-JIS | EUC |
---|---|---|---|
半角空白 | ¥s | ¥s | ¥s |
全角空白 | ¥S | ¥S | ¥S |
水平タブ | ¥t | ¥t | ¥t |
@(全角文字) | ¥EF ¥BC ¥A0 | ¥81 ¥97 | ¥A1 ¥F7 |
@(半角文字) | ¥40 | ¥40 | ¥40 |
改行 | ¥n | ¥n | ¥n |
記述例は以下のようになります。
CharacterCodeで定義した | 記述例 |
---|---|
UTF-8 | ¥s,¥S,¥t,¥EF ¥BC ¥A0,¥40,¥n |
SHIFT-JIS | ¥s,¥S,¥t,¥81 ¥97,¥40,¥n |
EUC | ¥s,¥S,¥t,¥A1 ¥F7,¥40,¥n |
注意
入力ファイルタイプ(InFileType)の指定によってSkipCharに以下の文字は指定できません。
入力ファイルタイプ | SkipCharに |
---|---|
CSVの場合 | " |
,(注) | |
¥n | |
XMLの場合 | < |
> | |
] | |
" | |
' |
注)FieldSeparatorパラメタに指定した区切り文字に対応します。
例えば、FieldSeparatorパラメタに、カンマ(,)と水平タブを指定した場合、SkipCharパラメタにカンマ(,)と水平タブは指定できません。
検索式にワード検索を指定する場合に、区切り文字全体を二重引用符(")で囲んで指定します。
SeparateCharに指定する文字は複数指定可能です。複数指定する場合は、個々の文字列をカンマ(,)で区切って指定します。
SeparateCharには、制御文字以外のASCII文字、改行および水平タブを指定します。
注意
下記の文字をSeparateCharに指定する場合は、エスケープ文字を付加してSeparateCharを表現してください。エスケープ文字は“¥”です。
区切り文字 | 指定方法 |
---|---|
半角空白 | ¥s |
改行 | ¥n |
水平タブ | ¥t |
カンマ | ¥, |
二重引用符 | ¥" |
¥マーク | ¥¥ |
本パラメタを省略した場合、または""と記述し区切り文字を1つも指定しなかった場合は、入力ファイルタイプ(InFileType)によって以下の“区切り文字”が指定されたとみなします。
CSVの場合
¥t(注) |
| ¥s(注) |
| ! | $ |
% | & | ' | ( | ) | * |
+ | ¥,(注) | - | . | / | : |
; | < | = | > | ? | @ |
[ | ¥¥ | ] | ^ | _ | ` |
{ | | | } | ~ |
|
|
注) FildSeparatorに指定された区切り文字は除外されます。
XMLの場合
¥t | ¥n | ¥s | ¥" | ! | $ |
% | & | ' | ( | ) | * |
+ | ¥, | - | . | / | : |
; |
| = |
| ? | @ |
[ | ¥¥ |
| ^ | _ | ` |
{ | | | } | ~ |
|
|
注意
入力ファイルタイプ(InFileType)の指定によってSeparateCharに以下の文字は指定できません。
入力ファイルタイプ | SeparateCharに |
---|---|
CSVの場合 | " |
,(注) | |
¥n | |
XMLの場合 | < |
> | |
] |
注)FieldSeparatorパラメタに指定した区切り文字に対応します。
例えば、FieldSeparatorパラメタに、カンマ(,)と水平タブを指定した場合、SeparateCharパラメタにカンマ(,)と水平タブは指定できません。
検索対象文字列の半角英字について大文字・小文字の取扱いを指定します。
0:区別する
1:区別しない
本パラメタを省略した場合、0が指定されたとみなします。
検索キーワード | 検索対象文字 | 0:区別する | 1:区別しない |
---|---|---|---|
ab | ab | ○ | ○ |
AB | × | ○ | |
aB | × | ○ | |
Ab | × | ○ | |
AB | ab | × | ○ |
AB | ○ | ○ | |
aB | × | ○ | |
Ab | × | ○ |
○:ヒットする
×:ヒットしない
検索対象文字列の全角英字について大文字・小文字の取扱いを指定します。
0:区別する
1:区別しない
本パラメタを省略した場合、0が指定されたとみなします。
検索キーワード | 検索対象文字 | 0:区別する | 1:区別しない |
---|---|---|---|
ab | ab | ○ | ○ |
AB | × | ○ | |
aB | × | ○ | |
Ab | × | ○ | |
AB | ab | × | ○ |
AB | ○ | ○ | |
aB | × | ○ | |
Ab | × | ○ |
○:ヒットする
×:ヒットしない
入力定義ファイルのDataFileパラメタを2つ以上指定した場合、複数の入力ファイルから同時に抽出を行う並列数を指定します。
ParallelNumパラメタに指定できる値は、1から128までです。
ParallelNumパラメタで指定した並列数がDataFileパラメタの指定数(入力ファイルの数)よりも小さい場合、並列数以上の入力ファイルは、並列数以内の入力ファイルの抽出が終わった後に順次、実行されます。
ParallelNumパラメタで指定した並列数がDataFileパラメタの指定数(入力ファイルの数)よりも大きい場合、入力ファイルの数が同時に抽出を行う並列数となります。
注意
ParallelNumパラメタに2以上を指定した場合、入力定義ファイルのDataFileパラメタに指定した順に並列に抽出します。そのため、出力定義ファイルに指定した出力ファイルには、複数の入力ファイルからの抽出結果が混在して出力されます。
並列処理時の出力ファイルイメージを以下に示します。
図B.1 並列処理時の出力ファイルイメージ
ParallelNumパラメタに2以上を指定した場合、入力ファイルは複数の物理ディスクに分散して配置することで、読込み処理のディスクI/Oの負荷を分散することができ、並列効果を最大限に発揮できます。
そのため、ParallelNumパラメタに指定した並列数と、入力ファイルを配置する物理ディスクの数を同じにすることを推奨します。
入力ファイルタイプがCSVの場合、項目間の区切り文字を変更する場合は、新しく区切り文字とする文字を二重引用符(")で囲んで指定します。区切り文字として使用できる文字は、以下のとおりです。
区切り文字 | 指定方法 |
---|---|
カンマ | ¥, |
半角空白 | ¥s |
水平タブ | ¥t |
区切り文字として複数指定する場合は、個々の文字列をカンマ(,)で区切って指定します。
注意
本パラメタを指定した場合の出力時の区切り文字は、検索定義ファイルにおけるリターン式の指定によって、以下のように異なります。
リターン式 | 出力時の区切り文字 |
---|---|
指定あり | カンマ |
指定なし | 入力ファイルと同じ形式 |
入力ファイルタイプがCSVの場合、2つ以上の連続した区切り文字の扱いを指定します。
0:1つの区切り文字を1つの項目間の区切りとして扱う。
1:2つ以上の連続した区切り文字を1つの項目間の区切りとして扱う。
本パラメタを省略した場合、0が指定されたものとみなします。
入力ファイルタイプがCSVの場合、エラーデータ出力ファイルと、エラーデータの最大出力件数を指定します。
本パラメタを指定すると、エラーデータを検索対象外のデータとして扱い、処理を継続します。
本パラメタを省略した場合、エラーデータを検出した時点でコマンドが異常終了します。
図B.2 エラーデータ出力の定義
入力ファイル中にエラーデータを検出したとき、そのエラーデータの情報を出力します。
指定したファイルがすでに存在している場合は、その情報が上書きされます。
入力ファイル中にエラーデータが存在しなかった場合、エラーデータ出力ファイルは作成されません。
エラーデータの最大出力件数に指定できる値は、1から2147483647までです。
エラーデータの最大出力件数を指定すると、エラーデータが指定件数分、出力された時点でコマンドが異常終了します。
本パラメタを省略した場合、1000が指定されたものとみなします。
ポイント
エラーデータ出力ファイルには、文字コードが異なる入力ファイル名と、エラーとなったレコードが混在して出力されます。入力ファイル名に半角英数字を入れるなど工夫すると便利です。
詳細については、“B.1.2 入力定義ファイル”のDataFileパラメタを参照してください。
参照
エラーデータ出力ファイルの出力例は、“2.1.1.3 入力ファイルのエラー処理”のエラーデータ出力ファイルの例を参照してください。
入力ファイルタイプがXMLの場合、以下の特殊なデータを含むときの抽出処理の扱いを指定します。
コメントセクション
CDATAセクション
処理命令
混在内容
0:V9.1系の形式で抽出結果を出力する。
1:V9.0系の互換形式の抽出結果を出力する。
本パラメタを省略した場合、0が指定されたものとみなします。
注意
本パラメタに1を指定した場合、以下の機能は使用できません。
検索式に関数を指定する
日時データを検索する
ポイント
混在内容
要素ノードの子ノードに、テキストノードと要素ノードが混在するXML形式のことです。
詳細については、“2.4.2 1つの要素ノード配下にテキストノードと要素ノードが混在しているデータの扱い”を参照してください。
参照
互換形式の抽出結果の詳細については、“リリース情報”の“互換に関する情報”を参照してください。
以下に、select用動作環境ファイルの実行パラメタを示します。
Windowsの場合
# 文字コード CharacterCode SHIFT-JIS # 入力ファイルタイプ InFileType CSV # スキップキャラクタ SkipChar "¥t,¥S" # 区切り文字 SeparateChar "¥t" # 半角英字の大文字・小文字の区別 ANKmix 0 # 全角英字の大文字・小文字の区別 KNJmix 0 # ログファイル LogFile "D:¥Shunsaku¥log¥Select.log" # 並列数 ParallelNum 4 # CSV形式の区切り文字 FieldSeparator "¥s" # CSV形式の連続した区切り文字の扱い FieldSeparatorMode 0 # エラーデータ出力ファイル ErrFile "D:¥Shunsaku¥errdata¥err.csv" 10 |
Linux/Solarisの場合
# 文字コード CharacterCode EUC # 入力ファイルタイプ InFileType CSV # スキップキャラクタ SkipChar "¥t,¥S" # 区切り文字 SeparateChar "¥t" # 半角英字の大文字・小文字の区別 ANKmix 0 # 全角英字の大文字・小文字の区別 KNJmix 0 # ログファイル LogFile /home/shunsaku/log/Select.log # 並列数 ParallelNum 4 # CSV形式の区切り文字 FieldSeparator "¥s" # CSV形式の連続した区切り文字の扱い FieldSeparatorMode 0 # エラーデータ出力ファイル ErrFile /home/shunsaku/errdata/err.csv 10 |