B.1.1 select用動作環境ファイル

shunselectコマンドの動作環境を記述します。

select用動作環境ファイルの内容は、システムロケールの文字コードで記述してください。

実行パラメタの種類と意味

以下に、select用動作環境ファイルの実行パラメタを示します。

パラメタ	省略	説明
CharacterCode	可	検索対象となる文字列の文字コードを指定します。本パラメタを省略した場合、UTF-8が指定されたとみなします。
InFileType	可	入力ファイルタイプを指定します。本パラメタを省略した場合、CSVが指定されたとみなします。
SkipChar	可	文字列検索を行う場合に検索対象外として取り扱う文字列(スキップキャラクタ)を指定します。
SeparateChar	可	ワード検索を行う場合のワード区切り文字(セパレートキャラクタ)を指定します。
ANKmix	可	検索対象文字列の半角英字について大文字・小文字の取扱いを指定します。 0:区別する 1:区別しない本パラメタを省略した場合、0が指定されたとみなします。
KNJmix	可	検索対象文字列の全角英字について大文字・小文字の取扱いを指定します。 0:区別する 1:区別しない本パラメタを省略した場合、0が指定されたとみなします。
LogFile	可	ログファイルを指定します。本パラメタを省略した場合、ログ出力を行いません。本パラメタを指定した場合、指定されたログファイルに追記出力します。
ParallelNum	可	複数の入力ファイルを同時に処理するための並列数を指定します。本パラメタを省略した場合、1が指定されたとみなします。
FieldSeparator	可	入力ファイルタイプがCSVの場合、項目間の区切り文字を二重引用符（"）で囲んで指定します。入力ファイルタイプがXMLの場合は指定できません。本パラメタを省略した場合は、項目間の区切り文字としてカンマ（,）が指定されたとみなします。
FieldSeparatorMode	可	入力ファイルタイプがCSVの場合、2つ以上の連続した区切り文字の扱いを指定します。 0 : 1つの区切り文字を1つの項目間の区切りとして扱う。 1 : 2つ以上の連続した区切り文字を1つの項目間の区切りとして扱う。入力ファイルタイプがXMLの場合は指定できません。本パラメタを省略した場合、0が指定されたとみなします。
ErrFile	可	入力ファイル中にエラーデータを検出したときの、エラーデータ出力ファイルを指定します。また、エラーデータの最大出力件数を指定できます。入力ファイルタイプがXMLの場合は指定できません。本パラメタを省略した場合、エラーデータを検出したとき、コマンドが異常終了します。
PathNameCompatibility	可	出力ファイルの出力方法を指定します。 0 : 見出し行とデータ行を分ける出力方法 1 : 見出し行とデータ行を分けない出力方法入力ファイルタイプがCSVの場合に有効です。本パラメタを省略した場合、0が指定されたとみなします。
TextNodeCompatibility	可	入力ファイルに特殊なデータを含む場合の抽出処理の扱いを指定します。 0 : V9.1系の抽出結果 1 : V9.0系の互換形式の抽出結果入力ファイルタイプがXMLの場合に有効です。本パラメタを省略した場合、0が指定されたとみなします。

CharacterCode

設定	意味
UTF-8	UTF-8の場合
SHIFT-JIS	Shift-JISの場合
EUC	EUC-JPの場合

InFileType

設定	意味
CSV	CSVの場合
XML	XMLの場合

SkipChar: 文字列検索を行う場合は、検索対象外として取り扱う文字列(スキップキャラクタ)を二重引用符(")で囲んで指定します。
SkipCharには、制御文字を除く文字、改行および水平タブを指定します。
本パラメタを省略した場合、または空文字("")を指定した場合は、すべての文字が検索対象となります。
SkipCharに指定する文字は複数指定可能です。複数指定する場合は、個々の文字列をカンマ(,)で区切って指定します。

注意

本パラメタは、パターンの文字列検索および文字列の完全一致で有効です。
下記の文字以外をSkipCharに指定する場合は、CharacterCodeで定義した文字コードでSkipCharを表現してください。なお、大文字と小文字は区別されます。
文字
指定方法
半角空白
¥s
全角空白
¥S
改行
¥n
水平タブ
¥t

例

以下の文字をSkipCharに指定する場合の例を示します。
指定する文字：半角空白、全角空白、水平タブ、@(半角文字)、＠(全角文字)および改行

CharacterCodeで定義した文字コード	UTF-8	SHIFT-JIS	EUC
半角空白	¥s	¥s	¥s
全角空白	¥S	¥S	¥S
水平タブ	¥t	¥t	¥t
＠(全角文字)	¥EF ¥BC ¥A0	¥81 ¥97	¥A1 ¥F7
@(半角文字)	¥40	¥40	¥40
改行	¥n	¥n	¥n

記述例は以下のようになります。

CharacterCodeで定義した文字コード	記述例
UTF-8	¥s,¥S,¥t,¥EF ¥BC ¥A0,¥40,¥n
SHIFT-JIS	¥s,¥S,¥t,¥81 ¥97,¥40,¥n
EUC	¥s,¥S,¥t,¥A1 ¥F7,¥40,¥n

注意

入力ファイルタイプ(InFileType)の指定によってSkipCharに以下の文字は指定できません。
入力ファイルタイプ
SkipCharに
指定できない文字
CSVの場合
"
,(注)
¥n
XMLの場合
<
>
]
"
'

注）FieldSeparatorパラメタに指定した区切り文字に対応します。
例えば、FieldSeparatorパラメタに、カンマ（,）と水平タブを指定した場合、SkipCharパラメタにカンマ(,）と水平タブは指定できません。

SeparateChar

検索式にワード検索を指定する場合に、区切り文字全体を二重引用符(")で囲んで指定します。
SeparateCharに指定する文字は複数指定可能です。複数指定する場合は、個々の文字列をカンマ(,)で区切って指定します。
SeparateCharには、制御文字以外のASCII文字、改行および水平タブを指定します。

注意

下記の文字をSeparateCharに指定する場合は、エスケープ文字を付加してSeparateCharを表現してください。エスケープ文字は“¥”です。

区切り文字	指定方法
半角空白	¥s
改行	¥n
水平タブ	¥t
カンマ	¥,
二重引用符	¥"
¥マーク	¥¥

本パラメタを省略した場合、または""と記述し区切り文字を1つも指定しなかった場合は、入力ファイルタイプ(InFileType)によって以下の“区切り文字”が指定されたとみなします。

CSVの場合

¥t(注)		¥s(注)		!	$
%	&	'	(	)	*
+	¥,(注)	-	.	/	:
;	<	=	>	?	@
[	¥¥	]	^	_	`
{	\|	}	~

注) FildSeparatorに指定された区切り文字は除外されます。

XMLの場合

¥t	¥n	¥s	¥"	!	$
%	&	'	(	)	*
+	¥,	-	.	/	:
;		=		?	@
[	¥¥		^	_	`
{	\|	}	~

注意

入力ファイルタイプ(InFileType)の指定によってSeparateCharに以下の文字は指定できません。

入力ファイルタイプ	SeparateCharに指定できない文字
CSVの場合	"
	,(注)
	¥n
XMLの場合	<
	>
	]

注）FieldSeparatorパラメタに指定した区切り文字に対応します。
例えば、FieldSeparatorパラメタに、カンマ（,）と水平タブを指定した場合、SeparateCharパラメタにカンマ(,）と水平タブは指定できません。

ANKmix

検索対象文字列の半角英字について大文字・小文字の取扱いを指定します。

0:区別する
1:区別しない

本パラメタを省略した場合、0が指定されたとみなします。

検索キーワード	検索対象文字	0:区別する	1:区別しない
ab	ab	○	○
	AB	×	○
	aB	×	○
	Ab	×	○
AB	ab	×	○
	AB	○	○
	aB	×	○
	Ab	×	○

○:ヒットする
×:ヒットしない

KNJmix

検索対象文字列の全角英字について大文字・小文字の取扱いを指定します。

0:区別する
1:区別しない

本パラメタを省略した場合、0が指定されたとみなします。

検索キーワード	検索対象文字	0:区別する	1:区別しない
ａｂ	ａｂ	○	○
	ＡＢ	×	○
	ａＢ	×	○
	Ａｂ	×	○
ＡＢ	ａｂ	×	○
	ＡＢ	○	○
	ａＢ	×	○
	Ａｂ	×	○

○:ヒットする
×:ヒットしない

ParallelNum

入力定義ファイルのDataFileパラメタを2つ以上指定した場合、複数の入力ファイルから同時に抽出を行う並列数を指定します。

ParallelNumパラメタに指定できる値は、1から128までです。
ParallelNumパラメタで指定した並列数がDataFileパラメタの指定数(入力ファイルの数)よりも小さい場合、並列数以上の入力ファイルは、並列数以内の入力ファイルの抽出が終わった後に順次、実行されます。
ParallelNumパラメタで指定した並列数がDataFileパラメタの指定数(入力ファイルの数)よりも大きい場合、入力ファイルの数が同時に抽出を行う並列数となります。

注意

ParallelNumパラメタに2以上を指定した場合、入力定義ファイルのDataFileパラメタに指定した順に並列に抽出します。そのため、出力定義ファイルに指定した出力ファイルには、複数の入力ファイルからの抽出結果が混在して出力されます。
並列処理時の出力ファイルイメージを以下に示します。
図B.1 並列処理時の出力ファイルイメージ

ParallelNumパラメタに2以上を指定した場合、入力ファイルは複数の物理ディスクに分散して配置することで、読込み処理のディスクI/Oの負荷を分散することができ、並列効果を最大限に発揮できます。
そのため、ParallelNumパラメタに指定した並列数と、入力ファイルを配置する物理ディスクの数を同じにすることを推奨します。

FieldSeparator

入力ファイルタイプがCSVの場合、項目間の区切り文字を変更する場合は、新しく区切り文字とする文字を二重引用符(")で囲んで指定します。区切り文字として使用できる文字は、以下のとおりです。

区切り文字	指定方法
カンマ	¥,
半角空白	¥s
水平タブ	¥t

区切り文字として複数指定する場合は、個々の文字列をカンマ(,)で区切って指定します。

注意

本パラメタを指定した場合の出力時の区切り文字は、検索定義ファイルにおけるリターン式の指定によって、以下のように異なります。

リターン式	出力時の区切り文字
指定あり	カンマ
指定なし	入力ファイルと同じ形式

FieldSeparatorMode

入力ファイルタイプがCSVの場合、2つ以上の連続した区切り文字の扱いを指定します。

0:1つの区切り文字を1つの項目間の区切りとして扱う。

1:2つ以上の連続した区切り文字を1つの項目間の区切りとして扱う。

本パラメタを省略した場合、0が指定されたものとみなします。

ErrFile

入力ファイルタイプがCSVの場合、エラーデータ出力ファイルと、エラーデータの最大出力件数を指定します。

本パラメタを指定すると、エラーデータを検索対象外のデータとして扱い、処理を継続します。
本パラメタを省略した場合、エラーデータを検出した時点でコマンドが異常終了します。
図B.2 エラーデータ出力の定義

エラーデータ出力ファイル名

入力ファイル中にエラーデータを検出したとき、そのエラーデータの情報を出力します。
指定したファイルがすでに存在している場合は、その情報が上書きされます。
入力ファイル中にエラーデータが存在しなかった場合、エラーデータ出力ファイルは作成されません。

最大出力件数

エラーデータの最大出力件数に指定できる値は、１から2147483647までです。
エラーデータの最大出力件数を指定すると、エラーデータが指定件数分、出力された時点でコマンドが異常終了します。
本パラメタを省略した場合、1000が指定されたものとみなします。

ポイント

エラーデータ出力ファイルには、文字コードが異なる入力ファイル名と、エラーとなったレコードが混在して出力されます。入力ファイル名に半角英数字を入れるなど工夫すると便利です。
詳細については、“B.1.2 入力定義ファイル”のDataFileパラメタを参照してください。

参照

エラーデータ出力ファイルの出力例は、“2.1.1.3 入力ファイルのエラー処理”のエラーデータ出力ファイルの例を参照してください。

TextNodeCompatibility

入力ファイルタイプがXMLの場合、以下の特殊なデータを含むときの抽出処理の扱いを指定します。

コメントセクション
CDATAセクション
処理命令
混在内容

0:V9.1系の形式で抽出結果を出力する。

1:V9.0系の互換形式の抽出結果を出力する。

本パラメタを省略した場合、0が指定されたものとみなします。

注意

本パラメタに1を指定した場合、以下の機能は使用できません。

検索式に関数を指定する
日時データを検索する

ポイント

混在内容

要素ノードの子ノードに、テキストノードと要素ノードが混在するXML形式のことです。
詳細については、“2.4.2 1つの要素ノード配下にテキストノードと要素ノードが混在しているデータの扱い”を参照してください。

参照

互換形式の抽出結果の詳細については、“リリース情報”の“互換に関する情報”を参照してください。

select用動作環境ファイル指定例

以下に、select用動作環境ファイルの実行パラメタを示します。

Windowsの場合

# 文字コード
CharacterCode SHIFT-JIS
# 入力ファイルタイプ
InFileType    CSV
# スキップキャラクタ
SkipChar      "¥t,¥S"
# 区切り文字
SeparateChar  "¥t"
# 半角英字の大文字・小文字の区別
ANKmix        0
# 全角英字の大文字・小文字の区別
KNJmix        0
# ログファイル
LogFile       "D:¥Shunsaku¥log¥Select.log"
# 並列数
ParallelNum      4
# CSV形式の区切り文字
FieldSeparator     "¥s"
# CSV形式の連続した区切り文字の扱い
FieldSeparatorMode  0
# エラーデータ出力ファイル
ErrFile       "D:¥Shunsaku¥errdata¥err.csv"  10

Linux/Solarisの場合

# 文字コード
CharacterCode  EUC
# 入力ファイルタイプ
InFileType     CSV
# スキップキャラクタ
SkipChar       "¥t,¥S"
# 区切り文字
SeparateChar   "¥t"
# 半角英字の大文字・小文字の区別
ANKmix         0
# 全角英字の大文字・小文字の区別
KNJmix         0
# ログファイル
LogFile        /home/shunsaku/log/Select.log
# 並列数
ParallelNum      4
# CSV形式の区切り文字
FieldSeparator     "¥s"
# CSV形式の連続した区切り文字の扱い
FieldSeparatorMode  0
# エラーデータ出力ファイル
ErrFile        /home/shunsaku/errdata/err.csv  10

検索キーワード	検索対象文字	0:区別する	1:区別しない
ab	ab	○	○
	AB	×	○
	aB	×	○
	Ab	×	○
AB	ab	×	○
	AB	○	○
	aB	×	○
	Ab	×	○

検索キーワード	検索対象文字	0:区別する	1:区別しない
ab	ab	○	○
	AB	×	○
	aB	×	○
	Ab	×	○
AB	ab	×	○
	AB	○	○
	aB	×	○
	Ab	×	○

検索キーワード	検索対象文字	0:区別する	1:区別しない
ab	ab	○	○
	AB	×	○
	aB	×	○
	Ab	×	○
AB	ab	×	○
	AB	○	○
	aB	×	○
	Ab	×	○