機能
抽出機能を使用するための初期化、動作環境パラメタを設定します。
記述形式
#include "libAsis.h" /* 公開ヘッダ */ int AsisInitSelect( ASISHANDLE SHandle, /* ハンドル */ char *CharacterCode, /* 文字コード */ char *InFileType, /* 入力ファイルタイプ */ char *SkipChar, /* スキップキャラクタ */ char *SeparateChar, /* セパレートキャラクタ */ int ANKmix, /* 半角英字の大小文字の区別 */ int KNJmix, /* 全角英字の大小文字の区別 */ char *Reserve1, /* 予備 */ char *Reserve2, /* 予備 */ char *Reserve3); /* 予備 */ |
パラメタ
データ型 | パラメタ | 用途 | 説明 |
---|---|---|---|
ASISHANDLE | SHandle | 入力 | ハンドルを指定します。 |
char* | 入力 | 検索対象となる文字列の文字コードを指定します。 | |
char* | 入力 | 入力ファイルタイプを指定します。 | |
char* | 入力 | 文字列検索を行う場合に検索対象外として取り扱う文字列(スキップキャラクタ)を指定します。 | |
char* | 入力 | ワード検索を行う場合のワード区切り文字(セパレートキャラクタ)を指定します。 | |
int | 入力 | 検索対象文字列の半角英字について大文字・小文字の取扱いを指定します。 | |
int | 入力 | 検索対象文字列の全角英字について大文字・小文字の取扱いを指定します。 | |
char* | Reserve1 | 予備 | NULLを指定します。 |
char* | Reserve2 | 予備 | NULLを指定します。 |
char* | Reserve3 | 予備 | NULLを指定します。 |
文字列検索を行う場合は、検索対象外として取り扱う文字列(スキップキャラクタ)を指定します。
SkipCharには、制御文字を除く文字、改行および水平タブを指定します。
本パラメタを省略した場合(NULL指定時)、または空文字("")を指定した場合は、すべての文字が検索対象となります。
SkipCharに指定する文字は複数指定可能です。複数指定する場合は、個々の文字列をカンマ(,)で区切って指定します。
注意
本パラメタは、パターンの文字列検索および文字列の完全一致で有効です。
下記の文字以外をSkipCharに指定する場合は、CharacterCodeで定義した文字コードでSkipCharを表現してください。なお、大文字と小文字は区別されます。
文字 | 指定方法 |
---|---|
半角空白 | ¥s |
全角空白 | ¥S |
改行 | ¥n |
水平タブ | ¥t |
以下の文字をSkipCharに指定する場合の例を示します。
指定する文字:半角空白、全角空白、水平タブ、@(半角文字)、@(全角文字)および改行
CharacterCodeで定義した文字コード | UTF-8 | SHIFT-JIS | EUC |
---|---|---|---|
半角空白 | ¥s | ¥s | ¥s |
全角空白 | ¥S | ¥S | ¥S |
水平タブ | ¥t | ¥t | ¥t |
@(全角文字) | ¥EF ¥BC ¥A0 | ¥81 ¥97 | ¥A1 ¥F7 |
@(半角文字) | ¥40 | ¥40 | ¥40 |
改行 | ¥n | ¥n | ¥n |
記述例は以下のようになります。
CharacterCodeで定義した文字コード | 記述例 |
---|---|
UTF-8 | ¥s,¥S,¥t,¥EF ¥BC ¥A0,¥40,¥n |
SHIFT-JIS | ¥s,¥S,¥t,¥81 ¥97,¥40,¥n |
EUC | ¥s,¥S,¥t,¥A1 ¥F7,¥40,¥n |
注意
入力ファイルタイプ(InFileType)の指定によってSkipCharに以下の文字は指定できません。
入力ファイルタイプ | SkipCharに |
---|---|
CSVの場合 | " |
,(注) | |
¥n | |
XMLの場合 | < |
> | |
] | |
" | |
' |
注)AsisSetEnvironment関数の環境パラメタFieldSeparatorに指定した区切り文字に対応します。
例えば、環境パラメタFieldSeparatorにカンマ(,)と水平タブを指定した場合、SkipCharパラメタにカンマ(,)と水平タブは指定できません。
SeparateCharに指定する文字は複数指定可能です。複数指定する場合は、個々の文字列をカンマ(,)で区切って指定します。
SeparateCharには、制御文字以外のASCII文字、改行および水平タブを指定します。
注意
下記の文字をSeparateCharに指定する場合は、エスケープ文字を付加してSeparateCharを表現してください。エスケープ文字は“¥”です。
区切り文字 | 指定方法 |
---|---|
半角空白 | ¥s |
改行 | ¥n |
水平タブ | ¥t |
カンマ | ¥, |
二重引用符 | ¥" |
¥マーク | ¥¥ |
本パラメタを省略した場合(NULL指定時)、または空文字("")を指定した場合は、入力ファイルタイプ(InFileType)によって以下の“区切り文字”が指定されたとみなします。
CSVの場合
¥t(注) |
| ¥s(注) |
| ! | $ |
% | & | ' | ( | ) | * |
+ | ¥,(注) | - | . | / | : |
; | < | = | > | ? | @ |
[ | ¥¥ | ] | ^ | _ | ` |
{ | | | } | ~ |
|
|
注)AsisSetEnvironment関数の環境パラメタFildSeparatorに指定された区切り文字は除外されます。
XMLの場合
¥t | ¥n | ¥s | ¥" | ! | $ |
% | & | ' | ( | ) | * |
+ | ¥, | - | . | / | : |
; |
| = |
| ? | @ |
[ | ¥¥ |
| ^ | _ | ` |
{ | | | } | ~ |
|
|
注意
入力ファイルタイプ(InFileType)の指定によってSeparateCharに以下の文字は指定できません。
入力ファイルタイプ | SeparateCharに |
---|---|
CSVの場合 | " |
,(注) | |
¥n | |
XMLの場合 | < |
> | |
] |
注)AsisSetEnvironment関数の環境パラメタFieldSeparatorに指定した区切り文字に対応します。
例えば、環境パラメタFieldSeparatorにカンマ(,)と水平タブを指定した場合、SeparateCharパラメタにカンマ(,)と水平タブは指定できません。
復帰値
復帰値 | 説明 |
---|---|
ASIS_SUCCESS | 関数が正常に終了したことを示します。 |
ASIS_ERROR | 関数の実行時に問題が検出されたことを示します。 |