ページの先頭行へ戻る
Interstage Business Analytics Modeling Server V1.0.1 部品リファレンス
FUJITSU Software

4.2.4 CSV形式に変換した結果

本部品の出力結果は、「CSV形式への変換」部品を使うと、出力データストアに格納できるテーブル型に変換することができます。

変換結果のテーブル型は、“4.1.4 CSV形式に変換した結果”で説明した形式に続けて、次に示す項目を付加した形式となります。

列番号

項目名

値の説明

10

文節フラグ

次の値が出力されます。

B

文節を構成する最初の形態素であることを表します。

O

文節中の2番目以降の形態素であることを表します。

11

複合語フラグ

本部品のパラメーター「複合語抽出」をONに設定した場合に、次の値が出力されます。

複合語(連続した名詞の形態素)の場合
B

複合語の最初の名詞であることを表します。

E

複合語の最後の名詞であることを表します。

I

複合語の中間の名詞であることを表します。

それ以外の形態素の場合
O

複合語ではないことを表します。

注意

「複合語フラグ」の項目は、本部品のパラメーター「複合語抽出」がONの場合のみに出力されます。OFFの場合は列自体が出力されません。

文節分割・複合語抽出結果の例

「総合運動公園まで走った。」という文を入力データとした場合

1

2

3

4

5

6

7

8

9

10

11

1

1

0

総合

126

総合

名詞

サ変名詞

0

B

B

1

1

4

運動

126

運動

名詞

サ変名詞

0

O

I

1

1

8

公園

99

公園

名詞

普通名詞

0

O

E

1

1

12

まで

92

まで

助詞

格助詞

0

O

O

1

1

16

262

走る

動詞

ラ行五段動詞

0

B

O

1

1

18

265

動詞語尾

ラ行五段連用形

0

O

O

1

1

20

79

助動詞

た終止連体形

0

O

O

1

1

22

98

その他

句点

0

O

O

  • 表のタイトル行は列番号を表しています。なお、実際に出力される結果では、先頭行に項目名が出力されます。

  • 10列目の値がBであることから、「総合」「走」の各形態素から文節が始まっていることが分かります。

  • 11列目の値がB、I、Eであることから、「総合」「運動」「公園」の3つの形態素が複合語を形成していることが分かります。