ページの先頭行へ戻る
Interstage Business Analytics Modeling Server V1.0.1 部品リファレンス
FUJITSU Software

4.1.4 CSV形式に変換した結果

本部品の出力結果は、「CSV形式への変換」部品を使うと、出力データストアに格納できるテーブル型に変換することができます。

変換結果のテーブル型の形式は次のとおりです。

列番号

項目名

値の説明

1

データ番号

入力データ(行)に対して1から順に振られる番号です。

2

文番号

一つの入力データを文分割した結果(文)に対して、1から順に振られる番号です。

入力データ(行)が変わると番号は1に戻ります。

3

オフセット

各形態素の文中の位置を、文の先頭からのバイト数で示した値です。ただしバイト数の値は、文中の文字コードを以下とみなして計算されます。

WindowsShift_JIS

LinuxEUC-JP

文の先頭の形態素ならば0となります。

4

表記

形態素の表記です。

5

内部品詞番号

形態素の品詞の種類を表す内部情報です。

6

統合表記

各形態素に対して、以下の処理を行った表記です。

  • 活用しない品詞(例:名詞)はそのまま出力します。

  • 活用する品詞(例:動詞)や、その語尾は終止形にして出力します。

  • 数値を表す文字列は次のように変換します。

    • 全角数字、全角プラス、全角マイナス、全角ピリオド(0123456789+-.)は半角文字に変換します。

    • 文字列内のカンマは削除します。

7

品詞名

形態素の品詞名です。

8

詳細品詞名

形態素の詳細な品詞名です。

9

フレーズフラグ

次の値が出力されます。

元は複数の形態素だったものを一つの形態素として合成した場合

1
1が出力される例:「高:形容詞」+「さ:形容詞接辞」⇒「高さ:普通名詞」

それ以外の形態素の場合

0
0が出力される例:「処理:サ変名詞」

形態素解析結果の例

「従来の2倍の速さで処理できます。」という文を入力データとした場合

1

2

3

4

5

6

7

8

9

1

1

0

従来

127

従来

名詞

時詞

0

1

1

4

94

助詞

助詞「の」

0

1

1

6

2

124

2

名詞

数字

0

1

1

7

181

接尾語

数詞接尾語

0

1

1

9

94

助詞

助詞「の」

0

1

1

11

速さ

99

速さ

名詞

普通名詞

1

1

1

15

92

助詞

格助詞

0

1

1

17

処理

126

処理

名詞

サ変名詞

0

1

1

21

でき

16

できる

補助動詞

サ変補助動詞

0

1

1

25

ます

52

ます

助動詞

ます終止連体形

0

1

1

29

98

その他

句点

0

  • 表のタイトル行は列番号を表しています。なお、実際に出力される結果では、先頭行に項目名が出力されます。

  • 1列目と2列目の値が両方の列ともすべて1であることから、入力データ1行が1文であることが分かります。

  • 9列目の値が1であることから、「速さ」が複数の形態素を1つに合成したものであることが分かります。