本部品の出力結果は、「CSV形式への変換」部品を使うと、出力データストアに格納できるテーブル型に変換することができます。
変換結果のテーブル型の形式は次のとおりです。
列番号 | 項目名 | 値の説明 |
---|---|---|
1 | データ番号 | 入力データ(行)に対して1から順に振られる番号です。 |
2 | 文番号 | 一つの入力データを文分割した結果(文)に対して、1から順に振られる番号です。 入力データ(行)が変わると番号は1に戻ります。 |
3 | オフセット | 各形態素の文中の位置を、文の先頭からのバイト数で示した値です。ただしバイト数の値は、文中の文字コードを以下とみなして計算されます。
文の先頭の形態素ならば0となります。 |
4 | 表記 | 形態素の表記です。 |
5 | 内部品詞番号 | 形態素の品詞の種類を表す内部情報です。 |
6 | 統合表記 | 各形態素に対して、以下の処理を行った表記です。
|
7 | 品詞名 | 形態素の品詞名です。 |
8 | 詳細品詞名 | 形態素の詳細な品詞名です。 |
9 | フレーズフラグ | 次の値が出力されます。
|
例
形態素解析結果の例
「従来の2倍の速さで処理できます。」という文を入力データとした場合
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
---|---|---|---|---|---|---|---|---|
1 | 1 | 0 | 従来 | 127 | 従来 | 名詞 | 時詞 | 0 |
1 | 1 | 4 | の | 94 | の | 助詞 | 助詞「の」 | 0 |
1 | 1 | 6 | 2 | 124 | 2 | 名詞 | 数字 | 0 |
1 | 1 | 7 | 倍 | 181 | 倍 | 接尾語 | 数詞接尾語 | 0 |
1 | 1 | 9 | の | 94 | の | 助詞 | 助詞「の」 | 0 |
1 | 1 | 11 | 速さ | 99 | 速さ | 名詞 | 普通名詞 | 1 |
1 | 1 | 15 | で | 92 | で | 助詞 | 格助詞 | 0 |
1 | 1 | 17 | 処理 | 126 | 処理 | 名詞 | サ変名詞 | 0 |
1 | 1 | 21 | でき | 16 | できる | 補助動詞 | サ変補助動詞 | 0 |
1 | 1 | 25 | ます | 52 | ます | 助動詞 | ます終止連体形 | 0 |
1 | 1 | 29 | 。 | 98 | 。 | その他 | 句点 | 0 |
表のタイトル行は列番号を表しています。なお、実際に出力される結果では、先頭行に項目名が出力されます。
1列目と2列目の値が両方の列ともすべて1であることから、入力データ1行が1文であることが分かります。
9列目の値が1であることから、「速さ」が複数の形態素を1つに合成したものであることが分かります。