ページの先頭行へ戻る
Interstage Business Analytics Modeling Server V1.0.1 分析フロー設計・開発ガイド
FUJITSU Software

8.1 分析で使用する辞書について

日本語テキスト解析を行う分析部品では辞書を使用します。使用する辞書は、以下のとおりです。

単語/同義語辞書

日本語の文章の形態素解析、および同義語判定処理で使用される辞書です。以下の部品で使用されます。

  • 形態素解析部品

例えば、以下のような場合にカスタマイズが必要となります。

  • 「ソーシャルメディア」が、「ソーシャル」と「メディア」に分解されてしまう場合に「ソーシャルメディア」という単語を登録します。

  • 「電池」、「バッテリー」を片方の表記に統一したいとき、単語/同義語辞書を使って同じ表記に統一します。

ネガポジ辞書

文章がネガティブな内容かポジティブな内容かを評価する処理、およびその評価結果を分類集計する処理で使用される辞書です。以下の部品で使用されます。

  • ネガポジ評価部品

例えば、以下のような場合にカスタマイズが必要となります。

  • 一般には「進む」という単語はネガティブワードでもポジティブワードでもありませんが、例えば、時計についての文章ではネガティブワードとみなすことができます。このようにユーザーが分析対象とする文章の分野に応じてネガティブかポジティブか決まる単語を登録します。