擬態語に注目しよう
そもそも品詞解析してみたら面白かったので、profileとかにかかわらずクチコミの文章だけで製品同士の関係が導ければ何か今までと違ったものが見えてくるんじゃないかと思って、品詞解析→類似度→グラフ化してみようと思ったのでした。
それなら、ただ馬鹿正直に単純にTF-IDFを計算するだけでは面白くならない。
- 感覚的な単語(形容詞・副詞?)が面白い?女性的?
- 擬態語らしきものを抽出してみよう
擬態語の定義
12.1 語形の特徴
擬音・擬態語の形は次のようなものが多く見られます。
語基 −っ −り −ん 反復 −っ−り −ん−り どき どきっ どきり どきん どきどき どっきり かち かちっ かちり かちん かちかち かっちり ひや ひやっ ひやり ひやひや ひんやり
このように、二拍の語基から多くの形が作られます。これらの形は、基本的に表すものは共通していますが、それぞれ強さ・長さなどの違いがあり、微妙な使い分けがあります。これも学習者には難しいところです。
今後の方針
- 何がやりたいかのアイディアを出す
- 類似度の計算が終わったらすべての製品でグラフ描写してみる
- 単語抽出のプログラムを考える
- 今までやった解析結果を一通りまとめる