分析方法を考える

製品同士の関係を可視化したい。
例↓

客層は女性。
ウィンドウショッピングのようにふらふらと見て回れるのは面白いのではなかろーか。
+リンクが続いているとついその先を見てしまう性質。

方法

  1. 一つの製品に対する全クチコミを一つの文書とする。
    • 製品数=文書数
    • 全製品のクチコミ=全文書
  2. TF-IDFを計算する。
    • 文書D1のベクトル: D1 = (w1,w2,...,wn)
    • 類似度を求める(TF-IDFを正規化して内積を求める)
  3. 単純に、類似度の高い(0.4以上とか)製品同士を線で繋いでグラフにする。
  • ぱっと見て、なんで繋がってるのかわからない
    • 概念を付加できるか?
  • 結局製品に関わらず似たような単語が使われてたりして…(汗
  • ゆくゆくはユーザ情報・評価点数なんかも加味できれば面白そう