先行/関連研究調査
この3連休で論文を書くぞ!ということで.以下リンク先はPDF.
相互作用性に着目したクチコミ研究の系譜と展望: 関係性パラダイムでのクチコミ活用に向けて
2004年.クチコミ関連研究の概観,クチコミ発信者と受信者の相互作用について.
CGM 分析技術の現状と課題
CGMをブログやSNS等で分散的に書かれたものと定義し,その中から口コミを集める手法とそのサービスについて.比較対象サービスとして@cosme等のクチコミサイトを取り上げている.
で,論文の結論は?
新しい分類手法を考えて従来より検索しやすい・製品集合が検索できるシステムを作った,になるんだろうか.その単語で検索すりゃすむことじゃね?とか言われそう.相変わらず評価はどうすんねん.
matファイルを転置するtmatrix.rbを作った
行列操作がだいぶ用意されているので楽だった.
プログラミング言語 Ruby リファレンスマニュアル
Matrix - mumoshu.log
概念束プログラムがバージョンアップしたので不要になりました
できた概念束を受けて
- 今のままだとなんのこっちゃ分からないので,カテゴリ毎に記号化して表示
- 欲しいアイテムセットが出るか?
- カテゴリ毎に分けられてしまっているので,DFを求める際の文書集合をカテゴリ毎にする
- 現状は属性を上限10個に制限しているのでその制限を解除
- ユーザを属性として概念束を作る
みたらいさんから概念束改良プログラムを頂きました.
記号化
ruby id-ctgr.rb file1.dot obj.list > file2 lv -Ou8 file2 > file.dot
- ●
- 8 化粧下地
- ◆
- 9 パウダーファンデ
- 10 リキッドファンデ
- 11 クリームファンデ
- 12 スティック・その他ファンデ
- ■
- 13 コンシーラー
- ○
- 14 ルースパウダー
- 47 プレストパウダー
- ▼
- 22 アイブロウペンシル
- 48 アイブロウパウダー・その他
- ★
- 49 ペンシルアイライナー
- 20 リキッドアイライナー
- ☆
- 21 マスカラ
- 50 マスカラ下地・まつげ美容液
- §
- 19 アイシャドウ
- Δ
- 15 口紅
- 16 リップグロス
- 17 リップライナー
- ※
- 18 チーク
DFを変える
- これまで
- 1製品に対する全クチコミ=1文書,全製品=全文書
- DFの計算方法を変える
- 1製品に対する全クチコミ=1文書,カテゴリ内の全製品=全文書
- そのカテゴリの特徴的な単語が高い値を示すことがなくなる
- 例:前後で口紅っぽい単語が出なくなっているのが分かる
1 | グロス | 23.82461452 | フレッシュ | 18.1879308 |
2 | フレッシュ | 18.56255529 | PU | 12.99220002 |
3 | 唇 | 16.70947527 | キャラメル | 7.616921613 |
4 | PU | 16.14500462 | ^^; | 7.275172319 |
5 | ラメ | 15.55215699 | なつかしい | 7.275172319 |
6 | ピンク | 14.34543838 | お世話 | 6.464242103 |
7 | キャラメル | 14.3056912 | カネボウ | 6.464242103 |
8 | 口紅 | 13.99007802 | G | 5.888877958 |
9 | 単品 | 10.85334305 | 小さい | 4.780956497 |
10 | ベージュ | 10.76330921 | 鉄 | 4.33073334 |
- カテゴリ分類になってしまうのは避けられた
- 集合が小さすぎる
- →同じ特徴語を持つアイテムが少なかった