2007-09-12から1日間の記事一覧

NaNとはなんぞや

cosine類似度計算中にたまに出てくるNaN。 NaN(Not a Number、非数、ナン) コンピュータにおいて、主に浮動小数点演算の結果として、不正なオペランドを与えられたために生じた結果を表す値またはシンボルである。http://ja.wikipedia.org/wiki/NaNcf)非正規…

検索条件を付けてファイルを検索

find 条件を指定することによって、ファイルやディレクトリを検索する。演算子で結ぶことによって複数の検索条件を使用できる。検索条件がなければ、すべてのファイル・ディレクトリを表示する。http://www.k-tanaka.net/unix/find.html 150分以内に修正され…

擬態語に注目しよう

そもそも品詞解析してみたら面白かったので、profileとかにかかわらずクチコミの文章だけで製品同士の関係が導ければ何か今までと違ったものが見えてくるんじゃないかと思って、品詞解析→類似度→グラフ化してみようと思ったのでした。 それなら、ただ馬鹿正…

クチコミサイトの急増

私の所属している研究室で扱っている分野はWebマイニングです。要は、Web上に大量のデータがあるからそれを何とか解析したら面白いことがわかるんじゃね?という研究です。 そして私はといえば、ここ半年クチコミ情報と格闘しています。未だに先が見えません…