cloud9_note

cloud9に限らないメモ

View on GitHub

形態素解析

概要

特徴量辞書、ベクトル化、コサイン類似度

特徴量辞書

例)

猫 猫:1.0,ねこ:,1.0,ヌコ:0.5

形態素解析に「ねこ」と「ヌコ」が一つずつあったら、主特徴語「猫」のスコアは1.5。

ベクトル化

特徴語辞書を使っている場合、何行目のスコアがいくつになったかを表す。

コサイン類似度

ベクトルaとベクトルbの内積 /(ベクトルaのノルム×ベクトルbのノルム)

内積

ベクトルaとベクトルbの同じ行のスコアをかけて合計した値。

ノルム

自分自身との内積の平方根。