-
潜在意味解析: Latent Semantic Analysis, LSA
-
潜在的意味索引または潜在意味インデックス: Latent Semantic Indexing, LSI
-
各行が各単語、各列が各文書の疎行列
- 各成分の重み付けに tf-idf を使う
- この行列を特異値分解する
- k個の最大特異値を選べばk次元への最小誤差での埋め込みができる
- 文書IDから単語tf-idfベクトルを得る関数を、隠れ層がk個・1層のAutoencoder的ネットワークで学習するのに相当する
潜在意味解析: Latent Semantic Analysis, LSA
潜在的意味索引または潜在意味インデックス: Latent Semantic Indexing, LSI
各行が各単語、各列が各文書の疎行列