🪴 Quartz 4.0

Search

❯

DF

Dec 01, 2023, 1 min read

Document Frequency

ドキュメントの粒度によって影響を受ける

極端な例として、一単語一ドキュメントとすれば、TFに一致する
「1回以上出現するなら1」とすることが多い
- 出現集中では「2回以上出現するなら〜」の値も使う
- つまりステップ関数を掛けてる
- 閾値に回数を使っているが、これは当然ドキュメントに含まれる単語数が増えるほど大きくなりやすい値
  - 単語数で割って出現確率にする方が良いのでは…

Graph View

Backlinks

DFが多すぎるキーワード
RAKEのストップリスト生成
キーフレーズ抽出2020-08
ページ単位DF
未踏テキスト情報中のキーワードの抽出システム開発
長さをパラメータにしたDF

Created with Quartz v4.1.1, © 2023

GitHub
Discord Community