大きすぎるリンクの問題はScrapboxのページ数が増えると必然的に発生する問題
大きすぎるリンクを分割するアルゴリズムを考える
- キーワードの交差による絞り込み
- 実装は簡単
- 作られるリンク名称が機械的で無味乾燥
- 階層的クラスタリングによる大きすぎるリンクの分割
- 複数のグループに分割される
- それになんという名前をつけるかが微妙
- 周囲の単語を巻き込んでキーワードが成長する案
- 一番人間にとってわかりやすいリンク名称になる
大きすぎるリンクは完全グラフ
- この完全グラフを分割するアルゴリズムを考えるページ数が増えると、必然的に発生する問題
その時何を指標に最適化を行うか
- 距離の増加を最小化することではない
- なぜなら距離の短さを良いとするならばすべてのページに同じタグをつけてすべて距離1の完全グラフにするのが最適だからである
- 近くあるべきものが近く、遠くであるべきものが遠くになるように分割をする必要がある