• RAKEによるキーフレーズ抽出と、短文抽出は関連するのではないか

  • キーフレーズ抽出は2つのフェーズに分けられる

    • キーフレーズ候補の作成
    • キーフレーズ候補のスコア付け
  • スコア付けには出現集中が使えるのではないか

  • RAKEをCRFと比較した場合、「2回以上出現する」という特徴量が単純なCRFと違う大域的な特徴になっている

  • キーフレーズ候補の集合サイズ順

    • 人力明示的集合
    • 名詞句
    • ストップワード刻み
    • RAKE的結合
    • 部分文字列
  • キーフレーズ候補の長さ順

    • 文字
    • 単語
    • ストップワード刻み
    • RAKE的結合
    • 句読点刻み
    • 短文