• 文章をBERTでベクトルに変換する

  • ベクトルの各要素について正であるか負であるかで1bitの情報にする

  • なるべく半々に分かれる順に要素を選んでいく

  • kMeansでやる手もある #k平均法

    • 代表点の位置を取っておく必要がある
  • 面倒なのでとりあえず先頭12次元で試す