Skip-Gramは要するにAutoEncoderの入力が同じ単語ではなく周囲の単語になったもの

  • 単語1-of-Kベクトルを入力とする場合は同一の単語を入力にしてもあんまり次元圧縮のしようがないからね
  • 仮に無理やりやったらどうなるだろう。出現頻度の高い順に選んだ中間層になるかな。