• 恒等写像を学習する

    • 任意次元のone-hotベクトルは2次元空間にパーセプトロンが識別可能な形で埋め込めることがわかった
  • 離散的な状態はone-hotベクトルで表現できる

  • ということは、

  • 状態は2次元ベクトルだと考えられる

  • 昔関連することを考えていた: 状態のベクトル化

    • この時は直接的に構成しようと考えていた
    • なぜ状態ベクトル化したかったのか
    • 状態遷移を学習で獲得・改善させたかった
  • 状態遷移図の学習

    • これは与えられた状態遷移図から学習データを作って多層パーセプトロンで学習しようというアプローチ
    • 既存の硬いコードで書かれた状態遷移図をニューラルネットに移し替えたい
    • これはif文の条件節を2クラス分類に置き換えるのと同じコンセプト
  • 状態は通常リカレントする

    • このリカレントする部分を人間が観測可能にする必要がないなら、離散的な状態にする必要はない
    • ならば圧縮されたベクトルの状態で回して良い
    • image
  • 連続状態に対する強化学習も関係しそう