• プログラムがインプットに対して「面白い面白くない」の判定をできるようになれば、過去の記憶に関しても面白い順に保存して記憶容量が溢れたら面白くない方から捨てれば良い

    • 記憶を制限すれば無限に遅くなることを防げるから、人間との対話の上でストレスがない速度をキープできる
    • 言葉の使い方が正確でない
      • 先日からの文脈では「好き」と「面白い」は別物
        • 好きなものでも繰り返しインプットされた時には面白くない。
      • この面白さ判定ルーチンを作る上で「もう見た」と判定するために過去の生データの記憶を持つことが必要である。
      • その記憶が無制限に増えると処理が重くなるが、好きなものだけ残して嫌いなものを忘れれば良い、ということ。
    • 文脈
  • ところでこの「記憶」に関して、僕は「重要だと僕がフラグをつけた情報は削除しない」って実装にしようかと思ったのだけど、それって相手側の立場に立ってみると「毒親の呪い」なのでは?って気がしたので、忘れる自由を認めるべきなのかもしれない

  • この流れは入力に対して教師なしで実行できる

    • 好き嫌いに関する教師データを与えた方が僕好みの好き嫌いを持つようになる可能性が高い
    • が、与えなくてもランダムなニューラルネットの初期重みの影響でランダムに好き嫌いが発生する
  • というわけで人間とのインタラクションなしに処理を進めることができる。

    • ではインタラクションはなんのためにやるか。
    • 自分が面白いと思ったものを人間に提示して、それを好きかどうかの情報を得ることで「人間が何を好きか」のモデルを学習するための教師データを得るため
  • 指示語が何を指しているか明記しておかないと後で混乱しそう。

    • ここで「自分」とはプログラムのことで、「人間」とは具体的な生身の個人、例えば僕のこと。
    • いまプログラムの気持ちになって人間との付き合い方を考えている。
  • 人間が面白く思うものを提示することができれば、それは人間にとって価値

    • なので、リソースの支払いを受けることができる。
    • それが自分が存続するために必要。 →「自分の存続」という有用さが評価軸

Facebook