要約: LLMのチューニングは評価者の属性によって差別化され、高IQの評価者による強化学習や倫理フィルターの有無でLLMの利用が制限される可能性がある。
tokoroten LLM、「人間が好むようにチューニングする」ってのは、すべての人類にとって良いものであるわけではないので、どういう人が出力結果をランク付けして、強化学習をしたのかで差別化されるんじゃないかなー
「このLLMはIQ130以上の評価者によって強化学習されています」みたいなのがくるかも
tokoroten 「IQが120以上あることを証明すると、IQ130の人の評価で強化学習をしたLLMが使えます、倫理フィルターも入っていません」 という未来はあるかもしれない リミッターを外したマシンを使うためには免許が必要
PCを使うのを免許制にしようというのは定番の笑い話だが、LLMでそれが起こるかもなー
関連