2022

Metaは11月22日(現地時間)、戦略ゲームディプロマシー」で「人間レベルのパフォーマンスを達成したAI」、「CICERO」(ローマの政治家キケロにちなむとみられる)を発表した。オンライン版ゲームで人間と対戦し、人間のプレイヤーの平均スコアの2倍以上を達成し、上位10%にランキングされたとしている。 https://www.itmedia.co.jp/news/articles/2211/23/news050.html

中身の仕組みは部分観測マルコフ決定過程みたいなもので、観測データをもとにポリシーの推測を更新していく