2022
米Metaは11月22日(現地時間)、戦略ゲーム「ディプロマシー」で「人間レベルのパフォーマンスを達成したAI」、「CICERO」(ローマの政治家キケロにちなむとみられる)を発表した。オンライン版ゲームで人間と対戦し、人間のプレイヤーの平均スコアの2倍以上を達成し、上位10%にランキングされたとしている。 https://www.itmedia.co.jp/news/articles/2211/23/news050.html
中身の仕組みは部分観測マルコフ決定過程みたいなもので、観測データをもとにポリシーの推測を更新していく