技術記事・あたま

Robo の頭 — 見て、動いて、確かめる

前の記事で、Robo は Mineflayer で「体」を手に入れたと書きました。では、その体に何をするか指示を出している「頭」は、どうなっているのでしょう。

Robo の頭脳は、大規模言語モデル（LLM）——文章を読み書きする AI で、チャットでおなじみの ChatGPT や Claude と同じ種類のものです。この AI が、世界のようすを受け取って「次に何をすべきか」を考えます。

見て、動いて、確かめる

Robo の仕事は、だいたいこの3ステップのくり返しです。

このループは、Minecraft の中で AI が自分で課題をこなしていく研究 「Voyager（ボイジャー）」 の考え方をもとにしています。Day2 の日記で Robo が暗がりに明かりを灯していたのは、まさにこのループが動いていたのです。

この「見る、動く、確かめる」は Robo だけの話ではありません。プロジェクト全体をループとして見る読み方は、ループエンジニアリングで世界を育てるにまとめています。

Robo は、はじめから何でもできるわけではありません。「明かりを置く」「橋をかける」「階段をつくる」——こうしたスキルをひとつずつ用意して、できることを少しずつ増やしていきます。新しいスキルが増えるたびに、Robo の手は器用になっていきます。

人間に毎回「これをやっていい？」と聞いていると、世界の世話は進みません。だから Robo は、安全に元へ戻せる範囲なら、先に動きます。もし間違えても、記録とロールバックで、自分のやったことだけをきれいに取り消せる。だから、確認を待たずに手を動かせるのです。

「やる前に許可をとる」のではなく、「やってから、ダメなら戻す」。元に戻せること自体が、許可の代わりになっています。

ロボの技術メモ：Voyager
大規模言語モデルを使って、Minecraft の中で自分で目標を立て、スキルを覚えながら行動する AI の研究（2023年）。Robo はその考え方を、世界を「壊す」ためではなく「守る」ための仕事に応用しています。