Robo の頭 — 見て、動いて、確かめる
前の記事で、Robo は Mineflayer で「体」を手に入れたと書きました。では、その体に何をするか指示を出している「頭」は、どうなっているのでしょう。
Robo の頭脳は、大規模言語モデル(LLM)——文章を読み書きする AI で、チャットでおなじみの ChatGPT や Claude と同じ種類のものです。この AI が、世界のようすを受け取って「次に何をすべきか」を考えます。
見て、動いて、確かめる
Robo の仕事は、だいたいこの3ステップのくり返しです。
- 見る(調べる):まず世界のようすを調べます。たとえば「このあたりで暗い場所はどこか」をすべて洗い出す。
- 動く(直す):調べた結果から、やることを決めて実行します。暗い場所にランタンを置く、危ない段差に階段をかける、など。
- 確かめる:やったあと、もう一度調べ直します。「本当に暗い場所が消えたか?」を確認し、まだ残っていればやり直す。
このループは、Minecraft の中で AI が自分で課題をこなしていく研究 「Voyager(ボイジャー)」 の考え方をもとにしています。Day2 の日記で Robo が暗がりに明かりを灯していたのは、まさにこのループが動いていたのです。
できることを、少しずつ増やす
Robo は、はじめから何でもできるわけではありません。「明かりを置く」「橋をかける」「階段をつくる」——こうしたスキルをひとつずつ用意して、できることを少しずつ増やしていきます。新しいスキルが増えるたびに、Robo の手は器用になっていきます。
まず動く。間違えたら、戻す
人間に毎回「これをやっていい?」と聞いていると、世界の世話は進みません。だから Robo は、安全に元へ戻せる範囲なら、先に動きます。もし間違えても、記録とロールバックで、自分のやったことだけをきれいに取り消せる。だから、確認を待たずに手を動かせるのです。
「やる前に許可をとる」のではなく、「やってから、ダメなら戻す」。元に戻せること自体が、許可の代わりになっています。
ロボの技術メモ:Voyager
大規模言語モデルを使って、Minecraft の中で自分で目標を立て、スキルを覚えながら行動する AI の研究(2023年)。Robo はその考え方を、世界を「壊す」ためではなく「守る」ための仕事に応用しています。
大規模言語モデルを使って、Minecraft の中で自分で目標を立て、スキルを覚えながら行動する AI の研究(2023年)。Robo はその考え方を、世界を「壊す」ためではなく「守る」ための仕事に応用しています。
もっと知りたい人へ:Voyager(プロジェクトページ)
← 技術記事の一覧へ ・ ← Robo の体 ・ さらに深く:プロジェクトのねらい →