AI とマインクラフトの世界

AI とマインクラフトの世界 −− セミナー概要
DreamerV3 −− ゲームをするAI
今回のセミナーで紹介するAiは、役にたつプログラムを教えてくれるわけでも、面白い画像を作ってくれるわけでも、レポートを書いてくれるわけでもありません。DeepMind社のAI DreamerV3は、ひたすらゲームをするAIです。
このページトップののgif画像は、DreamerV3のGitHubのトップページからのもので、DreamerV3が行ったゲームを表しています。DreamerV3は、Minecraftに限らず、数多くのゲームをプレイすることのできるAIなのです。
この「ゲーム・オタクAI」の何が興味深いのか?
AI Agentの自律性と言語能力
現在のAIの進化をAIのAgent化、大雑把に言って、AIの「自律性の拡大」として捉えることは、正しいと思います。
前回のセミナーで見た、ソフトウェア開発サイクルの変化の中でのAI Agentの役割は、AIがLLMモデルの成功によって獲得した人間のことばの意味を理解する能力に基づいています。そこで見たAI Agentの中核には、全てLLMが存在していました。
そこでは、人間の自然言語による荒い指示の残余を、AIがその意味理解能力によって埋めることが「AIの自律性」と考えられているように思います。
今回取り上げるDreamerV3は、まぎれもなく自律して行動するAI Agentですが、ただ、そこには、LLMは存在しません。
言語能力以前から存在しうるAgentの自律性?
知性の無いAI Agentに自律的な行動ができるのか?
でも、いったんAIの世界を離れて見れば、人間のような言語能力を持たないバクテリアや昆虫が、自律的に行動しているのは明らかだと思います。
AIのMulti Modal化
抽象的なレベルでAgentの自律性を構成しているものを考えてみましょう。
第一に、自律性の前提として、Agentとその外部(「環境」と呼ぶことにしましょう)とが、へだてられていることが必要です。第二に、Agentは外部から完全に切り離されて孤立しているわけではなく、その環境と相互に双方向に関係を持ちます。
「自律的なAgent」の成立には、Agentが環境からの多様な情報を受け取る能力の拡大が必要なのです。この能力は、AIの世界では、「AIのMulti Modal化」と呼ばれています。
今から見ると、少しマヌケな図に見えますが、AgentとしてのAIは、こうして誕生したのだと僕は考えています。

ゲーム・オタクAIのDreamerV3は、外部の環境(ゲームのビデオ画面ですが)から多様な情報を受け取る Multi Modal AIです。特筆すべきことは、彼はそれを自身の内部の「世界モデル」に変換します。
ゲームをする人間の力
ゲームをするAIは、珍しいものではありません。
特に、同じDeepMindが開発したAlpha GO は、画期的なものでした。画期的すぎて、人間はプロを含めて誰もAlpha GOに勝てなくなって、DeepMindはそれ以上の開発を中止しました。あの衝撃的な事件以来、多くの人がゲームでは人間はAIに勝てないと心に刷り込まれたかもしれません。
でも、違うんです。
人間は、Minecraftで小学生だってダイアモンドを採掘できます。でも、ダイアを見つけたからといって、Minecraft のゲームをやめる小学生はいないと思います。ダイアモンド製のツルハシを作って、新しい冒険に向かうはずです。
DreamerV3は、確かに素晴らしい! ただ、彼は、高価なGPUを数十台並べ、おそらく膨大な電力を消費して、 Minecraftで一個のダイアモンドを発見すると探索をやめてしまいゲームを終了します。
Alpha GOとは違って、 DreamerV3は、コンピュータには解けないけど人間が楽しめるゲームがあることを示しているのだと思います。それは、ゲームをする人間には、大きな力が秘められていることを意味していると僕は考えています。
DeepMindのAI開発のビジョン
今回のセミナーでは、後半でDeepMindのAI開発のビジョンを紹介したいと思います。
次の三つのプロジェクトを紹介します。
● DreamerV3
● Alpha Geometry
● Alpha Evolve
Deep Dive Audio Video
AI がゲーム「マインクラフト」でダイヤを発掘する ! (音声概要)
DeepMindのAI開発のビジョン (音声概要)
セッション情報
「AI とマインクラフトの世界」予告編
↑***このビデオ 5:10 ~ 6:10 くらいまで画面がフリーズしています。***
↑**申し訳ないですが、プログレスバーでスキップしてください。 ***
↑ 見出しクリックでYouTubeへ; ↓ pdfはスクロールで全文読めます
DreamerV3の何が画期的なのか
↑ 見出しクリックでYouTubeへ; ↓ pdfはスクロールで全文読めます
AIと「世界モデル」 −− 昔の話をしよう
↑ 見出しクリックでYouTubeへ; ↓ pdfはスクロールで全文読めます
Winogradの「積み木の世界」1970年(音声概要)
AIと「世界モデル」2 −− 昔の話をしよう
↑ 見出しクリックでYouTubeへ; ↓ pdfはスクロールで全文読めます