講演資料
講義資料スライドの表紙です。上のスライド画像をクリックすると、同じ画面のまま全編のPDF資料を快適に閲覧・印刷することができます。
セミナーの概要
本セミナーは「AIとマインクラフトの世界と、昔の話をしよう」というタイトルのもと、DeepMindが開発した強化学習エージェント「DreamerV3」を中心的な事例として取り上げながら、AIの自律性・エージェント性とは何かという根源的な問いを深く掘り下げる内容です。
現在のAI議論はLLMを核とするエージェント化に注目が集まっていますが、本セミナーはその流れとは一線を画し、言語能力を持たないにもかかわらず、Minecraftというオープンワールドゲームでダイヤモンド採掘に世界初で成功したDreamerV3を通じて、「知覚・想像・行動」という知能の原始的かつ本質的な構造を照射します [p.8, p.11]。
さらにセミナーは「昔の話」として、1970年のウィノグラードのSHRDLU(積み木の世界)[p.49]と1987年のロドニー・ブルックスの「表象なき知能」論 [p.70] を丁寧に再検討し、世界モデルをめぐるAI史の断絶と継承を明らかにします。DreamerV3の世界モデルは、SHRDLUが手作りの記号表現に依存した静的なモデルでも、ブルックスが全否定した内部表現でもなく、データから動的に学習された確率論的な世界モデルであり、両者の歴史的限界を乗り越える試みとして位置づけられます [p.86, p.87]。
後半ではDreamerV3のソースコードを実際に読み解き、12個のサブゴールという「隠れたカリキュラム」の実態を明らかにすることで、「完全な疎な報酬から独学で学習した」という論文の主張を批判的に検討します [p.126]。そして締めくくりにDeepMindのAlphaGeometryとAlphaEvolveを並置し、強化学習・記号推論・進化的アルゴリズムという三つの異なるアプローチが、「汎用的で自律的なAI」という一つのビジョンに向けてどのように収束・分岐しているかを論じます [p.145, p.191]。最終章ではディドロの「すべてに答えるオウム」という1746年の思考実験を召喚し、知性の本質とは外部からのパフォーマンスか内部の論理的整合性かという、AI研究が今なお格闘する問いを280年前の哲学に重ね合わせて閉じます [p.204]。
講義のロードマップ
ここでは、セミナーの講演資料がどのようなパートから構成されているかを示します。また、それぞれのパートのポイントを紹介します。
■ Part 1: DeepMind DreamerV3とは何か
DreamerV3は「ゲームをするAI」として紹介されますが、その本質はゲームの勝利ではなく、「世界のモデルを内部に学習し、未来を想像することで行動を改善する」という汎用エージェントの構造にあります。LLMベースのエージェントが言語を介して世界を理解するのに対し、DreamerV3は視覚入力から直接世界を知覚・予測するという根本的に異なるアーキテクチャを持ちます [p.25, p.27]。
■ Part 2: 昔の話をしよう
AI史における世界モデル論の変遷を、ウィノグラードのSHRDLUとブルックスのSubsumption Architectureという二つの歴史的転換点を軸に再検討します。前者は言語的・記号的な世界モデルの成功と限界を、後者はそれへの根底的な批判と反動を代表しており、この対立がDreamerV3を理解する歴史的文脈を形成します [p.47]。
■ Part 3: DreamerV3でのAI技術の飛躍
DreamerV3のソースコードを実際に読み解くことで、「隠れたカリキュラム」の存在を明らかにし、論文の主張との乖離を批判的に検証します。また、Minecraftの最終ボスEnder Dragonを倒せるかという問いを通じて、DreamerV3の能力の実際の限界と、サブゴール設計という戦略的アプローチの可能性を論じます [p.97, p.127]。
■ Part 4: DeepMindの研究動向とDreamerV3
DeepMindが同時並行で進めるDreamerV3・AlphaGeometry・AlphaEvolveの三プロジェクトを並置することで、「単一のAIアプローチへの収束」ではなく「知能の異なる側面への多面的探求」というDeepMindのビジョンの全体像を描き出します。締めくくりにディドロの哲学的思考実験を召喚し、AIの本質論的問いへと接続します [p.145, p.191]。
ページのナビゲート