講演資料
講義資料スライドの表紙です。上のスライド画像をクリックすると、同じ画面のまま全編のPDF資料を快適に閲覧・印刷することができます。
セミナーの概要
本セミナー「AIとグラフ――GPT4oと遊ぶ」は、現代の生成AI技術が持つ能力の非対称性、すなわち「言語・画像の生成は得意でも、グラフという数学的対象の生成には根本的に失敗する」という事実を出発点として、そこに潜む深い問いを探求する内容です。[p.1, p.6] GPT-4oのDALL·Eを用いた詩からの画像生成は驚くほど高品質であり、また画像として与えられたグラフの隣接行列を導出するといったグラフ認識タスクでも相当の能力を示します。しかしながら、隣接行列を指定してそれに対応するグラフ画像を正確に生成させようとすると、何度フィードバックを与えて修正を試みても失敗を繰り返します。これは単なる実装上のバグではなく、現在の大規模言語モデルを基盤とする生成AIが、人間の持つ「数学的認識能力」を本質的にまだ取り込めていないことの表れだとセミナー発表者は主張します。[p.6, p.7, p.83, p.84] この問題を深掘りするため、セミナーはAIの世界をいったん離れ、複雑性理論の観点からグラフの認識・同型性判定がいかに本質的に困難な問題であるかを論じます。グラフの同型性問題(Graph Isomorphism)はNPに属することは明らかですが、PかNP完全かは依然未解決であり、Interactive Proofのアプローチを通じてその複雑さが鮮明に浮かび上がります。さらに興味深いことに、Interactive Proofは「証明者(Prover)」と「検証者(Verifier)」という二人のAgentによる対話として証明を再構成するという「証明観の転換」をもたらしており、これがAIのAgent Modelへの議論へと自然につながっていきます。[p.100, p.102, p.148, p.163] 後半ではAIにおけるAgent Modelの台頭を実際の研究事例(RAG、ATM、AgentGym)で示しつつ、最終的にはグラフをカテゴリー論的に「C-Set(Functor)」として捉えるAlgebraicJuliaのCatlabライブラリーや、Tai-Danaeの大規模言語モデルへのco-presheaf意味論導入の仕事が、言語理解と数学的対象の理解を深い数学的基盤で統一する可能性を示唆するという展望で締めくくられます。[p.247, p.248, p.250, p.251]
講義のロードマップ
ここでは、セミナーの講演資料がどのようなパートから構成されているかを示します。また、それぞれのパートのポイントを紹介します。
■ Part 1: 画像とグラフの違いを考える
GPT-4oはDALL·Eを通じた詩・テキストからの画像生成では卓越した能力を見せる一方、グラフの画像生成では根本的に失敗します。グラフの認識(隣接行列の導出)は成功するのに、生成は失敗するという「知覚と生成の非対称性」がこのPartの中心テーマです。この非対称性は、グラフという数学的対象がembeddingによる近似表現になじまない性格を持つことと深く関係しており、言語的認識と数学的認識の本質的な違いを示唆します。[p.6, p.83, p.84, p.85]
■ Part 2: グラフの認識の難しさ
グラフの同型性(Graph Isomorphism)という問題を複雑性理論の観点から検討し、AIがグラフを扱えないことが偶発的バグではなく数学的に本質的な困難であることを論じます。さらにInteractive Proofというフレームワークを通じて、「証明者」と「検証者」というAgent的存在の対話として数学的証明を再定義するという証明観の転換を提示し、確率的証明論の扉を開きます。[p.102, p.103]
■ Part 3: AIのAgent-Based Model
現在のAI技術の弱点(数学的能力の欠如・外部実在への無関心)を補う方向として、Agent Modelへの注目が高まっていることを実例で示します。フォン・ノイマンの自己複製機械を歴史的出発点に置き、RAG・ATM・AgentGymという三つの具体的研究を通じて、外部環境と相互作用しながら自己進化するLLMベースAgentの設計原理を解説します。[p.167, p.172]
ページのナビゲート