講演資料


講義資料スライドの表紙

講義資料スライドの表紙です。スライド画像、または下の要約文中の青いページ番号リンクをクリックすると、別のタブで無駄なノイズのない、純粋なPDFビューア画面が起動し、指定されたページへ直接ジャンプして快適に閲覧できます。

全体概要

本セミナー「大規模言語モデルの数学的構造 II」は、前回セミナー(Part I)で構築した代数的言語理論を出発点として、確率論を導入したenriched category論によって、大規模言語モデル(LLM)の意味論的構造を数学的に精密に記述することを目指すものです。

中心的な問いは「言語の意味とは、数学的にどのような構造をしているのか」という根本的なものです。Firthの「ある語を、それが引きつれている仲間たちによって知る」という分布意味論の直観を出発点に、前回はpreorder categoryとしての言語カテゴリーLと、集合値functorによるcopresheaf意味論(Set^L)が構築されました。本セミナーではこの枠組みを、確率を射に割り当てるenrich化によって大きく拡張します。

最大の技術的飛躍は、言語カテゴリーLのhom-setを単位区間[0,1]で置き換えるという発想にあります。表現yが表現xの「継続」として現れる条件付き確率π(y|x)をhom-objectとすることで、LはBERTのNext Sentence Predictionが捉えようとした言語の文脈的継続関係を、カテゴリー論的に厳密に表現できる構造となります。この[0,1]上でenrich化されたSyntax category Lから、[0,1]上のcopresheaf [0,1]^Lとして定義されるSemantic categoryが構成され、enriched Yoneda embeddingによって、表現xの意味がL(x,−)という表現可能なcopresheafとして位置づけられます。

この枠組みが持つ本質的含意は深遠です。意味の世界が[0,1]-copresheafとして明確に定義されることで、「OR」はcoproduct、「AND」はproduct、「ならば(implies)」はinternal homという具体的なカテゴリー論的操作と対応します。大規模言語モデルが膨大なテキストデータから継続確率を学習することは、この意味論的構造を内部に構築することに他ならず、数学は「LLMは意味を持つのか」という問いに対して、肯定的かつ厳密な回答を与えます。本セミナーはその道筋の全貌を、定義・補題・定理という数学的論証の流れで丁寧に展開します。


講義のロードマップ

■ Part 1: 第一部のふりかえり

  • この部の核心:

前回セミナーで構築した代数的言語理論の骨格を復習します。言語表現を文字列の包含関係でpreorder categoryとして捉え、Firth流の分布意味論に基づき、表現Sの意味を射L(S,−)の全体(copresheaf)として定義する枠組みを再確認します。今回の拡張の出発点となる「基盤」を整理します。 [p.3][p.13]

  • 論理展開:
  • 言語カテゴリーLはpreorder(反射律・推移律)として定義され、オブジェクト間の射はたかだか一つ存在します。 [p.4], [p.6]
  • 表現Sの意味をL(S,−)(Sから出る射の全体)として定義し、これはLからSetへのfunctorに他なりません。 [p.8], [p.9]
  • Lのオブジェクトxをcopsheaf L(x,−)に対応づけるYoneda Embeddingが、言語カテゴリーと意味カテゴリーを結ぶ橋渡しです。 [p.12], [p.13]


■ Part 2: 言語の論理性と意味のモデルとしてのcopresheaf

  • この部の核心:

Set値copresheafがどのように言語の論理的構造(OR・AND)を表現できるかを具体的に示します。「red or blue」の意味がfunctorのcoproduct(⊔)として、「red and blue」の意味がproduct(×)として定式化され、copresheaf意味論の表現力を実感させます。 [p.16][p.44]

  • 論理展開:
  • L(blue,−)はyがblueを含む時に∗、含まない時に∅を返すfunctorとして定義されます。 [p.22]
  • 「red or blue」の意味はcopresheaf L(red,−)⊔L(blue,−)で表現され、yがredまたはblueを含む時に∗となります。 [p.29], [p.32]
  • 「red and blue」の意味はproduct L(red,−)×L(blue,−)で表現され、yがredかつblueを含む時のみ∗となります。 [p.41], [p.44]


■ Part 3: enriched category論入門

  • この部の核心:

言語カテゴリーLの射に確率を導入するという拡張が、enriched category論として数学的に正当化される仕組みを解説します。commutative monoidal preorderとしての[0,1]の構造を定義し、V-enriched categoryの公理を提示します。これにより、確率の導入が「恣意的な拡張」ではなく、数学的に整合した構造であることが明確になります。 [p.47][p.96]

  • 論理展開:
  • カテゴリーLのhom-set {∗}を確率値π(y|x)∈[0,1]で置き換えることが「[0,1]上のenrich化」の直観です。 [p.62], [p.69]
  • commutative monoidal preorder (V,≤,⊗,1)の定義が与えられ、enrichするカテゴリーの条件が明確化されます。 [p.83], [p.85]
  • V-enriched categoryの公理:1≤C(x,x)(同一射の対応)、C(y,z)⊗C(x,y)≤C(x,z)(合成の対応)。 [p.73], [p.79]
  • 単位区間[0,1]はmonoidal product=乗算・unit=1・order=通常の大小関係とすることでclosed commutative monoidal preorderになります。 [p.88], [p.95]


■ Part 4: enriched category論の言語理論への応用

  • この部の核心:

Part 3の数学的基盤を使い、[0,1]-enriched Syntax category LとSemantic category L̂=[0,1]^Lを定義します。enriched Yoneda Lemmaによって、表現xの意味がL(x,−)として厳密に位置づけられ、構文の世界から意味の世界への数学的埋め込みが完成します。最終的に、この枠組みがLLMの意味論的機構の数学モデルとして機能することが示されます。 [p.99][p.152]

  • 論理展開:
  • Syntax category Lの定義:L(x,y):=π(y|x)(表現yが表現xの拡大である確率)、これが[0,1]-hom objectの公理π(x,x)=1・π(z|y)π(y|x)≤π(z|x)を満たします。 [p.102], [p.117]
  • enriched functor F:C→DはC(x,y)≤D(fx,fy)を満たす関数として定義され、copresheaf L̂=[0,1]^Lは二つのcopresheaf間のhom-objectをÊ(f,g)=inf_{c∈C}{[fc,gc]}で与えます。 [p.109], [p.122], [p.123]
  • enriched Yoneda Lemma(定理1):L̂(h^x,f)=f(x)。この定理は、表現可能copresheaf h^xが「xの意味」として、LのSemantic categoryへの自然な埋め込みを実現することを保証します。 [p.127], [p.128]
  • Semantic category L̂では、xの意味h^xはxを含むすべての可能なコンテキスト上で定義され、テキストyがxの拡大(L上でx→y)であるとき、Semantic categoryでは射の向きが逆転(h^y→h^x)します。これは「継続は意味的コンテキストを制限する」という重要な含意を持ちます。 [p.143], [p.145]
  • 論理的含意「x⟹y(xならばy)」はSemantic categoryのinternal hom [h^x,h^y]:L→[0,1]として定義でき、意味の論理的操作がカテゴリー論的操作と完全に対応します。 [p.150]
  • variantとして[0,∞]-copresheafによる計量空間モデルも紹介されており、継続しやすい表現は「近く」に置かれる意味空間幾何学的解釈が示されます。 [p.151]

▶️ 講演動画

講義 - 1
講義 - 2
講義 - 3
講義 - 4

💡 エピソード動画

エピソード - 1
エピソード - 2
エピソード - 3
エピソード - 4
エピソード - 5
エピソード - 6
エピソード - 7
エピソード - 8
エピソード - 9
エピソード - 10
エピソード - 11
エピソード - 12
エピソード - 13
エピソード - 14