大規模言語モデルの数学的構造 II

「大規模言語モデルの数学的構造」第二部へのお誘い

申込はこちら:https://llm-math2.peatix.com/

先月のセミナー、「大規模言語モデルの数学的構造 I -- 言語へのカテゴリー論的アプローチ入門 」に、多くの人に(「当社比」ですが)関心を持っていただいて、ありがとうございました。

この連続セミナーは、基本的には、Tai-Danae Bradleyらの論文 "An enriched category theory of language: from syntax to semantics" の紹介を目指したものです。先月のセミナーの第一部は、この論文の基本的特徴である言語理論へのカテゴリー論アプローチの基礎を解説したものです。

今月、セミナーの第二部を「大規模言語モデルの数学的構造 II -- enriched categoryによる言語モデル」というタイトルで開催します。

ここで、第一部では取り上げていなかった、先の論文の主題である、enriched category を用いたsyntaxからsemanticsにいたる言語理論の紹介をしようと思います。第二部から、いよいよ、連続セミナーの本題に入ることになります。

あらためて、多くの人のセミナー第二部への参加をお願いしたいと思います。

第一部のふりかえり

ここでは、第一部で見てきたことをふりかえります。

言語のカテゴリー Lを、preorder category として捉える

言語を構成する意味を持つ文字列である、語・フレーズ・文・文の連続 … を「表現」とします。任意の表現 S, Tについて、表現Sの文字列が表現Tの部分文字列であるとき、S ≦ Tと順序を定義します。

この順序は、次の性質が確かめられますので preorder(前順序)です。
 1. S ≦ S (反射律)
 2. S ≦ T かつ T ≦ U なら、S ≦ U (推移律)

この時、言語の表現をオブジェクトとし、表現間の順序 S ≦ T を S → T という射(モルフィズム)を定義すると考えると、言語は、preorder category として捉えることができることがわかります。

ここでは、次のことに注意しましょう。
 ・この言語のカテゴリー L では、二つの異なるオブジェクト間の射は、
  ただ一つ存在するか、あるいは、全く存在しないかのいずれかです。
 ・この言語のカテゴリー L は、ある言語が文字表現を持つ限り、
  日本語、英語、… といった違いを超えた言語の特徴を表現しています。

表現 Sの「意味」を、カテゴリー L 内の S → T なる射全体の集合と考える

Firth は、次のような言葉を残しています。
「我々は、ある語を、それが引きつれている仲間たちによって知ることになる。」

こうした意味の理解をベースにして、ある表現Sの意味を、それが「引きつれている仲間たち」の全体の集合で考えることにします。Sの「仲間たち」とは、S → T なる射が存在する表現Tのことです。

それらの全体を考えるということは、S → T なる射全体の集合を考えるということと同じことです。

意味のカテゴリーは、copresheaf \( Set^L\) で表現される

カテゴリー L 内の S → T なる射を、L(S, T) と表します。また、L(S, − ) で、Sの意味を表現している、Sのすべての「仲間たち」への「射全体の集合」を表すことにしましょう。

SがLのオブジェクトである時、それに対応する意味のカテゴリーを構成しているオブジェクトは、射全体の集合L(S, − )だと考えることができます。この対応は、カテゴリーL から集合のカテゴリーSetへのfunctorを考えることに他なりません。

カテゴリー論では、カテゴリーCから集合のカテゴリーSetに値を持つfunctorで構成されるカテゴリーを、\( Set^C\)で表し、C上のcopresheaf と呼びます。

意味のカテゴリーは、言語のカテゴリー L から、集合のカテゴリー Setに値を持つ、functor で構成される L上のcopresheaf \( Set^L\)で表現されることになります。

言語のカテゴリーと意味のカテゴリーの対応は、Yoneda Embeddingで与えられる

言語のカテゴリー Lと意味のカテゴリー \( Set^L\)の対応は、LのオブジェクトSに、\(Set^L\)のオブジェクトL(S, − )を対応付けるものです。

こうした対応づけをYoneda Embeddingと呼びます。

( スライドのpdf blog )

言語の論理性と意味のモデルとしてのcopresheaf

意味のカテゴリー copresheaf について

( スライドのpdf  blog:「Semantics 1.0 から Semantics 2.0へ」 )

“red or blue” の意味を考える

( スライドのpdf  blog:「“red or blue” の意味を考える」 )

“red and blue” の意味を考える

( スライドのpdf  blog:「AND と OR、product と coproduct は dual である」 )

enriched category論 入門

言語のカテゴリーに確率を導入する

( スライドのpdf  blog:「第一部のふりかえりと第二部の課題」 )

enriched category とは何か ?

( スライドのpdf  blog:「簡単な例からenriched categoryのイメージを持つ」 )

enrich以前のカテゴリーとenrich化されたカテゴリーを比較する

( スライドのpdf  blog:「enrichするカテゴリーの働きを考える」 )

commutative monoidal preorder

( スライドのpdf  blog:「少し困ったこと」 )

closed commutative monoidal preorder とinternal hom

( スライドのpdf  blog:「すごいのかすごくないのか?」 )

enriched category 論の言語理論への応用

Syntax category

( スライドのpdf  blog:「 この投稿はわかりやすいかも知れない 」 )

enriched functor とenriched copresheaf

( スライドのpdf  blog:「 functor category をenrich化する 」 )

copresheaf \( [0,1]^L \) とenriched Yoneda lemma

( スライドのpdf  blog:「 言語理論へのenrich化されたカテゴリー理論導入の意味 」 )

Semantic category

( スライドのpdf  blog:「 enrich化されたcopresheaf として意味をとらえる 」 )

copresheaf-意味論の射程

( スライドのpdf  blog:「 こんな理論が何の役に立つのか? 」 )