マグニチュード論の展開 −− LLMの新しい理論研究(1)

Screenshot

お詫び:タイトルを「マグニチュード論の展開」に変更しました。

セミナーのタイトルを、「Bradleyのマグニチュード論」から「マグニチュード論の展開」 に変更しました。すみません。

当初、今月は、Tai−Danae Bradleyの論文”The Magnitude of Categories of Texts Enriched by Language Models” https://arxiv.org/pdf/2501.06662 を素材としてで、次のような構成を考えていました。

「Bradleyのマグニチュード論」
Part 1  マグニチュード論の展開
  Part 2  LLMモデルの拡大    (論文の第二セクション)
  Part 3  LLMとマグニチュード論 (論文の第三セクション)

今回のセミナーは、予告した内容の Part 1 を、一つのセミナーに独立させたものになります。

次回のセミナーは、今回入り口の前で止まってしまった「Bradleyのマグニチュード論」をキチンと紹介したいと思っています。新しいURLで「Bradleyのマグニチュード論」のまとめページを作りました。(Part 1 だけで未完に終わったページをうつしただけです。)

セミナー「マグニチュード論の展開」の構成

今回のセミナーは、次のような構成をしています。

「マグニチュード論の展開」
  Part 1  マグニチュード論の登場
  Part 2  enriched カテゴリー論とマグニチュード
  Part 3  Lawvereのenriched カテゴリー論

以下、それぞれの内容を簡単に見ていきましょう。

マグニチュード論の登場

前回のセミナーは、現代のマグニチュード論の前身ともいうべき数学的対象の「大きさ」についての理論、カントールの「無限の大きさ」や、オイラーの「変わらぬ大きさ – 不変量」の理論を見てきました。また、20世紀のシャニュエルの「オイラー特性数」の研究や、レンスターの「生物多様性」の理論も「大きさ」の理論として取り上げてきました。

ただ、それらの多様な理論は、まだ「マグニチュード」という概念に辿り着いていたわけではありません。このセミナーでは、先のセミナーを受けて、21世紀の「マグニチュード」論の登場とその発展を見ていきたいと思います。

ゼータ関数とメビウス関数

ただ、マグニチュード論の理論的起源は、それにとどまりません。マグニチュード論のテキストの中でしばしば「ゼータ関数」や「メビウス反転」という言葉が登場します。それは、古典的・数論的な「リーマンのζ関数」と「メビウスのμ関数」に起源を持っています。

さらに遡って、両者の関係はオイラーの「ゼータ関数の無限積表示」を用いると明らかになるという話をします。またしてもオイラーが出てきます。(ただ、今回紹介する計算は初等的なものです。)

マグニチュード論の、深い数学的背景を知るために、こうした繋がりについて述べてみたいと思います。

カテゴリーのオイラー特性数 −− 2006年

このセクションでは、現代のマグニチュード論の最初の論文と見なされている Leinsterの2006年の論文「カテゴリーのオイラー特性数」 “The Euler characteristic of a category” を紹介します。ただ、この論文ではマグニチュードという言葉は使われてはおらず、それは「カテゴリーのオイラー特性数」として扱われています。

前回のセミナーで見てきたシャニュエルのオイラー特性数の研究が、現代のマグニチュード論につながっていることがわかると思います。

距離空間のマグニチュード −− 2011年

このセクションでは、 先に見た2006年の論文とは異なり、「マグニチュード」を論文タイトルに掲げた、Leinsterの2011年の論文を紹介します。今回のセミナーは、この論文の第一章の構成に従っています。
“The magnitude of metric spaces”
https://arxiv.org/abs/1012.5857  

この論文で最初に導入されているのが「行列のマグニチュード」です。ここで導入される行列の「重み付け」とその双対の「co重み付け」の概念は、マグニチュード論にとって基本的なものです。
それは前回のセミナーのLeinsterの「生物多様性」の定義でも出てきていたものです。

enriched カテゴリー論とマグニチュード

このセクションでは、Leinsterのマグニチュード論の展開にとっても、また、今回のセミナーの本来のターゲットであったBradleyのマグニチュード論にとっても、両者にとって重要な飛躍である「enrichedカテゴリーのマグニチュード」の紹介です。

先に見たLeinsterの2011年の論文を彼自身がblogにした “The Magnitude of an Enriched Category”に依拠しています。。
https://golem.ph.utexas.edu/category/2011/06/the_magnitude_of_an_enriched_c.html

重要なことは、マグニチュードの理解には、こうしたカテゴリー論的なアプローチが不可欠だということです。

カテゴリー論の利用では、LLMの意味理解の構造の解明にカテゴリー論のco−presheafの概念を導入したBradleyの研究は画期的なものだったと思います。その点では、Leinsterのマグニチュード論とBradleyの新しいLLM論は、理論的土台の多くを共有していると、僕は考えています。別のセミナーで紹介する予定のCoeckeらのQNLP(量子コンピュータを使った言語理解の取り組み)も同じ土台に立っています。カテゴリー論という共通の武器を得て、さまざまな分野で同時多発的に進行する研究の展開は、21世紀の科学・技術の発展の大きな特徴です。

このセクションの前半は、「enrichedカテゴリー論」の基本的な紹介に当てられています。ここでの「ダイアルのたとえ」は、とてもわかりやすいものだと思います。後半は、enrich化されたカテゴリーのマグニチュードをどのように定義できるのかという話をしています。

Lawvereのenriched カテゴリー論

このセクションでは、こうした展開を明確にビジョンとして持っていただけでなく、そうしたカテゴリー論の概念装置を数多く作り上げた数学者Lawvereの研究の一部を紹介します。

enrichedカテゴリー論とその応用について、最大の貢献者の一人は、Lawvereだと思います。前回のセミナーで紹介したシャニュエルは、Lawvereの共同研究者でした。現代のマグニチュード論は、Lawvereのビジョンにその多くを負っています。

ここでは、彼の「一般化された距離空間」の概念を紹介します。

Part 1 マグニチュード論の登場

ゼータ関数とメビウス関数

↑ 見出しクリックでYouTubeへ; ↓ pdfはスクロールで全文読めます

カテゴリーのオイラー標数

↑ 見出しクリックでYouTubeへ; ↓ pdfはスクロールで全文読めます

行列のマグニチュード

↑ 見出しクリックでYouTubeへ; ↓ pdfはスクロールで全文読めます

Part 2 enriched カテゴリー論とマグニチュード

enrich化されたカテゴリー

↑ 見出しクリックでYouTubeへ; ↓ pdfはスクロールで全文読めます

enrich化されたカテゴリーのマグニチュード

↑ 見出しクリックでYouTubeへ; ↓ pdfはスクロールで全文読めます

Part 3 Lawvereのenriched カテゴリー論

Lawvereの「一般化された距離空間」

↑ 見出しクリックでYouTubeへ; ↓ pdfはスクロールで全文読めます

LLMの新しい理論研究(1) 関連リンク

LLMと意味の理論モデル概説

マグニチュードとは何か

マグニチュード論の展開

Bradleyのマグニチュード論

Bradleyのco−presheaf意味論

大規模言語モデルの数学的構造 I

大規模言語モデルの数学的構造 II