マグニチュード論の展開 −− LLMの新しい理論研究(1)

お詫び:タイトルを「マグニチュード論の展開」に変更しました。
セミナーのタイトルを、「Bradleyのマグニチュード論」から「マグニチュード論の展開」 に変更しました。すみません。
当初、今月は、Tai−Danae Bradleyの論文”The Magnitude of Categories of Texts Enriched by Language Models” https://arxiv.org/pdf/2501.06662 を素材としてで、次のような構成を考えていました。
「Bradleyのマグニチュード論」
Part 1 マグニチュード論の展開
Part 2 LLMモデルの拡大 (論文の第二セクション)
Part 3 LLMとマグニチュード論 (論文の第三セクション)
今回のセミナーは、予告した内容の Part 1 を、一つのセミナーに独立させたものになります。
次回のセミナーは、今回入り口の前で止まってしまった「Bradleyのマグニチュード論」をキチンと紹介したいと思っています。新しいURLで「Bradleyのマグニチュード論」のまとめページを作りました。(Part 1 だけで未完に終わったページをうつしただけです。)
セミナー「マグニチュード論の展開」の構成
今回のセミナーは、次のような構成をしています。
「マグニチュード論の展開」
Part 1 マグニチュード論の登場
Part 2 enriched カテゴリー論とマグニチュード
Part 3 Lawvereのenriched カテゴリー論
以下、それぞれの内容を簡単に見ていきましょう。
マグニチュード論の登場
前回のセミナーは、現代のマグニチュード論の前身ともいうべき数学的対象の「大きさ」についての理論、カントールの「無限の大きさ」や、オイラーの「変わらぬ大きさ – 不変量」の理論を見てきました。また、20世紀のシャニュエルの「オイラー特性数」の研究や、レンスターの「生物多様性」の理論も「大きさ」の理論として取り上げてきました。
ただ、それらの多様な理論は、まだ「マグニチュード」という概念に辿り着いていたわけではありません。このセミナーでは、先のセミナーを受けて、21世紀の「マグニチュード」論の登場とその発展を見ていきたいと思います。
ゼータ関数とメビウス関数
ただ、マグニチュード論の理論的起源は、それにとどまりません。マグニチュード論のテキストの中でしばしば「ゼータ関数」や「メビウス反転」という言葉が登場します。それは、古典的・数論的な「リーマンのζ関数」と「メビウスのμ関数」に起源を持っています。
さらに遡って、両者の関係はオイラーの「ゼータ関数の無限積表示」を用いると明らかになるという話をします。またしてもオイラーが出てきます。(ただ、今回紹介する計算は初等的なものです。)
マグニチュード論の、深い数学的背景を知るために、こうした繋がりについて述べてみたいと思います。
カテゴリーのオイラー特性数 −− 2006年
このセクションでは、現代のマグニチュード論の最初の論文と見なされている Leinsterの2006年の論文「カテゴリーのオイラー特性数」 “The Euler characteristic of a category” を紹介します。ただ、この論文ではマグニチュードという言葉は使われてはおらず、それは「カテゴリーのオイラー特性数」として扱われています。
前回のセミナーで見てきたシャニュエルのオイラー特性数の研究が、現代のマグニチュード論につながっていることがわかると思います。
距離空間のマグニチュード −− 2011年
このセクションでは、 先に見た2006年の論文とは異なり、「マグニチュード」を論文タイトルに掲げた、Leinsterの2011年の論文を紹介します。今回のセミナーは、この論文の第一章の構成に従っています。
“The magnitude of metric spaces”
https://arxiv.org/abs/1012.5857
この論文で最初に導入されているのが「行列のマグニチュード」です。ここで導入される行列の「重み付け」とその双対の「co重み付け」の概念は、マグニチュード論にとって基本的なものです。
それは前回のセミナーのLeinsterの「生物多様性」の定義でも出てきていたものです。
enriched カテゴリー論とマグニチュード
このセクションでは、Leinsterのマグニチュード論の展開にとっても、また、今回のセミナーの本来のターゲットであったBradleyのマグニチュード論にとっても、両者にとって重要な飛躍である「enrichedカテゴリーのマグニチュード」の紹介です。
先に見たLeinsterの2011年の論文を彼自身がblogにした “The Magnitude of an Enriched Category”に依拠しています。。
https://golem.ph.utexas.edu/category/2011/06/the_magnitude_of_an_enriched_c.html
重要なことは、マグニチュードの理解には、こうしたカテゴリー論的なアプローチが不可欠だということです。
カテゴリー論の利用では、LLMの意味理解の構造の解明にカテゴリー論のco−presheafの概念を導入したBradleyの研究は画期的なものだったと思います。その点では、Leinsterのマグニチュード論とBradleyの新しいLLM論は、理論的土台の多くを共有していると、僕は考えています。別のセミナーで紹介する予定のCoeckeらのQNLP(量子コンピュータを使った言語理解の取り組み)も同じ土台に立っています。カテゴリー論という共通の武器を得て、さまざまな分野で同時多発的に進行する研究の展開は、21世紀の科学・技術の発展の大きな特徴です。
このセクションの前半は、「enrichedカテゴリー論」の基本的な紹介に当てられています。ここでの「ダイアルのたとえ」は、とてもわかりやすいものだと思います。後半は、enrich化されたカテゴリーのマグニチュードをどのように定義できるのかという話をしています。
Lawvereのenriched カテゴリー論
このセクションでは、こうした展開を明確にビジョンとして持っていただけでなく、そうしたカテゴリー論の概念装置を数多く作り上げた数学者Lawvereの研究の一部を紹介します。
enrichedカテゴリー論とその応用について、最大の貢献者の一人は、Lawvereだと思います。前回のセミナーで紹介したシャニュエルは、Lawvereの共同研究者でした。現代のマグニチュード論は、Lawvereのビジョンにその多くを負っています。
ここでは、彼の「一般化された距離空間」の概念を紹介します。
Part 1 マグニチュード論の登場
ゼータ関数とメビウス関数
↑ 見出しクリックでYouTubeへ; ↓ pdfはスクロールで全文読めます
カテゴリーのオイラー標数
↑ 見出しクリックでYouTubeへ; ↓ pdfはスクロールで全文読めます
行列のマグニチュード
↑ 見出しクリックでYouTubeへ; ↓ pdfはスクロールで全文読めます
Part 2 enriched カテゴリー論とマグニチュード
enrich化されたカテゴリー
↑ 見出しクリックでYouTubeへ; ↓ pdfはスクロールで全文読めます
enrich化されたカテゴリーのマグニチュード
↑ 見出しクリックでYouTubeへ; ↓ pdfはスクロールで全文読めます
Part 3 Lawvereのenriched カテゴリー論
Lawvereの「一般化された距離空間」
↑ 見出しクリックでYouTubeへ; ↓ pdfはスクロールで全文読めます


