講演資料
講義資料スライドの表紙です。上のスライド画像をクリックすると、同じ画面のまま全編のPDF資料を快適に閲覧・印刷することができます。
セミナーの概要
本セミナー「認識について考える 2 ── 認識の認識」は、前回のマルレク「認識について考える」の続編として位置づけられており、今回は「認識の対象そのものが認識である」という高次の構造、すなわち「認識の認識」に正面から向き合います [p.2]。
前回が自然認識とその歴史的変遷を主題としたのに対し、本講義では「認識の発展をいかに形式的・数学的に記述するか」という問いを軸に据えます [p.3]。人間の認識は静止したものではなく、時間とともに変化・発展するという直観を、厳密な数理モデルとして定式化することが本講義の核心的な挑戦です。
その探求は四つのモデルを通じて展開されます。第一は、Grzegorczykによる「科学の探究」の形式的モデルです。実験と仮説の積み重ねによって情報が累積的に豊富化されていく過程を、半順序と強制関係(Forcing Method)を用いて定式化します。このアプローチが驚くべきことに、Cohenの「連続体仮説の独立性証明」と同一の数学的構造を持つことが明らかにされます [p.20]。
第二は、KripkeのModal Logic(様相論理)における「可能的世界」のモデルです。世界から世界へと情報が蓄積されながらジャンプしていく構造として認識の発展を捉え、反射性・推移性といった関係Rの性質が論理体系の違いを生み出すことを示します [p.42]。
第三は、Bayesian推論と相対エントロピーによるモデルです。事前確率(Prior)から事後確率(Posterior)への移行として認識の発展を定量化し、この枠組みがDeep Learningのクロスエントロピーと直結することを明らかにします [p.91]。
第四は、JaynesのMAXENT(最大エントロピー原理)です。「あなたが信ずる拘束条件に従いエントロピーを最大にせよ」という原理が、熱力学からアルゴリズム論的熱力学に至る驚くべき広がりを持つことを示します [p.119]。
これら四つのモデルに通底するのは、「認識の現在の状態を出発点として、そこから得られる情報を最大化しつつ発展させる」という共通の哲学です。また、GrzegorczykとKripke双方のモデルが等しく「直観主義論理」に到達するという事実は、認識の発展の論理が古典論理とは本質的に異なることを示す、示唆に富む結論となっています。
講義のロードマップ
ここでは、セミナーの講演資料がどのようなパートから構成されているかを示します。また、それぞれのパートのポイントを紹介します。
■ Part I: Grzegorczykの「科学の探究」モデル
科学的探究とは「新たな事実のデータを継続的に豊富化すること」と定義し [p.8]、その過程を形式的に記述します。情報の集合に半順序(Partial Order)を定義し、その上に「情報が論理式を強制する(Forcing)」という概念を構築することで、実験と仮説の積み重ねを数理モデル化します。Cohenのフォーシング法と本質的に同一の構造を持つことが、このモデルの最大の発見です [p.20]。
– **論理展開**:
– **探究のツリー構造**: 探究の出発点oから、実験を経て情報αを蓄積し、可能な仮説P(α)を展開する木構造を定義します。βがαの情報を全て含む「累積性」が基本要請となります [p.15]。
– **情報の半順序**: β ≻₀ α ⟷ β = α を基底に、β ≻ₙ₊₁ α ⟷ ∃γ(γ ≻ₙ α ∧ β ∈ P(γ)) という再帰的定義で「探究R上の経路距離」を定義します [p.30]。
– **強制関係の定義**: アトミック論理式についてα ⊳ φ ⟷ φ ∈ α を基底とし、∨、∧、〜、→、量化記号への拡張を定義します。否定の解釈が直観主義論理のものとなる点が核心です [p.35, p.38]。
– **結論**: 排中律 A ∨ 〜A が成立しないことから、科学の探究の論理は直観主義論理に従うと結論されます [p.37]。
■ Part II: Kripkeの「可能的世界」モデル
Kripkeは「ある世界から可能な世界が複数存在する」という構造(G, K, R)を導入し、認識の発展を世界間のジャンプとして記述します [p.44, p.75]。関係Rの性質(反射性・推移性)を要請することで、知識の累積性や直観主義論理といった認識の特徴が自然に表現されます。GrzegorczykモデルとKripkeモデルの否定の定義が実質的に同一であることが、両モデルの深い連関を示します [p.85]。
– **論理展開**:
– **可能的世界の構造**: 世界GからH₁、H₂がR関係で可能であり、さらにH₂からH₃、H₄が可能という枝分かれ構造を定義します。推移性からGRH₃、GRH₄も成立します [p.55, p.56]。
– **情報による世界の特徴づけ**: φ(A, X) = T(世界XにAを証明する十分な情報がある)という関数を用い、例としてGがPを、H₂がP,Qを、H₄がP,Q,Rを持つモデルを示します [p.62, p.63]。
– **世界間ジャンプと情報の非対称性**: H₂とH₃は同じ情報P,Qを持つが、H₂はH₄へのジャンプによりRを獲得可能である一方、H₃にはその可能性がなく、両世界は本質的に異なります [p.73]。
– **認識特徴の表現**: 反射性HRHが「知識の累積性」を、否定の解釈φ(〜A, H) = T ⟷ ∀H'(HRH’ → φ(A, H’) = F)が「直観主義論理」を表現します [p.80, p.81]。
■ Part III: Bayesian推論と相対エントロピー
「エントロピーは絶対的なものでなく、事前知識との関係で決まる相対的なもの」というBayesian的立場から、相対エントロピーH(q||p) = Σ q(x) log (q(x)/p(x)) を定義します [p.97]。Prior pからPosterior qへの移行を「認識の発展」と捉えることで、認識が段階的に進化する過程を定量的に記述できます。Deep LearningのクロスエントロピーがこのH(q||p)の変形に他ならないという事実が、理論の実用的な威力を示します [p.113, p.114]。
– **論理展開**:
– **相対エントロピーの計算例**: コイン投げを例に、「公正なコイン」を前提とした場合の相対エントロピーはlog2 = 1bit、「常に表が出る」前提では0bitとなることを示します [p.103]。
– **認識発展の逐次モデル**: Step t=0でH(p₁||p₀)、t=1でH(p₂||p₁)…と連鎖し、H(pᵢ||pᵢ₋₁) = 0になったとき認識の発展が収束します [p.107, p.109]。
– **学習のモデル**: 「正しい」目標分布qを固定し、時間変化するp(t)を繰り返し更新してH(q||p(t)) → 0を目指す過程が「学習」です [p.111, p.112]。
– **クロスエントロピーとの関係**: H(q||p) = -H(q) – H_cross(q, p) が成立し、クロスエントロピーの最小化は「学習すべき残余情報の最小化」と等価です [p.114, p.115]。
■ Part IV: Jaynesの「最大エントロピー原理」
「あなたが信ずる拘束条件に従うエントロピーを最大にせよ」というJaynesのMAXENT原理は [p.141]、Gibbsが平均エネルギーEと確率の規格化条件だけからボルツマン分布pᵢ = (1/Z)e^{-βEᵢ}を導出した方法の認識論的解釈です [p.133]。この原理は「現在の認識状態を最も情報量の少ない(エントロピー最大の)分布で代表させよ」という要請として読み直せます [p.135]。さらに、アルゴリズム論的情報理論の観測量を拘束条件に代入すると、古典的熱力学と全く同一の数式構造が導かれるという驚くべき普遍性を示します [p.146]。
– **論理展開**:
– **Gibbsの方法**: 知っていること(平均エネルギー、確率の規格化)にエントロピー最大化条件 ∂(-S)/∂pᵢ = 0 を加えることで、不足情報を補い分配関数Z = Σ e^{-βEᵢ}を導出します [p.127, p.133]。
– **古典的熱力学への拡張**: E, V, Nを拘束条件とするGibbs Ensembleでは、pₓ = (1/Z) e^{-(1/T)(E(x)+PV(x)-μN(x))} が得られ、期待値E, V, Nはそれぞれ -∂lnZ/∂β などで表せます [p.139, p.140]。
– **アルゴリズム論的熱力学への応用**: BaezはE(x)を計算時間の対数、V(x)をプログラムの長さ、N(x)をプログラムの出力と読み替えます。すると最大エントロピー原理は全く同一の式を導き、dE = TdS – PdV + μdN が成立します [p.142, p.146]。
– **MAXENTの認識論的意義**: 認識の発展とは「現在知っている拘束条件に従い最大エントロピーの分布から出発して新情報を得ること」という、科学的探求の方法論の普遍的な定式化です [p.135]。
ページのナビゲート