ポスト・ディープラーニングの人工知能技術を展望する

講演資料

講義資料スライドの表紙です。上のスライド画像をクリックすると、同じ画面のまま全編のPDF資料を快適に閲覧・印刷することができます。

セミナーの概要

本セミナー「ポスト・ディープラーニングの人工知能技術を展望する」は、2012年以降に爆発的な発展を遂げたディープ・ラーニング技術の成果を正当に評価しつつも、「人工知能≠ディープ・ラーニング」[p.10] という根本的な問い直しを中心に据えた講義です。
ディープ・ラーニングが切り拓いた領域は、脳を持つ動物と人間に共通する「感覚＝運動能力」の機械による代替であり、その貢献は極めて大きいものです。しかし、人間固有の認知能力である「言語的認識能力」と「数学的認識能力」の二つは、コネクショニズムの還元主義では本質的に捉えきれない領域として残されています [p.11, p.12]。本セミナーはその「前史」としての現在地を冷静に見定め、次の時代の人工知能技術の潮流を探ろうとするものです。
議論の出発点として、Google I/O 2018でのAIロボットによる電話予約デモ [p.24〜p.36] と、Amazon Alexaのマルチターン対話技術 [p.42〜p.50] が取り上げられます。これらの事例が示すのは、ディープ・ラーニングが担う「耳と口」の能力の上に、会話の文脈・状態遷移を管理する「新たな知的レイヤー」が形成されつつあるという事実です [p.41, p.54]。
歴史的な回顧においては、人工知能の三つの流れ（計算主義・コネクショニズム・知識検索主義）の消長 [p.74] と、生命進化から言語能力の獲得に至る人間の知能の発展史 [p.110〜p.153] が丁寧に描かれます。機械は産業革命以来、人間の運動能力・感覚能力の「外的拡大器官」として機能してきました [p.125]。人工知能技術もその延長線上にあり、今後は言語能力と数学的認識能力という、より高次の人間固有の認知領域へと挑戦の舞台が移っていくと展望されます。
その具体的な道筋として、Chomskyのミニマリスト・プログラムによる言語の計算モデル [p.168〜p.178] と、Voevodsky のHomotopy Type Theoryに代表される数学の形式的証明支援システム [p.210] が紹介されます。ディープ・ラーニングとは全く異なる理論的基盤に立つこれらのアプローチが、ポスト・ディープラーニング時代の人工知能技術の核心となりうると、本講義は主張しています。「我々は、我々自身の前史を、とおり抜けねばならない」[p.5] という冒頭のエピグラムが、講義全体の精神を端的に表しています。

講義のロードマップ

ここでは、セミナーの講演資料がどのようなパートから構成されているかを示します。また、それぞれのパートのポイントを紹介します。

■ Part I: AI技術の現在 ── 2018 Google I/O, f8 から

最新のAI技術デモを素材に、「ディープ・ラーニングだけでは知能は完成しない」という命題を実証的に示します。音声対話システムや自動運転車において、ディープ・ラーニングが担う知覚・運動層の「上位」に、ルールと状態遷移に基づく知的制御レイヤーが不可欠であることを明らかにします [p.37, p.41, p.53]。また、AIを巡る社会的問題（Cambridge Analyticaによる選挙干渉疑惑、データプライバシー論争）も俎上に載せ、技術の社会的文脈を問います [p.56〜p.67]。

■ Part II: 歴史を振り返る ── 人工知能 / 人間の知能 / 機械と人間

人工知能の技術史を「計算主義」「コネクショニズム」「知識・検索主義」の三潮流 [p.74] として整理し直すとともに、生命進化・人類の言語能力獲得・産業機械の発展という三つの歴史的スケールを重ね合わせることで、現在のディープ・ラーニングの達成が「感覚＝運動能力の代替」という段階に位置することを確認します。これにより、次の課題が言語・数学的認識能力にあることを歴史的必然として導きます。

■ Part III: 困難な二つの課題 ── 言語能力と数学的認識能力

ディープ・ラーニングが本質的に苦手とする「言語的認識能力」と「数学的認識能力」に対して、言語学（Chomskyのミニマリスト・プログラム）と数学基礎論（Voevodsky のHomotopy Type Theory / Coqによる証明支援）という、全く異なる理論陣営からのアプローチを詳述します。これらはPost Deep Learningの中核的技術候補として位置づけられます [p.156]。
– **論理展開（言語能力）:**
– Chomskyの核心的観察：言語能力の創造性（有限語彙から無限の文を生成する帰納的文法） [p.161〜p.162] と、普遍文法・言語獲得装置の生得性 [p.163〜p.164]。
– Minimalist Programは「完成した理論」ではなく「探求のプログラム」であり、Merge（二つのものを一つにする）という核心操作が、言語・認識・数学を橋渡しする概念として重要である [p.165, p.178]。
– 言語モデルの構造：SM（感覚運動）インターフェース → Phonetic Form、CI（概念思考）インターフェース → Logical Formという二重出力構造 [p.170, p.175〜p.177]。
– Alexa/GoogleのIntent・Slot設計はMinimalist Programの語彙項目・文法パラメータと対応関係を持つ（萌芽的） [p.179]。
– **論理展開（数学的認識能力）:**
– 人間による証明の三つの困難：誤った証明（ワイルズの最初の発表 [p.187]）、検証困難な証明（Perelman [p.188]）、膨大すぎる証明（有限単純群分類、1万ページ超 [p.189]）。
– コンピュータによる解決の歴史：「四色問題」のAppel-Haken（1974年、計算1200時間） [p.193]、GonthierによるCoqでの再証明（2004年） [p.194]、Feit-Thompsonの定理のCoq証明（6年・17万行） [p.194]。
– Curry-Howard対応：「命題は型に、証明は項に対応する（PAT: Proposition as Type / Proof as Term）」という論理と型理論の深い対応関係 [p.201〜p.202]。
– Coqは関数型言語かつ証明支援システムであり、「コンピュータの証明を人間が支援する」という逆転の視点が重要 [p.203]。
– Voevodsky のUnivalent Theory / HoTT：Martin-Löfの依存型理論の「再発見」から始まる21世紀の数学・CS双方への影響 [p.210]。
– Combinatory Categorial Grammars（CCG）：Dependent Type Theoryを用いてSyntaxとSemanticsを同時処理し、Chomskyの言語理論とも接点を持つルールベース翻訳の現代版 [p.205〜p.209]。

ページのナビゲート

元のMaruLaboサイトのセミナーページに移動する

MaruLabo コンシェルジェのトップページに戻る