セミナー「人工知能と自然言語」紹介 [20181026]

全体概要

本セミナーは「言語とは何か」という根源的な問いを、人工知能・深層学習の最前線と、言語学・数理論理学の深奥から同時に照らし合わせ、両者の驚くべき収束点を探る意欲的な講義です。

出発点は1950年のチューリングテストです [p.2]。知性の本質を問うこの問いから始まり、1972年の初期対話システム、1990年代の機械学習勃興、そして2010年代の深層学習革命へと至る歴史的文脈が丁寧に敷かれています [p.2–p.4]。

講義の技術的な核心はPart Iに置かれており、BengioのニューラルN-gram言語モデル（2003年）[p.13]、HintonのAutoencoder（2006年）[p.18–p.19]、MikolovのWord2Vec（2013年）[p.29]、SutskeverのSequence-to-Sequence（2014年）[p.35–p.36]、BahdanauのAttention Mechanism [p.44–p.45]、そしてGoogleのGNMT（2016年）[p.53–p.54]、さらにAlex GravesのDifferentiable Neural Computer（DNC）[p.104] へと至る「現代NLPの系譜」が、原論文と実装の詳細に即して解説されます。これはただの技術史ではなく、「言語モデルとは何を学習しているのか」という問いへの深化の過程として提示されます。

Part IIは実装の世界に降り立ち、GoogleのKnowledge GraphとEntity Modelを軸に、Google Now・Google AssistantからAmazon Alexa・DialogFlowに至る音声AIシステムの設計思想を解剖します [p.140–p.143]。Schema.orgに基づくEntity・Property・Actionの概念体系 [p.200–p.206]、AlexaのIntent SignatureによるSchema.orgとの接続 [p.246–p.247] など、現実の商用システムの知的骨格が明示されます。

Part IIIはセミナー最大の知的跳躍です。Chomsky（1957年）の生成文法からMinimalist Program（1995年）[p.272]、そしてLambek（1958年）のCategorical Grammar [p.273–p.274] へと論が進み、両者が「Merge」という単一の操作の下に収束する可能性が示されます。「Language = Interfaces + Recursion」[p.319] という定式がその結論を象徴し、深層学習が達成しつつある言語能力の位置づけが、Chomsky Hierarchy [p.288–p.289] を通じて理論的に問い直されます。

Part IVは算数の文章題という具体的な題材で計算と言語理解の接点を探り、分数の演算から掛け算のアルゴリズムまで、言語と数理構造の共鳴が体感的に示されます [p.363–p.390]。

全体を貫くのは「ニューラルネットワークは言語のどの層を学習できているのか、そして人間の言語能力の本質とは何か」という問いです。技術と理論の往復が、このセミナーの最大の知的価値と言えます。

—

講義のロードマップ

ここでは、セミナーの講演資料がどのようなパートから構成されているかを示します。また、それぞれのパートのポイントを紹介します。

■ Part I: 深層学習と自然言語処理の系譜

BengioによるWord Embeddingの発明（2003年）から始まり、Encoder-Decoder・Attention・GNMTを経てDNCに至る現代NLPの技術系譜を、原論文の論理に沿って丁寧に再構築します。それぞれの技術がなぜ必要とされ、何を解決したのかという「問題と解法の連鎖」として提示されることが、この部の際立った特徴です [p.10–p.11]。

■ Part II: Entity Modelと音声AIシステムの設計思想

Google Knowledge Graph・Amazon Alexa・Google Assistantという現実の音声AIが、どのような知識表現アーキテクチャの上に構築されているかを、Schema.orgのEntity階層とAlexaのIntent Signatureを軸に解明します。「文脈を理解する」とはEntityとPropertyとActionの組み合わせを推定することである、という設計哲学が核心です [p.140–p.143]。

■ Part III: Minimalist ProgramとCategorial Grammar

Chomsky（1957年〜1995年）とLambek（1958年〜2008年）という二つの言語理論の巨人が、半世紀の隔たりを超えて「Merge」という単一の演算に収束する様子を追います。そして深層学習がChomsky Hierarchyのどの層に位置するかという問いを通じ、現代AIが言語のどの構造を捉えられているかが理論的に問い直されます [p.272–p.274]。

■ Part IV: 言語と計算の接点 ─ 算数文章題を題材として

分数の加減乗除、掛け算の筆算アルゴリズム、割り算の因数分解など、小学校の算数を題材に「言語で記述された問題をどのように計算に変換するか」という言語理解の本質を体感的に探ります。抽象的な理論を身近な数理操作で接地させる役割を担っています [p.363–p.390]。