講演資料
講義資料スライドの表紙です。上のスライド画像をクリックすると、同じ画面のまま全編のPDF資料を快適に閲覧・印刷することができます。
セミナーの概要
本セミナー「GPT-4との対話 ―― プロンプトで遊ぶ」は、2023年に登場した大規模言語モデル(LLM)、とりわけGPT-4が獲得した「言語能力」の本質を、実際の対話(プロンプト操作)を通じて検証・考察する試みです。著者・丸山不二夫氏は、「生成系AI」の実践的活用や社会的リスクといった当時の主要な関心軸から意図的に距離を置き、「機械はいかなる言語能力を持つに至ったのか」という純粋な認識論的問いに焦点を絞ります [p.8]。
議論の出発点は、GPT-4が「言語ネイティブな知能」として構成されているという認識です。人間のみが持つと考えられてきた「ことばを自在に操る能力」を機械が獲得したことは、人工知能技術の発展史において特筆すべき達成であり、それは人間が「言語ネイティブな知能を持つ人工知能を作ることができた」という事実を意味します [p.7]。
全体は三つのPartで構成されます。Part 1では、GPT-4が新しい文・フレーズを生成する能力の「素のかたち」として「連想」を取り上げ、その連鎖的な展開能力を実証します。Part 2では、語の意味(WordNet的な構造)から文・フレーズの意味へと議論を深め、大規模言語モデルが意味の階層構造をどの程度把握しているかを探ります。同時に、品詞・文法性・構成性(compositionality)といった概念がLLMの内部でどのように扱われているか、GPT-4自身との対話を通じて確認します。Part 3では、生成能力の本質、チューリングテスト、ことばの力、そして大規模言語モデルがもたらした翻訳能力のブレイクスルーを論じます。
著者が到達する結論は穏やかながら鮮明です。GPT-4は「意識や理解、自発性」を持たず、「単に統計的なパターンマッチングを行っているだけ」とGPT-4自身が答える一方で、その統計的パターン学習から「ある文から他の文を連想する能力が生まれた」 [p.196]という事実は重い。人間の認識能力には言語的能力に還元できない核(数学的認識能力等)があるという留保を保ちつつも、長期的には大規模言語モデルの最大の貢献は「人間にことばの壁を乗り越える現実的手段を初めて提供したこと」にあると著者は主張します [p.212]。
講義のロードマップ
ここでは、セミナーの講演資料がどのようなパートから構成されているかを示します。また、それぞれのパートのポイントを紹介します。
■ はじめに: 問題意識と方法
「プロンプトで遊ぶ」という一見軽いタイトルの背後にある問題意識を整理します。生成AIへの「過信」と「不信」という二極の評価が生まれる構造的理由をOpenAI自身の警告(「幻覚の逆説」)を引きながら解説し、本セミナーが「機械の言語能力そのものの検証」に絞ることを宣言します [p.5, p.6]。
■ Part 1: 文を生成する力
GPT-4の基本的言語能力を「連想」という概念で捉え直します。ある文・フレーズを与えると、そこから意味的に関連する新しい表現を次々と生成できるこの能力こそが、GPTの「文を生成する能力の素のかたち」であると位置づけます [p.17]。
■ Part 2: 意味と構成性
GPT-4が「語の意味」についてWordNetに匹敵する構造的情報を保持していることをプロンプトで実証します。続いて、フレーズ・文の意味がどのように構成されるかを探り、LLMが品詞・文法性・構成性(compositionality)を「内部的に理解しているわけではなく、統計的パターンから処理している」というGPT-4自身の証言を引き出します [p.118, p.123]。
■ Part 3: ことばを生成する能力と人間
「連想」「生成能力」「チューリングテスト」「ことばの力の哲学的・進化論的背景」「多言語翻訳能力」という多面的な議論を統合し、大規模言語モデルが人間にとって何を意味するかを問います。特に翻訳能力のブレイクスルーを大規模言語モデルの最大の社会的貢献として位置づけます [p.212]。
ページのナビゲート