講演資料
講義資料スライドの表紙です。上のスライド画像をクリックすると、同じ画面のまま全編のPDF資料を快適に閲覧・印刷することができます。
セミナーの概要
本セミナーは、2022年11月のChatGPT登場からおよそ一年が経過した2023年11月時点において、「ChatGPTはどう変わろうとしているのか」という問いを中心に据えた、角川主催の技術講演です。丸山不二夫氏が講師を務め、AIの近未来を「マルチモーダル化」と「カスタム化」という二つの技術的潮流から読み解くことを主眼としています。
セミナーが特に重視するのは、単なる技術予測にとどまらない三つの視座です。第一に、大規模言語モデルの成立史を翻訳モデルの時代から丁寧に辿り直し、Transformer・BERTを経てChatGPTへ至る技術的DNA(Attentionメカニズムと文の意味の分散表現)を基礎から理解する試みです。第二に、2023年11月6日のOpenAI DevDayで発表されたマルチモーダル化(GPT-4V等)とAssistant APIによるカスタム化という二つの発展方向に焦点を当て、それがAIと人間の関係をいかに変えるかを論じます。第三に、同月17日のSam Altman CEO解任劇を契機として顕在化したOpenAI内部の路線対立安全性優先派と商業加速派の緊張を丁寧に追い、AIの進むべき方向についての講師自身の個人的展望「Be My AI!」を提示します。
技術史的には、翻訳モデル → 大規模言語モデル → ChatGPT に続く「第四のマイルストーン」として、マルチモーダルなAI Assistantアプリの登場を位置づけており、これがスマートフォンを主舞台とした「パーソナルなAI」の時代を切り拓くという楽観的展望で締め括られます。「OpenなAIか、CloseなAIか」「私のAIか、誰かのAIか」という問いが、100年後の未来に向けた最大の選択だと講師は力説します。
講義のロードマップ
ここでは、セミナーの講演資料がどのようなパートから構成されているかを示します。また、それぞれのパートのポイントを紹介します。
■ Part 1: この一年の間にAIの世界で起きたこと
ChatGPT登場(2022年11月30日)から1年間の爆発的普及と、OpenAIをめぐる技術的・組織的激動を時系列で概観します。マルチモーダル化の公式発表、DevDayでのAssistant API発表、そしてAltman解任劇という三つの出来事が「AIの近未来」を考える上での不可欠な文脈として提示されます。[p.1024]
■ Part 2: OpenAIについて(組織・理念・内部対立)
OpenAIが非営利法人として「全人類の利益になる安全なAGI」を掲げながら、営利子会社を持つ「上限利益構造」を採用している根本的矛盾と、それが今回の混乱の組織的背景であることを解説します。Helen Tonerの論文を通じて、AI安全性をめぐる「シグナリング」の政策論的意味も俯瞰されます。[p.2564]
■ Part 3: 大規模言語モデルの成立とChatGPTの成功の背景
現代の大規模言語モデルの「遺伝子」を、2014年のIlya Sutskeverの翻訳モデルから丹念に掘り起こします。Attentionメカニズムの発明、TransformerとBERTによるアーキテクチャの確立、そして「人間のフィードバックからの強化学習(RLHF)」という大転換がChatGPTの成功を生んだことを技術史として提示します。[p.66153]
■ Part 4: AIのマルチモーダル化とカスタム化
テキスト中心から「見る・聞く・話す」への転換を可能にした技術的基盤(Google Vision Transformer、OpenAI CLIP)と、その成果を誰でも使えるAI Assistantアプリとして展開するAssistant APIの詳細を解説します。これが「AI利用の第四のマイルストーン」となる根拠が提示されます。[p.155236]
■ Part 5: 近未来のAIの展望Be My AI!
講師・丸山氏の個人的展望「パーソナルなAIへ」を中心に、「ボイスAI」がゲームチェンジャーになるという確信と、AIと人間の関係の理想型AIが人間のアシスタントであることに競争的優位性を持つ社会設計が提示されます。「OpenなAIか、CloseなAIか」「私のAIか、誰かのAIか」が100年後の決定的選択であるという結論で締め括られます。[p.238259]
ページのナビゲート