ChatGPTとOpenAIはどう変わろうとしているのか?

はじめに
ChatGPTの登場から、約一年が過ぎようとしています。その衝撃が冷めやらぬ今また、AIの世界に大きな変化が起きようとしています。
まず、11月6日のOpenAI DevDayの発表は。ChatGPTの新しい技術的な変化の方向を示しました。
同時に、11月17日のAltmanのCEO解任とその後の混乱は、OpenAIの内部に、OpenAIが進むべき進路をめぐって対立があることを内外に示しました。
今回のセミナーは、基本的には、 こうした事態の進行に触発されたものです。
このセミナーでは、最初に、この激動の一年にAIの世界に起きたことを振り返ろうと思います。
第二に、OpenAIという組織が、どのような成り立ちの組織なのかをお話しようと思います。それは今回の「対立」の背景を知るには必要なことだと考えています。
第三に、現在の人工知能技術の二つの技術的な焦点、AIの「マルチモーダル化」と「カスタム化」についてお話します。
最後に、AIの近未来像の話を、AIの「パーソナル化」を中心についてお話しようと思います。
この一年の間にAIの世界で起きたこと
この一年、AIの世界の起きたことをふりかえってみました。
2022年11月30日 ChatGPT発表
2023年03月14日 GPT-4 リリース
2023年05月01日 ヒントン、Googleを辞める
2023年05月23日 AIのリスクへの警告。OpenAI "GPT-4 System Card" 発表
2023年09月25日 マルチモーダルAIへ。ChatGPT can now see, hear and speak !
2023年10月23日 全人類のAIという理念。Creating safe AGI that benefits for all of humanity.
2023年11月06日 AIがアプリになる。Assistant API 発表
2023年11月17日 Altman 解任
2023年11月21日 Altman 復帰
この一年は、AIの世界は激動の年でした。
講演ビデオ
講演資料のpdf viewer
OpenAI について -- 2023年11月の内紛をどう捉えるか
2023年11月17日の、OpenAI CEO Altmanの突然の解任は、多くの人を驚かせました。それはOpenAI自身の内部に、AIの進むべき道をめぐって深刻な対立があったことを浮き彫りにしました。
このセクションでは、その背景を次の四つの視点から考えます。
1. OpenAI創設の経緯
2. OpenAIの組織構造
3. 2023年11月 OpenAIに何が起きたか
4. Helen Toner 論文について
今回の激しい対立の導火線となったのは、OpenAIのボードメンバーだったHelen Tonerが発表しようとした論文の内容にAltmanが強く反発したことにあったと言われています。Altmanは、Helenをボードメンバーから放逐しようとしますが叶わず、今度は逆に Helen がIlya Sutskever を仲間に引きいれてAltman をボードメンバーから放逐して、大爆発が起きます。
Helen論文の、「三つのAI論」(軍事的AIと民主的AIと民間セクターのAI)、「AIのdual use論」(AIは軍事と民生の両方で利用されうる)、「底辺への競争論」(AIのリスクを軽視あるいは無視した開発競争)は、今回の対立の背景を理解する上で、重要な概念だと思います。
Helen論文の解説動画へのポインターを次に作成しました。ご利用ください。
- Helen Toner論文
- 「三つのAI」論 -- 軍事的AIと民主的AIと民間セクターのAI
- 軍事的AIと自律型兵器に歯止めはかかっていない
- 軍事と民事との「dual use」の危険性
- 民主的AIの理念の国際的共有の進行
- 民主主義国家と権威主義的国家のAIと国際政治の現実
- 民間セクターのAI -- 「底辺への競争」の危険
- OpenAIの活動への厳しい評価
- まとめ
11月21日のAltmanのCEO復帰をもって、OpenAIはもとの状態に戻ったと思われているかもしれませんが、それは違うと僕は考えています。
OpenAIの最高意思決定機関であるOpenAIのNPOボードは、OpenAI創立の理念である「民主的AI」の理論家 Helenと、創立以来OpenAIのAI研究を主導してきた最高のAI 科学者 Ilya を失いました。
講演ビデオ
講演資料のpdf viewer
現在の人工知能技術の技術的な焦点
AIのマルチモーダル化とカスタム化
現在の人工知能技術の技術的な焦点の一つは、「Multimodalな人工知能」 の実現にあります。ここでは、大規模言語の上に Multimodalな人工知能を実現しようとする動きを紹介しようとおもいます。
マルチモーダルな人工知能とは、現在のテキスト中心の人間と人工知能のインターフェースを大きく変える「見ることも聞くことも話すこともできる」インターフェースを備えた人工知能のことです。
ただ、AIが「聞くこと話すこと」と比べて、AIが「見ること」を実現するのは技術的には様ざまな難しさがあります。ですから、マルチモーダルなAIを目指す技術の大きな関心は、AIが「見ること」の実現にむけられていると僕は考えています。
現在の人工知能技術のもう一つの技術的な焦点は、ユーザーが開発したアプリとしてAIをカスタム化する技術です。ここでは、OpenAI DevDayで発表された、GPTの能力をユーザーが開発したアプリの上で自由に生かすことを可能にするAssistant APIの概要を見ていこうと思います。
これまで、ChatGPTの利用のスタイルは、OpenAIのサイトにログインして直接ChatGPTと向き合って対話を続けること、具体的にはキーボードとスクリーンを通じてChatGPTとテキストを交換するのが基本でした。このスタイルが大きく変わろうとしています。
ユーザは、場合によればそのアプリの背後にAIがいることを全く意識せずに、普通のスマートフォンアプリと同じように画面タッチでボタンを押したり、スワイプしたりすればいいのです。僕が一番気に入っているインターフェースは、アプリに声で話しかけ、アプリが声で答えるというものです。
講演ビデオ
講演資料のpdf viewer
近未来のAIの展望
今回の講演で僕が示したいと思っているのは、一言でいえば、「パーソナルなAIへ」という展望です。
自分の目や耳や口をもつAIの登場といえば、AIロボットがしだいしだいに人間を押し除けてゆく、AI優位の近未来をイメージする人も、少なくないと思います。
そうではなく、様々な局面で我々人間を支援する、あくまでも人間のために役にたつAIを考えたいと思います。
そういうAIを展望する一つの鍵は、すべての人が日常的にAIをパーソナルなアシスタントとして利用し、また、AIにとって人間のアシスタントであることが、競争的優位性を持つようにAIの未来を設計することだと、僕は考えています。
Be My AI !
もちろん、そのためにはAI技術は誰に対しても開かれたOpenなものでなければなりません。