AIの利用とインターフェースを考える

2023年10月10日 2023年10月27日 MaruyamaFujio

セミナー概要

マルチモーダルなAIの登場の中でAIの未来を考える

現在のAI技術の注目すべきトレンドの一つは、「マルチモーダルなAI」の登場です。

「マルチモーダルなAI」というのは、キーボードとスクリーンでテキストをやり取りすることしかできない現在のAIを、眼で見ることも、耳で聞くことも、口で話すこともできるように能力を拡張したAIのことです。

今回のセミナーでは、マルチモーダルなAIの登場という流れの中で、AIの未来を考えてみようと思います。

Be My AI !–「パーソナルなAI」を展望する

今回のセミナーで僕が示したいと思っているのは、一言でいえば、「パーソナルなAIへ」という展望です。

自分の目や耳や口をもつAIの登場といえば、AIロボットがしだいしだいに人間を押し除けてゆく、AI優位の近未来をイメージする人も、少なくないと思います。

そうではなく、様々な局面で我々人間を支援する、あくまでも人間のために役にたつAIを考えたいと思います。

そういうAIを展望する一つの鍵は、すべての人が日常的にAIをパーソナルなアシスタントとして利用し、また、AIにとって人間のアシスタントであることが、競争的優位性を持つようにAIの未来を設計することだと、僕は考えています。

　　Be My AI !

僕は、この言葉を OpenAIのドキュメントの片隅で見つけたのですが、この言葉が気に入っています。

メディアのマルチモーダル化は、世界を変えてきた

AIのマルチモーダル化の流れは、こうした展望を可能にするものでしょうか？

最初に確認したいことは、先行したメディアのマルチモーダル化は、電報、電話、ラジオ、テレビ、… といったいくつかの段階があるのですが、それらはすべてユーザーの欲求に応えたものでした。

メディアのマルチモーダル化は、ユーザーを急速に拡大し、メディアのパーソナライズ化を促進し、ビジネスとして大きな成功を収めてきました。それは、それまで存在しなかった新しい強力な産業を創出する、とても強い力を持っていたのです。

クラウドとクラウドのデバイスであるスマートフォンを中核とする現代のIT産業の基礎も、メディアの中心がインターネットへと変化する中で生まれた産業構造の変化です。

21世紀の初頭に起きたこの変化は、GAFAMの勝利の時代として、この四半世紀続いています。

メディアのマルチモーダル化とAIのマルチモーダル化

ただ、先行したメディアのマルチモーダル化の成功を、AIのマルチモーダル化がそのまま引き継げるわけではありません。

メディアのマルチモーダル化の歴史は、メディアに対する人間の感覚的な欲求を満たすための段階的な発展でした。メディアは人間の欲求の拡大の方向を知っていました。メディアは人間がメディアに望むものをよく知っていて、それに応えたのです。

残念ながら、ChatGPTの登場に対しておきた熱烈な歓迎が、AIのマルチモーダル化に起きているわけではないように思えます。

多分、それには理由があります。

我々とAIの関係を改めて明確にすることがAIの新しい発展を可能にする

一番基本的な問いは、我々人間がどのようなAIを望んでいるのかということにあります。それが、AI利用者の拡大にとっても、AIとのインターフェースを考える上でも鍵になります。

そういう問題を考える時期に、ようやく差し掛かっているのだと思います。

セミナーでは、様々なイノベーションのきっかけになりうる「パーソナルなAI」というコンセプトを、いろいろな角度から考えてみたいと思っています。

Part 1 : パーソナルなAIを展望する

マルチモーダルなAIの登場の中でAIの未来を考える

( 資料pdf 　blog : 「マルチモーダルなAIの登場の中でAIの未来を考える」)

ボイスAIはAI利用拡大のゲームチェンジャー

( 資料pdf blog : 「ボイスAIはAI利用拡大のゲームチェンジャー」
blog : 「ボイスAIはAI利用拡大のゲームチェンジャー 2」)

Part 2 : メディアのマルチモーダル化から学ぶ

世界を変えてきたメディアのマルチモーダル化

( 資料pdf blog : 「メディアのマルチモーダル化について」
blog : 「メディアのマルチモーダル化について 2」)

マルチモーダルなメディアとマルチモーダルなAI

( 資料pdf 　blog : 「メディアとAIのモデルの違い」)

Part 3 : AIのマルチモーダル化の始まり

「眼を持ったGPT-4」にできること — GPT-4V System Cardを読む

( 資料pdf 　blog : 「「眼を持ったGPT-4」にできること」)

「眼を持ったAI」の課題 — GPT-4Vの技術的達成と限界

( 資料pdf 　　blog : 「 GPT-4Vの技術的達成と限界」)

Part 4 : AIの進化と人間の役割

セミナーに向けたblog

資料種別: マルレク

テーマ: ディープ・ラーニング、人工知能、言語理論

AIの利用とインターフェースを考える

セミナー概要

マルチモーダルなAIの登場の中でAIの未来を考える

Be My AI !–「パーソナルなAI」を展望する

メディアのマルチモーダル化は、世界を変えてきた

メディアのマルチモーダル化とAIのマルチモーダル化

我々とAIの関係を改めて明確にすることがAIの新しい発展を可能にする

Part 1 : パーソナルなAIを展望する

マルチモーダルなAIの登場の中でAIの未来を考える

ボイスAIはAI利用拡大のゲームチェンジャー

Part 2 : メディアのマルチモーダル化から学ぶ

世界を変えてきたメディアのマルチモーダル化

マルチモーダルなメディアとマルチモーダルなAI

Part 3 : AIのマルチモーダル化の始まり

「眼を持ったGPT-4」にできること — GPT-4V System Cardを読む

「眼を持ったAI」の課題 — GPT-4Vの技術的達成と限界

Part 4 : AIの進化と人間の役割

「眼を持つ機械」 — 人間の感覚能力の拡大

AIの力と人間の力

AIの基礎となるもの– 人間の認識能力の構造

セミナーに向けたblog

設計/ドメイン設計(5) 【クラウドアプリケーションのためのオブジェクト指向分析設計講座第27回】

設計/原理【クラウドアプリケーションのためのオブジェクト指向分析設計講座第28回】

セミナー概要

マルチモーダルなAIの登場の中でAIの未来を考える

Be My AI !–「パーソナルなAI」を展望する

メディアのマルチモーダル化は、世界を変えてきた

メディアのマルチモーダル化とAIのマルチモーダル化

我々とAIの関係を改めて明確にすることがAIの新しい発展を可能にする

Part 1 : パーソナルなAIを展望する

マルチモーダルなAIの登場の中でAIの未来を考える

ボイスAIはAI利用拡大のゲームチェンジャー

Part 2 : メディアのマルチモーダル化から学ぶ

世界を変えてきたメディアのマルチモーダル化

マルチモーダルなメディアとマルチモーダルなAI

Part 3 : AIのマルチモーダル化の始まり

「眼を持ったGPT-4」にできること — GPT-4V System Cardを読む

「眼を持ったAI」の課題 — GPT-4Vの技術的達成と限界

Part 4 : AIの進化と人間の役割

「眼を持つ機械」 — 人間の感覚能力の拡大

AIの力と人間の力

AIの基礎となるもの– 人間の認識能力の構造

セミナーに向けたblog

設計/ドメイン設計(5) 【クラウドアプリケーションのためのオブジェクト指向分析設計講座 第27回】

設計/原理 【クラウドアプリケーションのためのオブジェクト指向分析設計講座 第28回】

設計/ドメイン設計(5) 【クラウドアプリケーションのためのオブジェクト指向分析設計講座第27回】

設計/原理【クラウドアプリケーションのためのオブジェクト指向分析設計講座第28回】