全体概要
本セミナーは、2016年9月27日に開催されたMaruLabo主催の技術講演「パーソナル・アシスタント・システムとAI」の講義資料に基づいています。中心的なテーマは、人工知能技術の社会への最初の浸透経路が「個人支援システム(パーソナル・アシスタント・システム)」として現れるという見立てのもと、その具体的な実装と技術的背景、そして将来展望を多角的に検討することです [p.4]。
自動車・PC・携帯電話といった20世紀型のコンシューマライゼーションの延長線上に、AI技術の普及を捉えるという視点は、本講演全体を貫く基本的な問題意識です [p.4]。講演者は、現在の人工知能技術がまだ揺籃期にあることを率直に認めながら、二つの代表的なプロダクト領域——「自動運転技術」と「ボイス・アシスタント・システム」——を題材に、技術の到達点と課題を具体的に描き出します [p.5]。
ディープラーニング技術は、動物の知覚・運動系をモデルとしているがゆえに、センサーを持つ機械の自律運動、とりわけ自動運転とは極めて相性が良く、2020年頃には大きな普及の転換点を迎えるだろうと見通されています [p.5]。一方のボイス・アシスタントは、自然言語理解という未解決の難題を抱えており、現在の実装の多くは音声コマンドベース・シナリオベースのBOTに留まっています [p.5]。
しかし、本講演が特に注目するのは、ボイス・アシスタントにおけるディープラーニングの入出力利用よりも、人工知能と検索技術の連携という動向です [p.6]。これは、マシンに自律的な運動能力だけでなく「知識」や「知性」を与えようとする試みであり、知識グラフ・データベースの活用を経由して、最終的には自然言語理解へと合流していく流れとして捉えられています [p.6]。
第一部でGAAF各社(Google・Apple・Amazon・Facebook)のAI戦略と代表的なボイス・アシスタントの実装を詳細に分析した後、第二部では検索・広告・グラフデータ処理の進化という視座から、知識グラフのスキーマの可能性と限界、そして自然言語のグラフ構造との本質的な乖離が論じられます。講演の結論として、世界の全情報を一元的に知る「究極のAI」という集中型ビジョンへの懐疑と、すべての個人がパーソナライズ化されたAIのアシストを受けながら、自らAIを作り出すスキルを持つという分散型・共存型の新しい人工知能観が提示されています [p.309, p.314]。
—
講義のロードマップ
ここでは、セミナーの講演資料がどのようなパートから構成されているかを示します。また、それぞれのパートのポイントを紹介します。
■ Part 0: はじめに——問題設定と全体構図
AIの社会実装の第一段階が「パーソナル・アシスタント・システム」として現れるという基本テーゼを設定し、自動運転とボイス・アシスタントという二つの具体的対象を定位します。ボイス・アシスタントにおいては、ディープラーニングよりも「AI×検索技術の連携」こそが注目すべき動向であるという、講演全体の問題意識の核心が宣言されます [p.4, p.5, p.6]。
■ Part 1: ボイス・アシスタント・システム
GAAF各社のAI戦略を概観した後、音声認識・画像認識APIの実装例を紹介し、代表的なボイス・アシスタント(MS Cortana・Amazon Alexa・IBM Watson Dialog・Facebook Bot Engine)のアーキテクチャと実装上の思想を比較検討します。「音声コマンド型」という現在の主流の限界と、次世代的アプローチの萌芽を浮かび上がらせます [p.8]。
■ Part 2: 人工知能と検索技術
現代ITの「本流」である検索・広告の技術進化を軸に、大規模グラフデータ処理の歴史的展開を整理します。Knowledge Graphのスキーマ(Schema.org)の実際と構造的限界を自然言語と対比することで、現在のグラフベースAIが到達できる「知識」の範囲と、その先に横たわる自然言語理解という本質的課題を明確化します [p.187, p.188]。