全体概要
本セミナーは「ニューラル・ネットワークと技術革新の展望 + Project Araへの期待」と題し、2016年前後のAI技術の現在地を俯瞰しつつ、来たるべきAI新時代にどう備えるかという問いを中心に据えています [p.1]。
ITの世界はこの10年で劇的に変わりました。2004年のGoogle上場、2006年のAmazon EC2/S3、2007年のApple iPhone、2008年のMicrosoft AzureとGoogle Android、2012年のFacebook上場と、クラウドとモバイルが時代を牽引してきました [p.3]。しかし、次の10年を展望したとき、AI技術が新たな技術的中核として台頭しようとしています [p.4]。モバイルが携帯電話の、クラウドがデータセンターの連続的進化だったのとは異なり、ニューラル・ネットワークはほとんどの技術者にとって全く新しい技術であり、そこには技術的な「断絶」があります [p.4]。
そこで本講義が提起するのは「まず、学ぶことから始めよう」という命題です [p.2, p.6]。人工知能を作るには人間の知能が必要であり、機械学習を知るためには人間の学習が必要です。AI技術はA)統計的機械学習、B)知識・推論・対話システム、C)ニューラルネットワーク/ディープラーニング、D)言語能力の機械化、E)数学的・論理的推論の五つの流れで構成されますが [p.8]、現在の技術的中核はニューラル・ネットワークです [p.20]。その特徴として、非言語的コントロール・確率論的挙動・データ依存・学習と実行の非対称性・ハードウェア依存性が挙げられます [p.22]。
後半ではProject Araを題材に、モバイルハードウェアの「民主化」という問題意識が展開されます。DARPAのAdaptive Vehicle Make(AVM)プログラムで培われたPaul Eremenkoの「ものづくり哲学」——META(形式的モデルベース設計)、iFAB(即時適応型製造工場)、FANG(設計の民主化)——が、Project Araにどう引き継がれ、60億人のためのスマートフォン「共同創造」を目指す構想へと結実するかを描き出します [p.119, p.147, p.148]。ロボットやAIの進出を脅威としてではなく、すべての人が自らの手でそれを作り出す基本的スキルを持つことこそが最良の応答であるという結論は、本講義全体を貫くメッセージです [p.151]。
—
講義のロードマップ
ここでは、セミナーの講演資料がどのようなパートから構成されているかを示します。また、それぞれのパートのポイントを紹介します。
■ Part 1: AI新時代への問題提起と学習の必要性
クラウド・モバイルの10年が終わり、次の10年はAIが技術的中核となる時代が到来します。しかしニューラル・ネットワークは既存技術との「断絶」を持つ全く新しい領域であるため、すべての技術者がゼロから学ぶ姿勢が求められます [p.4, p.5]。
■ Part 2: AI技術を構成する五つの流れ
AI技術は単一ではなく、A)統計的機械学習、B)知識・推論・対話、C)ディープラーニング、D)言語能力、E)数学的推論という五つの流れで構成されます。現在の技術的中核はCのニューラルネットワークですが、A〜Eすべてに目を向けることで全体像が把握できます [p.8]。
■ Part 3: ニューラル・ネットワーク技術の特徴とハードウェア基盤
ニューラル・ネットワークは「非言語的・確率論的・データ依存・学習と実行の非対称性・ハードウェア依存」という五つの特性を持ちます。これらは既存のソフトウェア技術と本質的に異なる特性であり、この理解が実践的な応用の前提となります [p.22]。
■ Part 4: 生物のニューラルネットワークをモデルとして
コンボリューショナルニューラルネットワーク(CNN)のモデル的起源は生物の視覚系にあります。5億年前のカンブリア紀に誕生した「視覚」能力と、それに結びついた「運動能力」の相同物を機械上で実現しようとするのがディープラーニングの本質です [p.32, p.34]。
■ Part 5: CNNの技術的詳細とディープラーニングの成果
CNNは「様々な特徴を抽出するフィルター(コンボリューション)で前処理されたニューラルネットワーク」です。2012年のImageNet競技会でAlexNetが最良競合のエラー率をほぼ半減させたことが、ディープラーニングのブレイクスルーとなりました [p.48, p.52]。
■ Part 6: 言語理解をめぐるニューラルネットワークの挑戦
言語理解はAIの「本丸」ですが困難が多く、大量データがあれば解決できるという楽観論は成果を出せませんでした。現在は特徴ベクトル(Word Embedding)の導入により「意味」の数値表現が可能となり、RNNによる文法理解へと進化しています [p.56]。
■ Part 7: Project Araへの期待——ものづくりの民主化
現在のモバイルは「拡張性のないブラックボックスとして消費・使い捨てられる」状態にあります。Paul Eremenkoが提唱するのはDARPA時代のAVM哲学——設計ツールの高度化(META)、ビットによる適応型製造(iFAB)、設計の民主化(FANG)——をモバイルへ適用し、「60億人のためのMass-Market Co-Creation」を実現することです [p.103, p.119, p.122, p.125]。