全体概要

本セミナー「機械学習技術の現在」は、チューリングが1950年代に投げかけた根本的な問い「機械は考えることができるか?」[p.2] を出発点として、2015年時点における機械学習・AI技術の全体像を俯瞰的に把握することを目的としています。

近年の機械学習・AI技術の急速な発展は、現象的にはこれらの技術に対する人々の理解を難しくしており、空想的な楽観論と技術否定に通じかねない悲観論の両極に評価が振動する危険性をはらんでいます [p.6]。本セミナーはそうした状況に対して、技術の到達点と課題の概略を正確に伝えることを使命としています。

講師の丸山不二夫氏は、現在の機械学習・AI技術を単一の技術として捉えることを避け、四つの主要な潮流(A:統計的分析に基づく数値予測・クラス分け、B:ニューラルネットワークに基づく知覚・運動系アプローチ、C:経験的知識システムと言語能力、D:数学的・論理的推論能力)に整理することで全体像を明確化しています [p.10]。

特に本セミナーが深く踏み込むのは、B領域のDeep Learning・ニューラルネットワーク技術とそのハードウェア革命、C領域のパーソナル・アシスタント・システムの実装の実態、そしてIBM Watsonに代表される本格的な質問応答システムの技術的詳細です。現在のパーソナル・アシスタント・システムの多くは、知能を持つというよりも、「Turing Test Machine」と呼ぶべき見かけ上の知性を演じるに過ぎないという辛辣な評価が示される一方 [p.126]、WatsonはSlot Grammarによる深い構文・意味解析とPRISMATICによる大規模知識フレーム生成を組み合わせることで、それを超えようとする真摯な試みとして詳細に紹介されます [p.190, p.253]。

さらにハードウェア面では、巨大サーバークラスターからGPU、FPGA、そしてIBM TrueNorthのような専用ニューロチップへと至る劇的なアーキテクチャの変化が論じられ [p.43, p.44]、ニューラルネットワークを記述する専用言語(Torch、Caffe、Net#)の登場が、ソフトウェア開発のあり方を根本から変えつつあることが示されます [p.71, p.72]。本セミナー全体を通じて強調されるのは、機械学習技術を理解するためには人間の学習・認知・言語能力そのものへの深い洞察が必要であるという、技術を超えた根本的な問いかけです。

講義のロードマップ

ここでは、セミナーの講演資料がどのようなパートから構成されているかを示します。また、それぞれのパートのポイントを紹介します。

■ Part 0: 機械学習技術・AI技術を構成する複数の流れ

現在の機械学習・AI技術は単一の技術体系ではなく、起源も方法論も異なる四つの潮流の複合体であるという認識を提示します [p.9]。この整理枠組みが、セミナー全体の見取り図として機能します。

■ Part 1: データの統計的分析をもとに、数値予測・クラス分けを行うアプローチ

本Partは前年度のマルレク「エンタープライズと機械学習」[p.17, p.18] への参照として位置づけられており、Gradient Descent、Decision Tree、Boosted Decision Tree、Support Vector Machineといった主要アルゴリズムの概要と、Azure MLを用いた具体的なユースケースが示されます [p.19, p.20]。

■ Part 2: ニューラル・ネットワークに基づく感覚・運動系へのアプローチ

本Partはセミナーの技術的核心のひとつであり、ニューラルネットワーク研究のトピック、ハードウェアアーキテクチャの急速な変化、そしてネットワーク記述言語の登場という三つの観点から、ディープラーニング技術の現状を詳述します [p.27]。

■ Part 3: パーソナル・アシスタント・システムの現在

Google Now、Siri、Microsoft Cortana、Amazon Alexaを代表例として、現在のパーソナル・アシスタント・システムの実装の実態を技術的・批判的に検討します。その多くは真の知性ではなく、音声認識とパターンマッチングに基づく「Turing Test Machine」に過ぎないという評価が核心となります [p.125, p.126]。

■ Part 4: IBM Watsonは、何をしているのか?

2007年開発開始、2011年に人間チャンピオンを破ったJeopardy!優勝システムWatsonの技術的詳細を解剖します [p.190]。自然言語処理・知識抽出・証拠評価・型付けという多段階パイプラインの全体像が、複数の原著論文に基づいて詳述される、本セミナー最大のボリュームを持つPartです。

■ Part 5: IBM TrueNorth Chip

フォン・ノイマン型アーキテクチャとは根本的に異なる、脳構造にインスパイアされた非フォン・ノイマン型専用チップ TrueNorthの設計思想とプログラミングモデルを紹介します [p.321, p.322]。現在のGPU・FPGAベースのアプローチとは異なる長期的可能性を示す萌芽的技術として位置づけられます。