セミナー紹介 [20160520]

全体概要

本セミナーは、2016年4月4日に開催されたクラウド研究会における丸山不二夫氏の講義「ニューラル・ネットワークと技術革新の展望 — TensorFlowとCNTK」をまとめた資料です。ディープラーニングが単なる研究テーマを超え、クラウドビジネス・モバイルアプリ・産業応用の各層に構造的変化をもたらしつつある2016年という転換点において、「なぜ今、ニューラルネットワークがITインフラの全体像を塗り替えるのか」という問いを中心に据えています。

資料が探求する最も本質的なテーマは「非対称性」です。ニューラルネットワークの「訓練」フェーズは膨大なバッチ処理を要する一方、いったん学習された「推論実行」フェーズはスマートフォン上でもリアルタイムに動作します [p.5]。この非対称性こそが、クラウドに「訓練サービス」という新市場を生み出し、モバイルには「プログラムではなく訓練済みデータで動く第三のアプリ様式」を生み出す原動力です [p.6, p.16]。

技術的な中核では、TensorFlowとCNTKという二大フレームワークを比較軸として、ニューラルネットワーク技術に共通する基礎——グラフ表現とモジュール構造、Gradient Descentによるパラメータ更新、Back PropagationとAutomatic Differentiation——が丁寧に解説されます [p.56〜p.137]。異なる記述スタイル（TensorFlowのPython手続き記述 vs. CNTKの宣言的DSL）の背後に、同一の数理グラフが存在することを示す視点は、技術の本質を見抜くための重要な洞察です [p.73, p.78]。

さらに実装面では、CNTKの1-bit Quantized SGD・ループ検出・メモリー共有といった高速化技術 [p.141〜p.156] と、TensorFlowのモデルパラレル・データパラレルによる大規模分散化 [p.162〜p.207] が詳述されます。Googleが社内で機械学習利用を急拡大させている背景には、検索・広告というコアビジネスとの強固な結合があり [p.29]、技術とビジネスが相互にドライブし合う構造が明示されています。

最後に「我々自身がデータを持つことの重要性」という問いが提起されます。MNISTやImageNetのようなオープンデータが技術イノベーションをドライブしてきた一方、各ドメイン固有の「Good Data」を質高く整備することが、真の競争優位の源泉であるという主張は、技術者だけでなく産業界全体への重要なメッセージです [p.48, p.54]。

—

講義のロードマップ

ここでは、セミナーの講演資料がどのようなパートから構成されているかを示します。また、それぞれのパートのポイントを紹介します。

—

■ Part I: ニューラル・ネットワークと技術革新の展望

訓練と推論の「非対称性」[p.5] を起点に、クラウドビジネスへの新市場創出とモバイルアプリの第三のパラダイム誕生 [p.6, p.16] を論じます。Googleの事例を通じ、技術とビジネスが相互にドライブする構造 [p.29] と、データを自ら保有することの戦略的重要性 [p.54] が示されます。

■ Part II: ニューラル・ネットワーク技術の共通の基礎

TensorFlowとCNTKという記述スタイルの異なる二つのフレームワークを比較することで、その背後にある共通の数理グラフ構造を浮き彫りにします [p.73]。DNN・CNN・RNNのモジュール構造の理解から、Gradient DescentおよびBack PropagationとAutomatic Differentiationの数理的基礎まで、フレームワーク非依存の本質的知識を体系的に提示します。

■ Part III: TensorFlowとCNTK

CNTKの高速化チューニング技術群と、TensorFlowの大規模分散化アーキテクチャを対比的に詳述します。CNTKは通信コスト・計算重複・メモリ消費の削減という実装レベルの最適化で高速性を実現 [p.141〜p.156] し、TensorFlowはモデルパラレルとデータパラレルの組み合わせにより研究生産性を規定する「実験時間の短縮」を目指します [p.160, p.177]。