セミナー「エンタープライズと機械学習技術１ ? Big Data と Deep Learning ?」紹介 [20141125]

全体概要

本セミナー「エンタープライズと機械学習技術」は、2014年という機械学習がクラウドサービスとして一般企業に開放され始めた歴史的な転換点において、「なぜ今、企業は機械学習に注目しなければならないのか」「その技術的本質はどこにあるのか」「そして実際にどう使うのか」という三つの問いを、体系的かつ実践的に探求したセミナーです。

機械学習技術の本質は、ビッグデータ処理における「組み合わせ論的・決定論的なアプローチ」に対する「統計学的・確率論的なアプローチ」にあります。MapReduceのような全件スキャン型の処理とは異なり、機械学習は過去のデータのサンプルから未来を予測するモデルを自動的に構築します。この考え方は視聴率調査のような古典的な統計的手法と本質的につながっており、それをビッグデータ規模で実現しようというのが機械学習の根本的な動機です [p.5, p.7]。

2014年という年は、Google、Microsoft、IBMという三大テクノロジー企業が相次いで機械学習をクラウドAPIとして開放した年であり、これまでデータサイエンティストと高性能コンピュータを必要としていた技術が、一般のエンジニアや企業ユーザーにとって現実的な選択肢になった転換点でした [p.21]。この背景には、モバイルとSNSの爆発的普及がもたらした「第三の情報爆発」、そして消費者行動データを活用した個人化マーケティングへの強烈な期待があります [p.49, p.58]。

技術的には、Neural NetworkにおけるGradient Descent（勾配降下法）、Decision Tree（決定木）、Support Vector Machine（SVM）という代表的な三つのアルゴリズムの数理的構造を丁寧に解説し、それぞれの直感的理解と定式化を提示します。最後に、Microsoft Azure Machine Learningを用いたドイツ信用リスク予測の実装例を通じて、モデル選択・訓練・評価・Webサービス公開という一連の開発フローを具体的に示します。本セミナーは、机上の理論にとどまらず、エンタープライズの変革という大きな文脈の中で機械学習を位置づけた、極めて実践的かつ示唆に富む講義です。

—

講義のロードマップ

ここでは、セミナーの講演資料がどのようなパートから構成されているかを示します。また、それぞれのパートのポイントを紹介します。

■ Part I: エンタープライズでの機械学習技術利用の広がり

機械学習がなぜ今エンタープライズで注目されるのかを、技術的背景とビジネス背景の両面から論じます。ビッグデータ処理の二つの流派（決定論的 vs. 統計的）を対比させ、機械学習の立ち位置を明確にします [p.5]。さらに2014年の各社クラウドMLサービスの動向を紹介し、小売業の変化と個人化マーケティングへの期待を機械学習普及の実質的な推進力として提示します [p.48, p.54]。

■ Part II: 機械学習のアルゴリズム

機械学習の主要な三つのアルゴリズム（Neural Network / Gradient Descent、Decision Tree、Support Vector Machine）の数理的構造を丁寧に解説します。単なる概念紹介にとどまらず、コスト関数の最小化という共通の最適化問題の視点から各アルゴリズムを統一的に理解する枠組みを提供します [p.78]。

■ Part III: Azure MLでの予測ソリューション開発サンプル

Microsoft Azure Machine Learningを用いた実践的な機械学習ソリューション開発の全工程を、ドイツ信用リスク予測を主軸の例として詳細に解説します。モデル選択から訓練・評価・Webサービス公開・APIアクセスまでの完全なパイプラインを実装レベルで提示し、エンタープライズでの実用化への道筋を示します [p.170, p.172]。