全体概要
このセミナーは「エンタープライズと機械学習技術」と題し、Azure Machine Learning(Azure ML)というクラウドプラットフォームを活用した予測ソリューション開発の実践的なサンプルを包括的に解説しています。[p.1, p.2]
現代のエンタープライズが直面する課題の一つは、人間の「総合的判断」によって蓄積されてきた業務意思決定を、いかにデータ駆動型のシステムへと昇華させるか、という点です。従来のソフトウェア開発では、アルゴリズムをプログラマーが明示的に設計・実装する必要がありましたが、機械学習のアプローチでは、人間の仕事は「学習モデルの選択」と「訓練用データの準備」に集約され、モデルの内部パターン生成そのものは機械が担います。この構造的転換こそが「Smart Machine」の本質です。[p.10]
本セミナーが選んだ具体的なユースケースは、UCI公開データセットを用いたドイツのクレジットリスク予測システムです。[p.11, p.16, p.17] このサンプルを通じて、機械学習モデルの構築に必要な一連のステップ——データのアップロード、実験の設計、モデルの訓練・テスト・評価、そしてWebサービスとしての公開——が、Azure ML Studioのビジュアルなモジュール結線(ワイアリング)によって実現できることを示します。[p.13]
機械学習アルゴリズムが行うことは大別して「数値予測」と「カテゴリー分類」の二種類であり、このサンプルでは後者——与信の可否というバイナリ分類——を扱います。[p.3] モデルは選択・訓練・テスト・評価というサイクルを反復することで精度を高めていきます。[p.4] 本サンプルでは、Support Vector Machine(SVM)とBoosted Decision Treeという二つのアルゴリズムを、重み付き・非重み付きの訓練データという二つの条件で組み合わせた計4モデルを比較し、最終的に最善のモデルをAzure上のWebサービスとしてデプロイするところまでの完全な流れを追います。[p.39, p.51]
Azure ML Studioの最大の特徴は「実験」というコンセプトにあります。複数のアルゴリズムと複数のデータセットの組み合わせを試行錯誤できる場として機能し、実験が完了すれば即座にWebサービスとしてデプロイできる点が、エンタープライズにおける迅速なソリューション展開を可能にします。[p.9]
講義のロードマップ
ここでは、セミナーの講演資料がどのようなパートから構成されているかを示します。また、それぞれのパートのポイントを紹介します。
■ Part III: Azure MLでの予測ソリューション開発サンプル
クレジットリスク予測という実務的なユースケースを題材に、Azure ML Studioを用いた機械学習パイプラインの全工程を実践的に解説します。データ準備からモデル訓練・評価、Webサービス公開・アクセスまでを一貫して示すことで、エンタープライズでの機械学習活用の具体像を提示します。[p.2, p.13]